Posts Tagged "vobsub"

Convertir des sous-titres VobSub en SRT sur GNU/Linux

Quand elle est reve­nue de sa der­nière croi­sière, ma grand-mère avait dans ses bagages un DVD conte­nant plu­sieurs petits films de ses vacances, une séquence par étape, le tout sous-titré en anglais. Bien que n'habitant pas le Can­tal, Mamie ne savait pas trop que faire de ce DVD, d'autant qu'elle ne lit pas la langue de la per­fide Albion et n'a aucu­ne­ment l'intention de s'y mettre, à son âge aussi res­pec­table qu'avancé.

Elle a donc fait appel à moi pour arri­ver à faire quelque chose de ce DVD, par­ti­cu­liè­re­ment pour les sous-titres, qu'elle aime­rait avoir en français.

Il existe de nom­breuses méthodes pour extraire des sous-titres Vob­Sub d'une vidéo, tant sur GNU/Linux que sur Win­dows. Par contre GNU/Linux ne pro­pose rien de pro­bant pour conver­tir le for­mat Vob­Sub en quelque chose de faci­le­ment édi­table comme le SRT. Alors bien sûr, on peut le faire à la main avec Avi­de­mux par exemple ou même SubRip via Wine, mais c'est assez long et sur­tout, dans le cas pré­sent, le DVD contient pas moins de 24 séquences dis­tinctes comp­tant cha­cune entre 300 et 400 lignes de sous-titres. L'automatisation de la tâche s'impose…

Heu­reu­se­ment pour moi, ruediger.s du forum Doom9.org a déve­loppé un script qui per­met de faire ce que je veux : j'ai nommé VobSub2Srt. Pro­cé­dure d'installation :

La pro­cé­dure ci-dessous est pré­vue pour être réa­li­sée sous Ubuntu. Elle devrait fonc­tion­ner (avec plus ou moins d'adaptations) sur tout sys­tème GNU/Linux et même sur MacOS mais ce n'est pas garanti et comme d'habitude, soyez vigilants.

On récu­père les sources ici : https://github.com/ruediger/VobSub2SRT/zipball/master

On décom­presse :

$ unzip ruediger-VobSub2SRT-*.zip

On ins­talle le néces­saire pour com­pi­ler :
— Ubuntu 11.10 Oneiric :

$ sudo apt-get install libavutil-dev tesseract-ocr-dev tesseract-ocr-eng build-essential cmake checkinstall

— Ubuntu 12.04 Precise :

$ sudo apt-get install libavutil-dev libtesseract-dev libtiff4-dev tesseract-ocr-eng build-essential cmake checkinstall

Notez ici l'installation de Tes­se­ract : c'est lui qui, par OCR, va faire le gros du bou­lot. Ici, j'installe le néces­saire pour faire de l'OCR sur la langue anglaise ; il est bien évident qu'il faut ins­tal­ler les paquets tes­se­ract cor­res­pon­dants aux langues que vous vou­drez extraire…

NB:

Main­te­nant, on va com­pi­ler le tout :

$ cd ruediger-VobSub2SRT-*
$ ./configure
$ make
$ checkinstall -D --nodoc --maintainer=votre@email.tld --pkgname=vobsub2srt --pkglicense=GPL3+ --pkgarch=`dpkg --print-architecture` --pkgsource=https://github.com/ruediger/VobSub2SRT --provides=VobSub2Srt --requires="tesseract-ocr-eng" --backup=no --deldoc --default
$ sudo dpkg -i vobsub2srt_*.deb
$ sudo ln -s /usr/local/bin/vobsub2srt /usr/bin/

Le che­ckins­tall retourne une erreur à la fin, c'est nor­mal puisqu'on ne l'a pas lancé avec les droits Super­U­ti­li­sa­teur donc il crée cor­rec­te­ment le paquet mais ne peut l'installer.

Main­te­nant, il ne reste plus qu'à l'utiliser, pos­tu­lons que j'ai sous_titres.sub (et sous_sitres.idx bien sûr) :

$ vobsub2srt sous_titres

et on obtient en quelques secondes un fichier sous_titres.srt qu'il reste à cor­ri­ger. Ben oui, c'est génial l'OCR mais loin d'être infaillible, sur­tout quand c'est auto­ma­tique. Cepen­dant, j'ai obtenu d'aussi bons résul­tats qu'en le fai­sant à la main avec Avi­de­mux, et beau­coup plus rapidement !

Il existe deux options pour vobsub2srt :

–ver­bose : active le mode verbeux

–lang code_langue : règle l'OCR sur la langue don­née, par exemple vobsub2srt –lang fr sous_titres si vos sous-titres Vob­Sub sont en fran­çais (je rap­pelle ici qu'il faut avoir ins­tallé les paquets tes­se­ract correspondants)

Voilà ! Conver­tis­sez bien, et comme tou­jours je vous four­nis un paquet pré­com­pilé pour archi­tec­ture x64 dis­po­nible dans l'espace de télé­char­ge­ment, sec­tion Appli­ca­tions → Ubuntu.

— Paquet pour Ubuntu 11.10 Onei­ric :
Fichier : vobsub2srt_23dcb63-1_amd64.deb
Signa­ture : vobsub2srt_23dcb63-1_amd64.deb.asc
SHA1 : f0c74851a26b82d1729ad56b5cc5a83b772f93ae
MD5 : 878cb25143f637bf7a9a3bc290d2d688
CRC32 : 1f719842
— Paquet pour Ubuntu 12.04 Pre­cise :
Fichier : vobsub2srt_2d8d1b0-1_amd64.deb
Signa­ture : vobsub2srt_2d8d1b0-1_amd64.deb.asc
Check­sums : vobsub2srt_2d8d1b0-1_amd64.deb.checksum
SHA1 : 4b961ce581b9771ab47a9c2e094bb7c5d788aa6c
MD5 : 45040f77b349eb86511415a2b75dbdc4
CRC32 : 1c5848b1

Read More