23Jan

Convertir des sous-titres VobSub en SRT sur GNU/Linux

Par , 23 janvier 2012 | GNU/Linux, Informatique, Multimédia | 2 Commentaires

Quand elle est reve­nue de sa der­nière croi­sière, ma grand-mère avait dans ses bagages un DVD conte­nant plu­sieurs petits films de ses vacances, une séquence par étape, le tout sous-titré en anglais. Bien que n'habitant pas le Can­tal, Mamie ne savait pas trop que faire de ce DVD, d'autant qu'elle ne lit pas la langue de la per­fide Albion et n'a aucu­ne­ment l'intention de s'y mettre, à son âge aus­si res­pec­table qu'avancé.

Elle a donc fait appel à moi pour arri­ver à faire quelque chose de ce DVD, par­ti­cu­liè­re­ment pour les sous-titres, qu'elle aime­rait avoir en français.
Il existe de nom­breuses méthodes pour extraire des sous-titres Vob­Sub d'une vidéo, tant sur GNU/Linux que sur Win­dows. Par contre GNU/Linux ne pro­pose rien de pro­bant pour conver­tir le for­mat Vob­Sub en quelque chose de faci­le­ment édi­table comme le SRT. Alors bien sûr, on peut le faire à la main avec Avi­de­mux par exemple ou même SubRip via Wine, mais c'est assez long et sur­tout, dans le cas pré­sent, le DVD contient pas moins de 24 séquences dis­tinctes comp­tant cha­cune entre 300 et 400 lignes de sous-titres. L'automatisation de la tâche s'impose…

Heu­reu­se­ment pour moi, ruediger.s du forum Doom9.org a déve­lop­pé un script qui per­met de faire ce que je veux : j'ai nom­mé VobSub2Srt. Pro­cé­dure d'installation :

La pro­cé­dure ci-des­sous est pré­vue pour être réa­li­sée sous Ubun­tu. Elle devrait fonc­tion­ner (avec plus ou moins d'adaptations) sur tout sys­tème GNU/Linux et même sur MacOS mais ce n'est pas garan­ti et comme d'habitude, soyez vigilants.

On récu­père les sources ici : https://github.com/ruediger/VobSub2SRT/zipball/master

On ins­talle le néces­saire pour compiler :
— Ubun­tu 11.10 Oneiric :

$ sudo apt-get install libavutil-dev tesseract-ocr-dev tesseract-ocr-eng build-essential cmake checkinstall

— Ubun­tu 12.04 Pre­cise et ver­sions suivantes :

$ sudo apt-get install libavutil-dev libtesseract-dev libtiff4-dev tesseract-ocr-eng build-essential cmake checkinstall

Notez ici l'installation de Tes­se­ract : c'est lui qui, par OCR, va faire le gros du bou­lot. Ici, j'installe le néces­saire pour faire de l'OCR sur la langue anglaise ; il est bien évident qu'il faut ins­tal­ler les paquets tes­se­ract cor­res­pon­dant aux langues que vous vou­drez extraire…

Main­te­nant, on va com­pi­ler le tout et ins­tal­ler dans le même mou­ve­ment à l'aide de che­ckins­tall :

$ unzip ruediger-VobSub2SRT-*.zip && cd ruediger-VobSub2SRT-*
$ ./configure --prefix=/usr
$ make
$ sudo checkinstall -D --nodoc --maintainer=your@email.tld --pkgname=vobsub2srt --pkgversion=0:`cat debian/changelog | head -1 | cut -d"(" -f2 | cut -d")" -f1`-`lsb_release -a | grep Codename | cut -d":" -f2 | sed 's/^[ \t]//'` --pkglicense=GPL3+ --pkgarch=`dpkg --print-architecture` --pkgsource=https://github.com/ruediger/VobSub2SRT --provides=VobSub2Srt --requires="tesseract-ocr-eng" --backup=no --deldoc --default

Enfin, il ne reste plus qu'à l'utiliser, pos­tu­lons que j'ai sous_titres.sub (et sous_titres.idx bien sûr). Je me place dans le réper­toire conte­nant ces deux fichiers, puis :

$ vobsub2srt sous_titres

et l'on obtient en quelques secondes un fichier sous_titres.srt qu'il reste à cor­ri­ger. Ben oui, c'est génial l'OCR mais loin d'être infaillible, sur­tout quand c'est auto­ma­tique. Cepen­dant, j'ai obte­nu d'aussi bons résul­tats qu'en le fai­sant à la main avec Avi­de­mux, et beau­coup plus rapidement !

Il existe deux options pour vobsub2srt :

--verbose
--lang code_langue

Le pre­mier active le mode ver­beux et le second per­met de régler l'OCR sur la langue donnée.

Voi­là ! Conver­tis­sez bien et comme tou­jours, je vous four­nis un paquet pré­com­pi­lé pour archi­tec­ture x64 dis­po­nible dans l'espace de télé­char­ge­ment, sec­tion Appli­ca­tions → Ubuntu.

— Paquet pour Ubun­tu 11.10 Oneiric :
Fichier : vobsub2srt_23dcb63-1_amd64.deb
Signa­ture : vobsub2srt_23dcb63-1_amd64.deb.asc
SHA1 : f0c74851a26b82d1729ad56b5cc5a83b772f93ae
MD5 : 878cb25143f637bf7a9a3bc290d2d688
CRC32 : 1f719842
— Paquet pour Ubun­tu 12.04 Precise :
Fichier : vobsub2srt_2d8d1b0-1_amd64.deb
Signa­ture : vobsub2srt_2d8d1b0-1_amd64.deb.asc
Check­sums : vobsub2srt_2d8d1b0-1_amd64.deb.checksum
— Paquet pour Ubun­tu 13.10 Saucy :
Fichier : vobsub2srt_0.0ubuntu1~1.gbpdb8f2d-saucy-1_amd64.deb
Signa­ture : vobsub2srt_0.0ubuntu1~1.gbpdb8f2d-saucy-1_amd64.deb.asc
Check­sums : vobsub2srt_0.0ubuntu1~1.gbpdb8f2d-saucy-1_amd64.deb.checksum

Back to top

Pas peur d'Hadopi

Ce site Web est accessible en




ipv6 ready