Posts Tagged "ubuntu"

Convertir des sous-titres VobSub en SRT sur GNU/Linux

Quand elle est reve­nue de sa der­nière croi­sière, ma grand-mère avait dans ses bagages un DVD conte­nant plu­sieurs petits films de ses vacances, une séquence par étape, le tout sous-titré en anglais. Bien que n'habitant pas le Can­tal, Mamie ne savait pas trop que faire de ce DVD, d'autant qu'elle ne lit pas la langue de la per­fide Albion et n'a aucu­ne­ment l'intention de s'y mettre, à son âge aussi res­pec­table qu'avancé.

Elle a donc fait appel à moi pour arri­ver à faire quelque chose de ce DVD, par­ti­cu­liè­re­ment pour les sous-titres, qu'elle aime­rait avoir en français.

Il existe de nom­breuses méthodes pour extraire des sous-titres Vob­Sub d'une vidéo, tant sur GNU/Linux que sur Win­dows. Par contre GNU/Linux ne pro­pose rien de pro­bant pour conver­tir le for­mat Vob­Sub en quelque chose de faci­le­ment édi­table comme le SRT. Alors bien sûr, on peut le faire à la main avec Avi­de­mux par exemple ou même SubRip via Wine, mais c'est assez long et sur­tout, dans le cas pré­sent, le DVD contient pas moins de 24 séquences dis­tinctes comp­tant cha­cune entre 300 et 400 lignes de sous-titres. L'automatisation de la tâche s'impose…

Heu­reu­se­ment pour moi, ruediger.s du forum Doom9.org a déve­loppé un script qui per­met de faire ce que je veux : j'ai nommé VobSub2Srt. Pro­cé­dure d'installation :

La pro­cé­dure ci-dessous est pré­vue pour être réa­li­sée sous Ubuntu. Elle devrait fonc­tion­ner (avec plus ou moins d'adaptations) sur tout sys­tème GNU/Linux et même sur MacOS mais ce n'est pas garanti et comme d'habitude, soyez vigilants.

On récu­père les sources ici : https://github.com/ruediger/VobSub2SRT/zipball/master

On décom­presse :

$ unzip ruediger-VobSub2SRT-*.zip

On ins­talle le néces­saire pour com­pi­ler :
— Ubuntu 11.10 Oneiric :

$ sudo apt-get install libavutil-dev tesseract-ocr-dev tesseract-ocr-eng build-essential cmake checkinstall

— Ubuntu 12.04 Precise :

$ sudo apt-get install libavutil-dev libtesseract-dev libtiff4-dev tesseract-ocr-eng build-essential cmake checkinstall

Notez ici l'installation de Tes­se­ract : c'est lui qui, par OCR, va faire le gros du bou­lot. Ici, j'installe le néces­saire pour faire de l'OCR sur la langue anglaise ; il est bien évident qu'il faut ins­tal­ler les paquets tes­se­ract cor­res­pon­dants aux langues que vous vou­drez extraire…

NB:

Main­te­nant, on va com­pi­ler le tout :

$ cd ruediger-VobSub2SRT-*
$ ./configure
$ make
$ checkinstall -D --nodoc --maintainer=votre@email.tld --pkgname=vobsub2srt --pkglicense=GPL3+ --pkgarch=`dpkg --print-architecture` --pkgsource=https://github.com/ruediger/VobSub2SRT --provides=VobSub2Srt --requires="tesseract-ocr-eng" --backup=no --deldoc --default
$ sudo dpkg -i vobsub2srt_*.deb
$ sudo ln -s /usr/local/bin/vobsub2srt /usr/bin/

Le che­ckins­tall retourne une erreur à la fin, c'est nor­mal puisqu'on ne l'a pas lancé avec les droits Super­U­ti­li­sa­teur donc il crée cor­rec­te­ment le paquet mais ne peut l'installer.

Main­te­nant, il ne reste plus qu'à l'utiliser, pos­tu­lons que j'ai sous_titres.sub (et sous_sitres.idx bien sûr) :

$ vobsub2srt sous_titres

et on obtient en quelques secondes un fichier sous_titres.srt qu'il reste à cor­ri­ger. Ben oui, c'est génial l'OCR mais loin d'être infaillible, sur­tout quand c'est auto­ma­tique. Cepen­dant, j'ai obtenu d'aussi bons résul­tats qu'en le fai­sant à la main avec Avi­de­mux, et beau­coup plus rapidement !

Il existe deux options pour vobsub2srt :

–ver­bose : active le mode verbeux

–lang code_langue : règle l'OCR sur la langue don­née, par exemple vobsub2srt –lang fr sous_titres si vos sous-titres Vob­Sub sont en fran­çais (je rap­pelle ici qu'il faut avoir ins­tallé les paquets tes­se­ract correspondants)

Voilà ! Conver­tis­sez bien, et comme tou­jours je vous four­nis un paquet pré­com­pilé pour archi­tec­ture x64 dis­po­nible dans l'espace de télé­char­ge­ment, sec­tion Appli­ca­tions → Ubuntu.

— Paquet pour Ubuntu 11.10 Onei­ric :
Fichier : vobsub2srt_23dcb63-1_amd64.deb
Signa­ture : vobsub2srt_23dcb63-1_amd64.deb.asc
SHA1 : f0c74851a26b82d1729ad56b5cc5a83b772f93ae
MD5 : 878cb25143f637bf7a9a3bc290d2d688
CRC32 : 1f719842
— Paquet pour Ubuntu 12.04 Pre­cise :
Fichier : vobsub2srt_2d8d1b0-1_amd64.deb
Signa­ture : vobsub2srt_2d8d1b0-1_amd64.deb.asc
Check­sums : vobsub2srt_2d8d1b0-1_amd64.deb.checksum
SHA1 : 4b961ce581b9771ab47a9c2e094bb7c5d788aa6c
MD5 : 45040f77b349eb86511415a2b75dbdc4
CRC32 : 1c5848b1

Read More

Récupérer les clefs GPG des dépôts sur Ubuntu quand on est derrière un pare-feu

Voici le tableau : vous êtes dans votre chambre de cité U, ou peut-être au bureau, et vous tom­bez sur un joli PPA que vous dési­rez ajou­ter illico aux sources de votre Ubuntu. Pas de pro­blème, vous dites-vous in petto : on ouvre un ter­mi­nal et

$ sudo add-apt-repository ppa:freetuxtv/freetuxtv

Et là, PAF ! Ça ne marche pas, la connexion au ser­veur de clefs timeout lamen­ta­ble­ment. En cause, le pare-feu de votre uni­ver­sité ou entre­prise qui, fai­sant son bou­lot, bloque sys­té­ma­ti­que­ment les connexions ini­tiées vers des ports incon­nus comme le port 11371, géné­ra­le­ment uti­lisé par les ser­veurs de clefs.

Heu­reu­se­ment, Anthony, un étu­diant de Durham, a trouvé une petite astuce qui va nous per­mettre de faire pas­ser les requêtes de clefs GPG par le port 80 qui, contrai­re­ment au 11371, a très peu de chances d'être blo­qué par le pare-feu der­rière lequel vous vous connec­tez. Il a remar­qué que la com­mande add-apt-repository est écrite en python, ce qui la rend très faci­le­ment édi­table. En sui­vant la struc­ture des impor­ta­tions, il a trouvé le fichier res­pon­sable de la récu­pé­ra­tion des clefs GPG des dépôts. Voici donc la marche à suivre :

Vous allez modi­fier un fichier de votre sys­tème, je vous conseille for­te­ment d'en faire une sau­ve­garde préalable.

– Édi­tez le fichier ppa.py qui se trouve dans le réper­toire /usr/lib/python2.6/dist-packages/softwareproperties/ en fai­sant par exemple Alt+F2 puis en entrant

gksudo gedit /usr/lib/python2.6/dist-packages/softwareproperties/ppa.py

sans oublier de vali­der, et de taper votre mot de passe à l'invite.

Lancer gedit en root pour éditer ppa.py

– Ceci fait, trou­vez dans le fichier la ligne n°88 et chan­gez « keyserver.ubuntu.com » en « hkp://keyserver.ubuntu.com:80 ». Cela donne

res = subprocess.call(
  ["apt-key", "adv", "--keyserver", "keyserver.ubuntu.com",
    "--recv", signing_key_fingerprint[0]])

qui devient

res = subprocess.call(
  ["apt-key", "adv", "--keyserver", "hkp://keyserver.ubuntu.com:80",
    "--recv", signing_key_fingerprint[0]])

Enre­gis­trez, et voilà ! La com­mande add-apt-repository uti­li­sera désor­mais le port 80 pour récu­pé­rer les clefs des dépôts, et vous pour­rez ajou­ter de nou­veaux PPA en toute sérénité.

Read More

Rechercher et installer des PPAs depuis le Terminal

Un truc que je trouve génial avec Ubuntu, c'est l'existence des PPAs. Mais un PPA, c'est quoi ? Sous cet acro­nyme anglais signi­fiant Per­so­nal Package Archive se cache la pos­si­bi­lité d'upload des paquets sources pour Ubuntu afin qu'ils puissent être construits et publiés sous forme de dépôts Apt.

David Ain­ley a écrit un petit pro­gramme qui per­met de cher­cher et d'installer les PPAs cor­res­pon­dants sim­ple­ment à par­tir du Ter­mi­nal. Avant toute chose, je tiens à rap­pe­ler qu'il est très for­te­ment conseillé de savoir pré­ci­sé­ment ce que l'on fait avant d'ajouter des sources logi­cielles à son sys­tème, et qu'il est indis­pen­sable d'être abso­lu­ment cer­tain de pou­voir faire confiance au main­te­neur du PPA que l'on veut ajou­ter.

Ceci dit, place aux détails :

PPA­Search n'est uti­li­sable que via le Ter­mi­nal, ce qui rebu­tera les aller­giques à la ligne de com­mande. Mais en atten­dant que cette fonc­tion­na­lité soit ajou­tée à la Logi­thèque Ubuntu, on s'en passe ou on s'en contente. Pour moi, ce sera la deuxième option.

L'utilisation est on ne peut plus simple : on lance ppa­search, ce der­nier nous demande quelle est l'application pour laquelle nous recher­chons un PPA puis nous pré­sente la liste des éven­tuels résul­tats et enfin, ins­talle le PPA choisi.

PPASearch demo

PPA­Search demo

Pour l'installer, c'est comme ceci :

sudo add-apt-repository ppa:wrinkliez/ppasearch

sudo apt-get update && sudo apt-get ins­tall ppasearch

[Source]

Read More

Pourquoi les contrôles de fenêtres sont passés à gauche sur Ubuntu

On en a beau­coup parlé avant (et depuis) la sor­tie d'Ubuntu 10.04 Lucid Lynx : le chan­ge­ment de côté des contrôles de fenêtre a fait des adeptes et des mécon­tents. Cer­tains de déni­grer la « MacOS-isation » d'Ubuntu, d'autres de saluer une évo­lu­tion réflé­chie, d'autres encore pour s'en fiche complètement.

Mark Shut­tle­worth a fina­le­ment expli­qué cette déci­sion : l'espace libéré à droite ser­vira à pla­cer des Win­di­ca­tors ou indi­ca­teurs de fenêtre, de petites icônes ser­vant à affi­cher des infor­ma­tions d'état et à affi­cher un menu une fois cli­quées. Pas très éloi­gné des icônes de la zone de noti­fi­ca­tion, en somme.

Le grand ponte de Cano­ni­cal l'explique lui-même :

Les win­di­ca­tors sont des indi­ca­teurs affi­chés dans la barre de titre de la fenêtre et qui se com­portent de la même manière que les indi­ca­teurs du tableau de bord : ce sont des icônes mon­trant l'état, et cli­quer sur l'icône affiche un menu. Les appli­ca­tions peuvent créer, mettre à jour ou enle­ver les indi­ca­teurs de fenêtre à l'aide d'une API plus ou moins comme le fra­me­work AppIn­di­ca­tor intro­duit dans la 10.04 LTS.

Les win­di­ca­tors ?sui­vront le même style que les indi­ca­teurs Aya­tana (vous savez, Aya­tana, le nou­veau sys­tème de noti­fi­ca­tion de Gnome) :

  • Mono­chromes par défaut, avec une forme indi­quant la fonc­tion de l'indicateur
  • Colo­ra­tion séman­tique : rouge pour les pro­blèmes cri­tiques, orange pour les alertes, vert quand tout va bien et bleu pour les infor­ma­tions qui ne rentrent pas dans le cadre des 3 cou­leurs précédentes

D'après Mark Shut­tle­worth, ces win­di­ca­teurs seraient ins­pi­rés de Chro­meOS, et voici une maquette de ce à quoi ils pour­raient ressembler :

Maquette des Windicators

Maquette de ce à quoi pour­raient res­sem­bler les windicateurs

Read More

Ubuntu 10.10 pourrait adopter le système de fichier BtrFS par défaut

À l'issue du Ubuntu Deve­lo­per Sum­mit, Scott James Rem­nant (l'un des déve­lop­peurs Ubuntu de chez Cano­ni­cal) a annoncé hier la volonté d'intégration par Ubuntu du sys­tème de fichier Btrfs en tant qu'option d'installation voire de sys­tème de fichier par défaut.

Si l'intégration de ce sys­tème de fichier en option paraît cer­taine, sa mise en place par défaut reste sou­mise à plu­sieurs contraintes :

  • BtrFS doit être stable pour la mou­ture 2.6.35 du ker­nel, ceci étant la ver­sion atten­due pour Mave­rick Meerkat
  • BtrFS n'est pas sup­porté par GRUB 2, cela doit être réglé avant le gel des fonc­tion­na­li­tés prévu le 12 août
  • l'équipe de BtrFS doit aimer l'idée
  • Cano­ni­cal doit aimer l'idée

Mais BtrFS, c'est quoi en fait ?

Pro­noncé But­terFS voire B-tree(bitri)FS, il s'agit d'un sys­tème de fichier jour­na­lisé pour Linux, déve­loppé à l'origine par Oracle et fourni sous licence GPL, uti­li­sant la tech­no­lo­gie Copy-on-write. Il est censé offrir un niveau élevé de pro­tec­tion de don­nées et une tolé­rance accrue aux erreurs et pannes. Je ne vais pas vous expo­ser ici les spé­ci­fi­ca­tions tech­niques de BtrFS, vous pour­rez en apprendre plus sur la page de wiki du pro­jet ou sur wiki­pe­dia pour les non-anglophones.

Concrè­te­ment, BtrFS peut appor­ter cer­taines fonc­tion­na­li­tés fort utiles, comme par exemple la créa­tion de points de res­tau­ra­tion du sys­tème avec la pos­si­bi­lité de reve­nir à un cli­ché donné. Et ça, ça tue ! Extrait de ce qu'on peut lire sur la page de dis­cus­sion de Fedora 13 (Fedora per­met l'utilisation de Btrfs depuis la ver­sion 11) :

Btrfs est capable de créer des cli­chés légers du sys­tème de fichiers qui peuvent être mon­tés au choix (y com­pris au démar­rage). Les cli­chés créés uti­lisent la tech­nique de la copie-sur-écriture donc aucune dupli­ca­tion de don­nées pour les fichiers inchan­gés. Cela per­met aux déve­lop­peurs d'expérimenter de nou­veaux logi­ciels sans craintes de se retrou­ver avec une ins­tal­la­tion cas­sée, puisque les cli­chés auto­ma­tiques leur per­mettent de bas­cu­ler le sys­tème de fichiers à l'état précédent.

Vous ima­gi­nez un cli­ché avant chaque apt-get ins­tall qui per­met­trait de reve­nir en arrière en cas de pro­blème ? Voilà qui devrait en ravir plus d'un ! Voyez un exemple (sur Fedora 13) ICI.

J'ai trouvé sur Pho­ro­nix un bench­mark com­pa­ra­tif de EXT3, EXT4, XFS et BtrFS d'où il res­sort que ce pro­jet, même s'il est très pro­met­teur, a encore du che­min à par­cou­rir s'il veut à terme être capable de concur­ren­cer ses aînés. Quelques gra­phiques pour illus­trer, mais j'invite les inté­res­sés à lire le test en entier :

Compile Bench

Lors du test de com­pi­la­tion, BtrFS est 23% plus rapide que le plus véloce des trois autres.

FS-Mark

BtrFS est presque 4,5 fois plus rapide que EXT3/4, XFS est loin der­rière tous les autres.

PostgreSQL Bench

BtrFS n'arrive à effec­tuer qu'un ridi­cule 69 tran­sac­tions par secondes, très loin der­rière tous les autres.

SQLite Bench

Encore une grande défaite de BtrFS dans un second test de bases de don­nées qui voit EXT3 l'emporter haut la main.

Je pense que c'est un sujet dont j'aurai l'occasion de repar­ler avant long­temps. J'utilise actuel­le­ment EXT4 et XFS comme sys­tèmes de fichiers avec mon Ubuntu, et j'en suis satis­fait (par­ti­cu­liè­re­ment du XFS, qui offre des per­for­mances de folie sur mes disques durs satu­rés de gros fichiers), mais j'attends l'avènement de BtrFS avec impatience !

Pas vous ?

Read More