Posts Tagged "ubuntu"
Convertir des sous-titres VobSub en SRT sur GNU/Linux
Quand elle est revenue de sa dernière croisière, ma grand-mère avait dans ses bagages un DVD contenant plusieurs petits films de ses vacances, une séquence par étape, le tout sous-titré en anglais. Bien que n'habitant pas le Cantal, Mamie ne savait pas trop que faire de ce DVD, d'autant qu'elle ne lit pas la langue de la perfide Albion et n'a aucunement l'intention de s'y mettre, à son âge aussi respectable qu'avancé.
Elle a donc fait appel à moi pour arriver à faire quelque chose de ce DVD, particulièrement pour les sous-titres, qu'elle aimerait avoir en français.
Il existe de nombreuses méthodes pour extraire des sous-titres VobSub d'une vidéo, tant sur GNU/Linux que sur Windows. Par contre GNU/Linux ne propose rien de probant pour convertir le format VobSub en quelque chose de facilement éditable comme le SRT. Alors bien sûr, on peut le faire à la main avec Avidemux par exemple ou même SubRip via Wine, mais c'est assez long et surtout, dans le cas présent, le DVD contient pas moins de 24 séquences distinctes comptant chacune entre 300 et 400 lignes de sous-titres. L'automatisation de la tâche s'impose…
Heureusement pour moi, ruediger.s du forum Doom9.org a développé un script qui permet de faire ce que je veux : j'ai nommé VobSub2Srt. Procédure d'installation :
On récupère les sources ici : https://github.com/ruediger/VobSub2SRT/zipball/master
On décompresse :
$ unzip ruediger-VobSub2SRT-*.zip
On installe le nécessaire pour compiler :
— Ubuntu 11.10 Oneiric :
$ sudo apt-get install libavutil-dev tesseract-ocr-dev tesseract-ocr-eng build-essential cmake checkinstall
— Ubuntu 12.04 Precise :
$ sudo apt-get install libavutil-dev libtesseract-dev libtiff4-dev tesseract-ocr-eng build-essential cmake checkinstall
Notez ici l'installation de Tesseract : c'est lui qui, par OCR, va faire le gros du boulot. Ici, j'installe le nécessaire pour faire de l'OCR sur la langue anglaise ; il est bien évident qu'il faut installer les paquets tesseract correspondants aux langues que vous voudrez extraire…
NB:
Maintenant, on va compiler le tout :
$ cd ruediger-VobSub2SRT-* $ ./configure $ make $ checkinstall -D --nodoc --maintainer=votre@email.tld --pkgname=vobsub2srt --pkglicense=GPL3+ --pkgarch=`dpkg --print-architecture` --pkgsource=https://github.com/ruediger/VobSub2SRT --provides=VobSub2Srt --requires="tesseract-ocr-eng" --backup=no --deldoc --default $ sudo dpkg -i vobsub2srt_*.deb $ sudo ln -s /usr/local/bin/vobsub2srt /usr/bin/
Le checkinstall retourne une erreur à la fin, c'est normal puisqu'on ne l'a pas lancé avec les droits SuperUtilisateur donc il crée correctement le paquet mais ne peut l'installer.
Maintenant, il ne reste plus qu'à l'utiliser, postulons que j'ai sous_titres.sub (et sous_sitres.idx bien sûr) :
$ vobsub2srt sous_titres
et on obtient en quelques secondes un fichier sous_titres.srt qu'il reste à corriger. Ben oui, c'est génial l'OCR mais loin d'être infaillible, surtout quand c'est automatique. Cependant, j'ai obtenu d'aussi bons résultats qu'en le faisant à la main avec Avidemux, et beaucoup plus rapidement !
Il existe deux options pour vobsub2srt :
–verbose : active le mode verbeux
–lang code_langue : règle l'OCR sur la langue donnée, par exemple vobsub2srt –lang fr sous_titres si vos sous-titres VobSub sont en français (je rappelle ici qu'il faut avoir installé les paquets tesseract correspondants)
Voilà ! Convertissez bien, et comme toujours je vous fournis un paquet précompilé pour architecture x64 disponible dans l'espace de téléchargement, section Applications → Ubuntu.
— Paquet pour Ubuntu 11.10 Oneiric :
Fichier : vobsub2srt_23dcb63-1_amd64.deb
Signature : vobsub2srt_23dcb63-1_amd64.deb.asc
SHA1 : f0c74851a26b82d1729ad56b5cc5a83b772f93ae
MD5 : 878cb25143f637bf7a9a3bc290d2d688
CRC32 : 1f719842
— Paquet pour Ubuntu 12.04 Precise :
Fichier : vobsub2srt_2d8d1b0-1_amd64.deb
Signature : vobsub2srt_2d8d1b0-1_amd64.deb.asc
Checksums : vobsub2srt_2d8d1b0-1_amd64.deb.checksum
SHA1 : 4b961ce581b9771ab47a9c2e094bb7c5d788aa6c
MD5 : 45040f77b349eb86511415a2b75dbdc4
CRC32 : 1c5848b1
Récupérer les clefs GPG des dépôts sur Ubuntu quand on est derrière un pare-feu
Voici le tableau : vous êtes dans votre chambre de cité U, ou peut-être au bureau, et vous tombez sur un joli PPA que vous désirez ajouter illico aux sources de votre Ubuntu. Pas de problème, vous dites-vous in petto : on ouvre un terminal et
$ sudo add-apt-repository ppa:freetuxtv/freetuxtv
Et là, PAF ! Ça ne marche pas, la connexion au serveur de clefs timeout lamentablement. En cause, le pare-feu de votre université ou entreprise qui, faisant son boulot, bloque systématiquement les connexions initiées vers des ports inconnus comme le port 11371, généralement utilisé par les serveurs de clefs.
Heureusement, Anthony, un étudiant de Durham, a trouvé une petite astuce qui va nous permettre de faire passer les requêtes de clefs GPG par le port 80 qui, contrairement au 11371, a très peu de chances d'être bloqué par le pare-feu derrière lequel vous vous connectez. Il a remarqué que la commande add-apt-repository est écrite en python, ce qui la rend très facilement éditable. En suivant la structure des importations, il a trouvé le fichier responsable de la récupération des clefs GPG des dépôts. Voici donc la marche à suivre :
– Éditez le fichier ppa.py qui se trouve dans le répertoire /usr/lib/python2.6/dist-packages/softwareproperties/ en faisant par exemple Alt+F2 puis en entrant
gksudo gedit /usr/lib/python2.6/dist-packages/softwareproperties/ppa.py
sans oublier de valider, et de taper votre mot de passe à l'invite.
– Ceci fait, trouvez dans le fichier la ligne n°88 et changez « keyserver.ubuntu.com » en « hkp://keyserver.ubuntu.com:80 ». Cela donne
res = subprocess.call(
["apt-key", "adv", "--keyserver", "keyserver.ubuntu.com",
"--recv", signing_key_fingerprint[0]])
qui devient
res = subprocess.call(
["apt-key", "adv", "--keyserver", "hkp://keyserver.ubuntu.com:80",
"--recv", signing_key_fingerprint[0]])
Enregistrez, et voilà ! La commande add-apt-repository utilisera désormais le port 80 pour récupérer les clefs des dépôts, et vous pourrez ajouter de nouveaux PPA en toute sérénité.
Read MoreRechercher et installer des PPAs depuis le Terminal
Un truc que je trouve génial avec Ubuntu, c'est l'existence des PPAs. Mais un PPA, c'est quoi ? Sous cet acronyme anglais signifiant Personal Package Archive se cache la possibilité d'upload des paquets sources pour Ubuntu afin qu'ils puissent être construits et publiés sous forme de dépôts Apt.
David Ainley a écrit un petit programme qui permet de chercher et d'installer les PPAs correspondants simplement à partir du Terminal. Avant toute chose, je tiens à rappeler qu'il est très fortement conseillé de savoir précisément ce que l'on fait avant d'ajouter des sources logicielles à son système, et qu'il est indispensable d'être absolument certain de pouvoir faire confiance au mainteneur du PPA que l'on veut ajouter.
Ceci dit, place aux détails :
PPASearch n'est utilisable que via le Terminal, ce qui rebutera les allergiques à la ligne de commande. Mais en attendant que cette fonctionnalité soit ajoutée à la Logithèque Ubuntu, on s'en passe ou on s'en contente. Pour moi, ce sera la deuxième option.
L'utilisation est on ne peut plus simple : on lance ppasearch, ce dernier nous demande quelle est l'application pour laquelle nous recherchons un PPA puis nous présente la liste des éventuels résultats et enfin, installe le PPA choisi.
Pour l'installer, c'est comme ceci :
sudo add-apt-repository ppa:wrinkliez/ppasearch
sudo apt-get update && sudo apt-get install ppasearch
[Source]
Read MorePourquoi les contrôles de fenêtres sont passés à gauche sur Ubuntu
On en a beaucoup parlé avant (et depuis) la sortie d'Ubuntu 10.04 Lucid Lynx : le changement de côté des contrôles de fenêtre a fait des adeptes et des mécontents. Certains de dénigrer la « MacOS-isation » d'Ubuntu, d'autres de saluer une évolution réfléchie, d'autres encore pour s'en fiche complètement.
Mark Shuttleworth a finalement expliqué cette décision : l'espace libéré à droite servira à placer des Windicators ou indicateurs de fenêtre, de petites icônes servant à afficher des informations d'état et à afficher un menu une fois cliquées. Pas très éloigné des icônes de la zone de notification, en somme.
Le grand ponte de Canonical l'explique lui-même :
Les windicators sont des indicateurs affichés dans la barre de titre de la fenêtre et qui se comportent de la même manière que les indicateurs du tableau de bord : ce sont des icônes montrant l'état, et cliquer sur l'icône affiche un menu. Les applications peuvent créer, mettre à jour ou enlever les indicateurs de fenêtre à l'aide d'une API plus ou moins comme le framework AppIndicator introduit dans la 10.04 LTS.
Les windicators ?suivront le même style que les indicateurs Ayatana (vous savez, Ayatana, le nouveau système de notification de Gnome) :
- Monochromes par défaut, avec une forme indiquant la fonction de l'indicateur
- Coloration sémantique : rouge pour les problèmes critiques, orange pour les alertes, vert quand tout va bien et bleu pour les informations qui ne rentrent pas dans le cadre des 3 couleurs précédentes
D'après Mark Shuttleworth, ces windicateurs seraient inspirés de ChromeOS, et voici une maquette de ce à quoi ils pourraient ressembler :

Maquette de ce à quoi pourraient ressembler les windicateurs
Ubuntu 10.10 pourrait adopter le système de fichier BtrFS par défaut
À l'issue du Ubuntu Developer Summit, Scott James Remnant (l'un des développeurs Ubuntu de chez Canonical) a annoncé hier la volonté d'intégration par Ubuntu du système de fichier Btrfs en tant qu'option d'installation voire de système de fichier par défaut.
Si l'intégration de ce système de fichier en option paraît certaine, sa mise en place par défaut reste soumise à plusieurs contraintes :
- BtrFS doit être stable pour la mouture 2.6.35 du kernel, ceci étant la version attendue pour Maverick Meerkat
- BtrFS n'est pas supporté par GRUB 2, cela doit être réglé avant le gel des fonctionnalités prévu le 12 août
- l'équipe de BtrFS doit aimer l'idée
- Canonical doit aimer l'idée
Mais BtrFS, c'est quoi en fait ?
Prononcé ButterFS voire B-tree(bitri)FS, il s'agit d'un système de fichier journalisé pour Linux, développé à l'origine par Oracle et fourni sous licence GPL, utilisant la technologie Copy-on-write. Il est censé offrir un niveau élevé de protection de données et une tolérance accrue aux erreurs et pannes. Je ne vais pas vous exposer ici les spécifications techniques de BtrFS, vous pourrez en apprendre plus sur la page de wiki du projet ou sur wikipedia pour les non-anglophones.
Concrètement, BtrFS peut apporter certaines fonctionnalités fort utiles, comme par exemple la création de points de restauration du système avec la possibilité de revenir à un cliché donné. Et ça, ça tue ! Extrait de ce qu'on peut lire sur la page de discussion de Fedora 13 (Fedora permet l'utilisation de Btrfs depuis la version 11) :
Btrfs est capable de créer des clichés légers du système de fichiers qui peuvent être montés au choix (y compris au démarrage). Les clichés créés utilisent la technique de la copie-sur-écriture donc aucune duplication de données pour les fichiers inchangés. Cela permet aux développeurs d'expérimenter de nouveaux logiciels sans craintes de se retrouver avec une installation cassée, puisque les clichés automatiques leur permettent de basculer le système de fichiers à l'état précédent.
Vous imaginez un cliché avant chaque apt-get install qui permettrait de revenir en arrière en cas de problème ? Voilà qui devrait en ravir plus d'un ! Voyez un exemple (sur Fedora 13) ICI.
J'ai trouvé sur Phoronix un benchmark comparatif de EXT3, EXT4, XFS et BtrFS d'où il ressort que ce projet, même s'il est très prometteur, a encore du chemin à parcourir s'il veut à terme être capable de concurrencer ses aînés. Quelques graphiques pour illustrer, mais j'invite les intéressés à lire le test en entier :

Lors du test de compilation, BtrFS est 23% plus rapide que le plus véloce des trois autres.

BtrFS est presque 4,5 fois plus rapide que EXT3/4, XFS est loin derrière tous les autres.

BtrFS n'arrive à effectuer qu'un ridicule 69 transactions par secondes, très loin derrière tous les autres.

Encore une grande défaite de BtrFS dans un second test de bases de données qui voit EXT3 l'emporter haut la main.
Je pense que c'est un sujet dont j'aurai l'occasion de reparler avant longtemps. J'utilise actuellement EXT4 et XFS comme systèmes de fichiers avec mon Ubuntu, et j'en suis satisfait (particulièrement du XFS, qui offre des performances de folie sur mes disques durs saturés de gros fichiers), mais j'attends l'avènement de BtrFS avec impatience !
Pas vous ?
Read More


