FRFAM.COM >> Famille >> Technologie &Innovation >> Informatique

Comment convertir facilement entre les formats de document sous Linux

L'un des problèmes souvent cités lors du passage à Linux est la compatibilité des fichiers. Vous enverrez invariablement des fichiers aux utilisateurs d'autres systèmes d'exploitation, et ils n'auront pas la même apparence lorsqu'ils seront ouverts dans des applications telles que Word. Bien que vous puissiez installer des polices ou essayer des VM ou des émulateurs pour essayer de vous assurer que les choses sortent avec une apparence cohérente, une autre approche consiste à faire votre travail dans un format de texte brut, puis à le convertir une fois que vous avez terminé.

Un outil que vous pouvez utiliser pour convertir entre les formats est pandoc, un outil essentiel dans la boîte à outils de tout utilisateur Linux.

Installation et utilisation de base de Pandoc

L'installation de pandoc sur la plupart des distributions Linux consiste en un simple voyage dans les référentiels. Sur les systèmes basés sur Ubuntu, la commande suivante l'installe pour vous :

sudo apt-get install pandoc 

Une fois installé, vous pouvez commencer à utiliser le programme en ligne de commande pour convertir les fichiers. Excellent pour gérer Markdown et d'autres langages de balisage légers, si vous avez un .MD fichier qui traîne, vous pouvez le convertir en HTML avec ce qui suit :

pandoc -o monfichier.html monfichier.md 
Comment convertir facilement entre les formats de document sous Linux

Le -o flag indique le nom du fichier de sortie vous voulez. Dans ce cas, il déduit également le format de sortie (HTML) par l'extension du nom de fichier. Vous pouvez utiliser le -r (pour lire ) et -w (pour écrire ) drapeaux pour indiquer à pandoc le type de conversion que vous souhaitez. Supposons que vous ayez l'habitude d'écrire dans Markdown, mais que vous ayez besoin de publier quelque chose sur une page basée sur Mediawiki :

pandoc -r markdown -w mediawiki -o markdown.wiki markdown.md 
Comment convertir facilement entre les formats de document sous Linux

Dans ses versions antérieures, pandoc se concentrait sur la "mise à niveau" des fichiers, dans le sens où il pouvait convertir des formats plus simples (tels que Markdown) en formats plus complexes (par exemple ODT ou DOCX de Microsoft). Mais il va maintenant lire également ces formats plus compliqués. Cela signifie que si vous êtes habitué à un traitement de texte mais que vous êtes tenté par toutes les raisons d'utiliser un format de texte brut plus petit et plus portable, cela est devenu beaucoup plus facile.

Étant donné un répertoire rempli de fichiers Word, la commande suivante convertira chacun d'eux en Markdown :

pour le fichier dans * 
fais
pandoc -r docx -w markdown -o "$fichier".md "$fichier"
terminé
Comment convertir facilement entre les formats de document sous Linux

Notez que cela vous laissera avec des fichiers nommés filename.docx.md , vous devrez donc exécuter une commande de renommage rapide (ou mieux encore, ajoutez-la à ce qui précède en tant que script shell).

Options de ligne de commande Pandoc

Maintenant que vous avez quelques notions de base, nous allons examiner certaines des options les plus avancées des options de ligne de commande de pandoc.

Fichiers de référence ODT/DOCX

Supposons que vous ayez converti tous vos anciens fichiers de traitement de texte volumineux en Markdown. Pendant que vous vous délectez de la joie de créer en texte brut, à un moment donné, vous devrez les partager avec quelqu'un. Et que quelqu'un n'est peut-être pas aussi éclairé que vous. Vous pouvez simplement inverser la lecture et écrire flags pour reconvertir votre fichier au format Word :

pandoc -r markdown -w docx -o wordfile.docx wordfile.md 

Mais certaines personnes aiment leurs fichiers Word avec des polices particulières, des en-têtes numérotés, etc. Le DOCX de Pandoc le back-end prend en charge les fichiers modèles, appelés fichiers de référence , pour une telle occasion. Ce sont ODT ou DOCX fichiers que vous avez configurés avec tout le style dont vous avez besoin. Pandoc applique ensuite ces styles lors de la conversion si vous lui passez le fichier de référence en ligne de commande :

pandoc -r markdown -w odt --reference-odt=/home/user/path/to/ref-file.odt -o lowriter.odt lowriter.md 
Comment convertir facilement entre les formats de document sous Linux

Remarquez comment les polices configurées dans le fichier de référence ci-dessus (Arial Black pour le titre 1, etc.) s'affichent dans le fichier converti ci-dessous. Vous pouvez créer autant de ces fichiers de référence que nécessaire (par exemple, un par client). Ensuite, ignorez complètement la mise en forme pendant que vous écrivez et appliquez le style en une seule étape lors de la conversion.

Comment convertir facilement entre les formats de document sous Linux

Backends de rendu PDF

La création de fichiers PDF est également un exercice simple, une fois que vous avez installé certains packages nécessaires. Un moyen léger d'obtenir la capacité d'écriture PDF consiste à installer le wkhtmltopdf package, un outil en ligne de commande pour convertir HTML en PDF. pandoc le prend en charge nativement, donc si vous définissez le write flag en HTML, mais le fichier de sortie en tant que PDF, il interprétera cela comme votre intention d'utiliser wkhtmltopdf tout seul !

pandoc -r markdown -w html -o nicepub.pdf nicepub.md 

Alternativement, vous pouvez opter pour l'option complète en utilisant le système de composition TeTex. Profitez du fait que ces packages sont des installations suggérées pour le package pandoc en le réinstallant avec la commande suivante :

sudo apt-get install --install-suggests pandoc 

Ensuite, asseyez-vous pendant que beaucoup (vraiment, beaucoup) de packages s'installent. Une fois qu'ils sont terminés, vous pouvez convertir votre fichier directement en PDF en le spécifiant comme écriture drapeau :

pandoc -r markdown -w pdf -o nicepub-tetex.pdf nicepub.md 

Alors que le wkhtmltopdf nécessite l'installation d'un seul package, vous pouvez obtenir des résultats plus faciles à imprimer avec TeTex. À savoir, les polices serif sont utilisées par défaut et les pages sont automatiquement numérotées.

Comment convertir facilement entre les formats de document sous Linux

Générateur d'ebooks

Enfin, pandoc peut convertir vos fichiers en ebooks adaptés à la lecture sur un téléphone ou une liseuse. L'epub et epub3 les back-ends vous donneront un ebook correctement formaté :

pandoc -r markdown -w epub -o monbook.epub monbook.md 
Comment convertir facilement entre les formats de document sous Linux

Conseils avancés

Les avantages de pandoc vont au-delà de sa puissance en tant qu'utilitaire de ligne de commande... par exemple, il inclut la prise en charge d'une version améliorée de Markdown et peut facilement être intégré à des applications graphiques.

La saveur Markdown de Pandoc

En plus d'être un outil de conversion, pandoc prend en charge une saveur légèrement améliorée de Markdown. En utilisant pandoc au lieu du standard markdown commande, vous disposez de fonctionnalités supplémentaires, notamment les suivantes :

  • Métadonnées -- La saveur de Markdown de Pandoc vous permet d'inclure des informations dans l'en-tête de votre document telles que l'auteur, la date, l'adresse e-mail, etc.
  • Décorations de texte -- Vous pouvez appliquer des décorations de texte telles que barré ou super/indice qui ne sont pas pris en charge dans Markdown standard via pandoc.
  • Tableaux - Cela seul rend pandoc intéressant par rapport à Markdown "vanille". En utilisant le caractère pipe pour séparer les cellules du tableau, vous pouvez créer un tableau qui va du très laid au lisible par l'homme en texte brut ainsi qu'au format rendu.
  • Listes de fantaisie -- Pandoc vous permet de formater des listes avec des niveaux de style de contour, par ex. « 1. », puis « A. », puis « i. », etc. Vous pouvez également spécifier un numéro de départ pour les listes, où les listes en clair Markdown commencent par « 1 ».
  • Mise en évidence de la syntaxe du code -- Vous pouvez appliquer la surbrillance à vos blocs de code en indiquant à pandoc quelle est la langue.

Ce qui précède n'est qu'une sélection des fonctionnalités de pandoc Markdown. Visitez la page de manuel sur pandoc.org pour une liste complète des extras fournis par cette variante de Markdown.

Utiliser une interface graphique avec pandoc

Bien que pandoc soit efficace en tant qu'outil de ligne de commande, il contient de nombreuses options. Si vous débutez avec Linux, vous préférerez peut-être utiliser pandoc avec une interface graphique. Bien qu'il ne contienne pas d'interface graphique par défaut, vous pouvez installer PanDocElectrion pour convertir vos documents par pointer-cliquer. Téléchargez le script d'installation à partir du site Web de l'application, puis exécutez-le pour installer tous les packages nécessaires et le programme lui-même.

Comment convertir facilement entre les formats de document sous Linux

Une fois installé, le npm démarre commande dans le PanDocElectron répertoire lancera l'application. Avec des listes déroulantes pour les formats et la possibilité de choisir le fichier d'entrée avec une boîte de dialogue, cela vous aidera à vous habituer aux "entrées et sorties" de pandoc, pour ainsi dire.

Comment convertir facilement entre les formats de document sous Linux

Si vous êtes à l'aise avec la myriade d'options et d'indicateurs de pandoc, mais que vous voulez juste un moyen d'appeler facilement il, vous pouvez l'intégrer à votre éditeur de texte graphique. Par exemple, l'éditeur Atom contient un certain nombre de packages qui permettent d'enregistrer le fichier actuel dans différents formats à l'aide de pandoc (package pandoc-convert) :

Comment convertir facilement entre les formats de document sous Linux

Une autre option consiste à exécuter des commandes pandoc à l'aide des fonctions intégrées d'un éditeur, telles que la commande build. Les outils de construction d'Atom package vous donne la possibilité de spécifier des commandes personnalisées :

Comment convertir facilement entre les formats de document sous Linux

Ensuite, vous pouvez appeler la commande build sur vos fichiers compatibles pandoc, comme vous le feriez sur le code source :

Comment convertir facilement entre les formats de document sous Linux

Pandoc élimine une partie du stress lié au changement

Avec pandoc dans votre boîte à outils, vous pouvez vous reposer en sachant que vous pouvez toujours transmettre vos documents à d'autres personnes dans le format dont elles ont besoin. En même temps, vous pouvez tirer parti de certaines des fonctionnalités exceptionnelles de Linux (envisagez de donner l'un des éditeurs de texte basés sur un terminal comme vim un essai).

Vous arrive-t-il souvent de convertir des fichiers d'un format à l'autre ? Si vous rencontrez des problèmes de compatibilité, faites-le nous savoir dans les commentaires, et nous verrons si nous pouvons utiliser pandoc pour vous trier !

Crédit image :Nirat.pix via Shutterstock.com


[]