Le fichier est un élément fondamental de l'informatique. Mais qu'est-ce qu'un fichier exactement ? C'est une icône sur votre bureau, une entrée dans une liste qui ouvre votre budget en feuille de calcul, ou le nom de votre dernier selfie. En réalité, un fichier est une collection de bits (zéros et uns) organisés selon un modèle que certaines applications peuvent interpréter.
Les développeurs gardent parfois ces modèles secrets, incitant les utilisateurs à rester fidèles à un logiciel malgré les alternatives. D'autres favorisent l'adoption ouverte de leurs formats. Certains sont faciles à ouvrir hors de leur application native, d'autres impossibles. Cet article explore ces aspects avec des exemples concrets.
Le premier critère distingue les formats binaires des textuels. Examinons-les.
Le fichier texte est le plus simple. Il est lisible par tout système avec un processeur, suivant la norme ASCII (Unicode mis à part pour simplifier). Chaque octet (8 bits) représente un caractère : A-Z (majuscules/minuscules), 0-9, espaces, symboles de ponctuation ou caractères de contrôle comme "DEL".

Stockées en texte brut, ces données s'ouvrent dans n'importe quel éditeur de texte, comme le Bloc-notes sous Windows ou équivalents sur Mac, Linux, iOS et Android. Universellement accessible, ce format garantit la pérennité de vos données.
Pour des éléments complexes comme la mise en forme ou les dates automatiques, des formats textuels structurés comme Markdown ou XML s'utilisent. Ils conservent la transparence du texte mais nécessitent plus d'espace (balises). Exemple : une phrase en texte brut (53 octets) vs Flat ODT (XML, 25 000 octets).

Les formats binaires sont construits par l'application elle-même. Ouvrez-les dans un éditeur texte : résultat illisible, comme pour un fichier Excel ci-dessous.

Pour un XLS, l'application lit les 16 premiers octets comme marqueur BOF. Le 5e élément (bit 65) indique une modification sous Windows ("fWin"). Sans prise en charge précise, affichage corrompu, erreur ou crash.

Les applications bien programmées gèrent de multiples formats efficacement.
Autre critère : ouverture (licence permissive) vs proprieté (restrictions). Ce n'est pas synonyme de texte/binaire, mais lié aux licences.
Supervisés par un organisme (ex. OASIS), sans frais ni restrictions. L'ODF (2005) rivalise avec Microsoft Office. Vos données restent accessibles.
Exemple Flat ODT : contenu visible malgré balises superflues.

Documentation exhaustive (spécification ODF 1.2) facilite l'implémentation.
Protégés par CLUF interdisant l'ingénierie inverse, renforcés par le DMCA. Risque de verrouillage : migration difficile, dépendance au développeur.
Textuel ≠ ouvert, binaire ≠ propriétaire toujours.
XCF (GIMP) : binaire ouvert, documenté pour ImageMagick.

VSDX (Visio) : textuel (XML), mais brevets Microsoft risqués.
ODT : ZIP (binaire ouvert) contenant content.xml (texte ouvert) et PNG (binaire ouvert).

Subjectif. iOS restreint l'accès, mais gouvernements exigent ouverts pour données publiques.
Idéalistes : privilégiez texte ouvert. Pragmatiques : formats propriétaires suffisent si fonctionnalités prioritaires.
Et vous ? Exigez-vous des formats textuels ouverts convertibles ? Ou les proprietaires vous conviennent-ils ? Dites-le en commentaires !
Crédits image : Edilus/Shutterstock
[]