FRFAM.COM >> Famille >> Technologie &Innovation >> Informatique

Tout ce que vous devez savoir sur les formats de fichiers et leurs propriétés

Le fichier est l'un des les éléments fondamentaux de l'expérience informatique. Mais qu'est-ce qu'un "fichier" de toute façon ? Il s'agit d'une icône sur votre bureau, d'une entrée dans une liste qui ouvre votre budget sous forme de feuille de calcul et d'un nom que vous pouvez donner à votre dernier selfie. En fin de compte, un "fichier" est une collection de bits (zéros et uns) disposés selon un modèle que certaines applications comprennent.

Les développeurs peuvent garder ces modèles secrets, ce qui peut inciter les utilisateurs à conserver un programme particulier malgré les alternatives. D'autres développeurs peuvent en fait encourager l'adoption de leurs formats. Dans certains cas, vous pouvez facilement ouvrir et interpréter le format, ou il peut être impossible de l'utiliser en dehors de son application native. Nous allons explorer des exemples de tout ce qui précède dans cet article.

Formats de fichiers textuels et formats de fichiers binaires

Le premier aspect important des différents types de fichiers est de savoir s'ils sont binaires ou textuels. Examinons chacun d'eux à tour de rôle.

Formats textuels

Le fichier texte est le format de fichier le plus basique. Il peut être lu par à peu près n'importe quel système doté d'un processeur. Ce format est une séquence de bits (uns et zéros) qui respecte la norme ASCII (nous négligerons Unicode pour le moment), ce qui signifie qu'un ordinateur peut interpréter chaque octet (8 bits) comme un caractère parmi les suivants :

  • A-Z (y compris majuscules et minuscules
  • 0-9
  • Caractère espace
  • Une sélection de symboles (par exemple, ponctuation)
  • Caractères de contrôle (par exemple "DEL")
Tout ce que vous devez savoir sur les formats de fichiers et leurs propriétés

Les données étant stockées sous forme de texte, vous pouvez afficher le contenu d'un fichier en l'ouvrant dans un éditeur de texte. , même les plus simples comme le Bloc-notes Windows (ou équivalents pour Mac, Linux, iOS et Android). Étant donné que presque toutes les plates-formes informatiques sont livrées avec un éditeur de texte de base, vous pouvez mettre des informations (texte) dans l'un de ces fichiers et être sûr que vous pourrez toujours y accéder. Les autres applications n'ont pas besoin d'en savoir plus pour au moins lire correctement les données.

Cependant, les choses se compliquent lorsque vous devez représenter quelque chose comme la police du texte ou une date remplie automatiquement sur la page de couverture. Dans ces cas, les caractères ASCII contribuent à un format textuel tels que Markdown ou XML. Bien que cela confère les avantages du texte brut tels que la transparence, ces fichiers nécessitent souvent plus d'espace pour des éléments tels que des balises. Considérez le fichier d'une phrase suivant en texte brut, puis au format "Flat ODT" (FODT) de l'Open Document Format, qui utilise XML. L'image ci-dessous montre que la version en texte brut est de 53 octets, tandis que la version ODT est de 25 000 octets. .

Tout ce que vous devez savoir sur les formats de fichiers et leurs propriétés

Formats binaires

En revanche, les formats binaires sont des fichiers qu'une application va construire petit à petit. Vous pouvez essayer d'ouvrir ces fichiers avec un éditeur de texte, mais il ne saura probablement pas comment les interpréter. L'exemple ci-dessous montre le résultat d'une tentative d'ouverture d'un fichier Microsoft Excel avec un éditeur de texte.

Tout ce que vous devez savoir sur les formats de fichiers et leurs propriétés

L'application doit traiter les données d'un fichier binaire d'une manière spécifique. Lors de l'ouverture d'un fichier XLS, une application doit traiter les seize premiers octets du fichier comme le marqueur de "début de fichier" (BOF). Dans ce marqueur, le cinquième élément est un bit unique indiquant si oui ou non le fichier a été modifié pour la dernière fois sur la plate-forme Windows ("fWin"). Il vient après quatre autres éléments, chacun de deux octets, ce qui signifie que l'élément "fWin" est le 65e bit dans le fichier Excel.

Tout ce que vous devez savoir sur les formats de fichiers et leurs propriétés

Comme nous l'avons vu, si vous essayez de l'ouvrir avec une application qui ne gère pas le 65e bit comme drapeau "fWin", cette application ne l'ouvrira pas correctement. Il peut afficher de nombreux caractères brouillés à l'écran (illustré ci-dessus), le gérer avec élégance avec un message d'erreur (également illustré ci-dessus, car Linux) ou planter. Dans tous les cas, il ne saura pas lire correctement les données, et ne les affichera donc pas correctement. Mais les applications, une fois programmées, peuvent gérer autant de formats de fichiers que vous le souhaitez.

Formats ouverts ou propriétaires

La considération suivante est de savoir si un format de fichier est ouvert (c'est-à-dire disponible pour une utilisation facile par d'autres) ou propriétaire. Notez que "propriétaire" n'est pas la même chose que fermé, du moins pas dans tous les cas. Alors que le débat "texte contre binaire" ci-dessus était un débat technique, "ouvert contre propriétaire" a plus à voir avec les conditions de licence d'un format de fichier. Plus d'informations à ce sujet dans les sections suivantes.

Formats ouverts

Les formats ouverts sont ceux pour lesquels la licence permet aux utilisateurs de les adopter pour leurs propres applications. Un organisme de normalisation quelconque devrait également superviser leur développement continu par une communauté de contributeurs pour que les formats soient vraiment "ouverts". Les formats ouverts sont également exempts de frais de licence et de restrictions :ils peuvent être utilisés par n'importe qui, à n'importe quelle fin. Le format ouvert le plus célèbre est peut-être l'Open Document Format (ODF), publié pour la première fois en 2005 par OASIS. Son but était d'offrir une alternative au verrou que Microsoft avait sur le marché de la productivité.

Avec les formats ouverts, vous n'avez jamais à craindre que vos informations soient enfermées dans un fichier particulier. Considérez ce qui suit, qui montre notre fichier au format Flat ODT. Bien qu'il y ait beaucoup d'informations superflues autour de lui, vous pouvez y voir les données réelles, claires comme le jour.

Tout ce que vous devez savoir sur les formats de fichiers et leurs propriétés

Un autre avantage des formats ouverts est leur documentation complète. C'est une chose qu'un fichier soit facilement lisible. Un programmeur aura toujours (par essais et erreurs) besoin de comprendre ce que fait exactement chacune de ses fonctionnalités. Mais dans le cas d'ODF, la spécification de la version 1.2 donne au programmeur tout ce qu'il doit savoir pour implémenter efficacement sa prise en charge.

Formats propriétaires

Enfin, les formats propriétaires sont protégés par leurs développeurs. Cela peut être dû au fait qu'ils incluent des secrets commerciaux, à des fins de sécurité (perçue) ou simplement parce que le développeur ne veut pas partager son travail. Quelle que soit la raison, ces formats sont propriétaires en vertu des contrats de licence utilisateur final (CLUF) ou d'autres termes interdisant à l'utilisateur d'essayer d'effectuer de l'ingénierie inverse ou de "casser" le format de fichier.

Autrefois simplement "interdit", le Digital Millenium Copyright Act (DCMA) a changé la donne. Les développeurs ont désormais le soutien juridique pour poursuivre ceux qui font de l'ingénierie inverse de leur travail. Vous devriez penser à l'avenir avant d'investir dans une application qui utilise un format propriétaire. Aurez-vous besoin de migrer ces informations ailleurs à l'avenir ? Si oui, à quel point cela sera-t-il douloureux ? L'entreprise sera-t-elle encore là dans un an ou cinq ? Vous devez vous demander si les fonctionnalités d'une application en valent la peine si cela signifie également que vous êtes enfermé dans ce développeur en raison de formats propriétaires.

Exemples de formats de fichiers

Si vous regardez ce qui précède, quelques combinaisons vous sauteront aux yeux. Il est vrai que les formats de fichiers textuels se prêtent à être ouverts . De même, si l'objectif d'un format est d'être propriétaire, il est plus facile de le conserver en le rendant binaire. Mais ce n'est pas toujours le cas.

Le format d'image XCF de GIMP est un format ouvert qui est également binaire. Le projet comprend une description détaillée de la manière dont le format contient les graphiques, le texte et les calques qui composent un fichier GIMP sous forme de bits et d'octets bruts (voir ci-dessous). Les développeurs peuvent l'utiliser pour coder leur propre implémentation afin que des applications externes telles que la boîte à outils ImageMagick puissent les importer.

Tout ce que vous devez savoir sur les formats de fichiers et leurs propriétés

À l'inverse, le plus récent format Microsoft Visio (VSDX) est un format basé sur XML (et donc basé sur du texte). Elle publie une référence détaillée de la constitution de ces fichiers. Cependant, le document de référence note que Microsoft "a des brevets qui pourraient couvrir votre implémentation" de la prise en charge de .VSDX. En outre, la Bibliothèque du Congrès déclare que l'utilisation de la spécification VSDX "ne garantit pas une licence libre de droits de tous les brevets pertinents" si vous l'utilisez. C'est une autre façon de dire que vous pouvez lancer les dés et inclure ce soutien. Mais Microsoft peut ou non vouloir que vous le payiez plus tard, en fonction de son degré de concurrence avec Visio.

Si vous pensez que ceux-ci sont compliqués, qu'en est-il du format ODT non plat ? Il s'agit d'un fichier au format ZIP (binaire et ouvert, sauf si vous utilisez également son cryptage) qui contient le texte d'un document (content.xml , format texte ouvert) et graphiques (par exemple, PNG, binaire mais ouvert).

Tout ce que vous devez savoir sur les formats de fichiers et leurs propriétés

Quelle est l'importance réelle des formats de fichiers ?

C'est une question difficile. D'une part, certains systèmes d'exploitation comme iOS ont tenté d'empêcher les utilisateurs de traiter les fichiers. Vous avez l'application qui a créé le fichier pour l'ouvrir, qui se soucie de sa structure ou de son extension ? Pourtant de nombreuses organisations (en particulier les gouvernements) ont fait pression pour s'assurer que les données publiques sont dans un format ouvert.

Si vous êtes un idéaliste du logiciel (pas qu'il y ait quelque chose de mal à cela), alors lorsque vous évaluez de nouvelles applications, assurez-vous qu'elles sont dans un format texte ouvert (de préférence). Si vous souhaitez simplement vous mettre au travail, les formats propriétaires ne seront peut-être pas un problème pour vous.

Qu'en pensez-vous ? Exigez-vous que vos informations résident dans des formats textuels ouverts que vous pouvez convertir et vérifier ? Ou les formats utilisés par les développeurs, propriétaires ou non, vous suffisent-ils ? Faites-le nous savoir ci-dessous dans les commentaires !

Crédits image :Edilus/Shutterstock


[]