Skip to content
Bertrand Caron edited this page Oct 29, 2024 · 22 revisions

TIFF Statut

Description

Le format TIFF (Tag(ged) Image File Format) est un format conteneur ouvert et bien documenté (CPO-DOC) pour une image matricielle (ou plusieurs, dans sa version multi-pages, voir la section « Caractéristiques techniques » ci-dessous) sous une forme compressée ou non.

Développé par Aldus et Microsoft, il est désormais maintenu par Adobe. Bien qu'il ne s'agisse pas d'un organisme de normalisation, la liberté d'utilisation du format TIFF n'est plus limitée ; on le considère donc comme un format ouvert (CPO-LIB). Il s'agit d'un format adapté à la conservation mais non, du fait de son poids conséquent, à l'échange ni à la diffusion.

Qualité et caractéristiques du flux

Outre les images binarisées et en niveaux de gris, le format TIFF gère de multiples modèles de couleur : RGB et Palette dans sa version baseline et, via des extensions décrites dans la spécification, les modèles CMJN, YCbCr et CIE Lab*, entre autres. Il arrive, notamment pour les besoins spécifiques des métiers de l'impression, que l'on rencontre des flux images avec des canaux supplémentaires, par exemple images 32 bits avec trois canaux RGB associés à un canal de transparence alpha, ou images avec quatre canaux CMJN associés à un ou plusieurs canaux en tons directs.

Sociabilité

Ce format bien éprouvé est un standard de facto pour la conservation de masters images, à la fois par les professionnels de l'image et les institutions mémorielles pour leurs campagnes de numérisation. Son niveau de support logiciel et matériel est très haut. Puisqu'il n'est pas un format de diffusion, sa prise en charge par les navigateurs est limitée.

Relations à d’autres formats

Plusieurs variantes (extensions ou restrictions) du format TIFF ont été définies pour pallier des limitations du format (la taille maximale des fichiers est de 4 Go, et ces derniers ne peuvent embarquer nativement des coordonnées géographiques). On citera notamment les variantes ouvertes suivantes (il existe également des variantes propriétaires) :

  • GeoTIFF pour les images géoréférencées ;
  • BigTIFF pour les images de plus de 4 Go ;
  • TIFF/EP (TIFF/Electronic Photography), format brut pour les photographies numériques.

Versions

La version actuelle de TIFF est la version 6.0, publiée en 1992, qui fait depuis lors office de version de référence, bien que l'on puisse trouver des fichiers dans les versions précédentes - il arrive que des TIFF contenant des images non compressées soient créés en version 5.0. Les versions successives de TIFF étant toutes rétrocompatibles, un fichier TIFF d'une version antérieure à la version 6.0 est également conforme à la version 6.0.

Le format n'a pas connu de révision majeure depuis cette date et est donc particulièrement stable (CPO-STA). Les évolutions depuis cette date ont plutôt développé des extensions du format pour des besoins particuliers, parmi lesquels on compte les variantes citées ci-dessus.

Contenu

Outre le flux image et d'éventuelles extensions intégrant des métadonnées internes, le format TIFF est extensible et peut donc accueillir des données de toute nature. Bien que la spécification précise que les outils sont tenus d'ignorer les extensions non gérées, il arrive que des extensions propriétaires perturbent le traitement correct de fichiers TIFF.

Organisme de maintenance et documentation de référence

La spécification du format dans sa version 6.0 du 3 juin 1992 est disponible sur Internet Archive.

De très nombreuses ressources existent également, que la Bibliothèque du Congrès a listées sur sa description du format.

La British Library a réalisé une évaluation de ce format pour la préservation à long terme.

Les exigences BnF sur les images TIFF livrées à la BnF dans le cadre de ses marchés de numérisation sont décrites dans la section 4 du référentiel de numérisation des documents opaques.

Identifiants

Extensions : .tifet .tiff, également régulièrement trouvées en majuscules.

Type MIME : image/tiff.

Registre Identifiant
Wikidata Q215106
Bibliothèque du Congrès fdd000022
PRONOM fmt/353
Just Solve the File Format Problem TIFF

Caractéristiques techniques

La spécification TIFF définit un ensemble de fonctionnalités minimales que tout lecteur doit gérer (baseline TIFF) ainsi que des extensions permettant de répondre à des besoins spécifiques (modèles couleurs autres que RGB, méthodes de compression, etc.). Le support logiciel de certaines extensions est inégal, en particulier

  • diverses méthodes de compression peuvent être utilisées pour le flux image contenu dans un conteneur TIFF. Les plus communes sont LZW, ZIP/Deflate, CCITT Group 3 et CCITT Group 4. Une liste exhaustive des méthodes de compression plus rarement employées est proposée sur la page Wikipédia en anglais. Les méthodes moins courantes peuvent occasionner des problèmes de restitution sur certains logiciels. Une étude de la British Library a déterminé que les méthodes de compression les plus efficaces sont CCITT Group 4 pour les images bitonales et ZIP/Deflate pour les images en niveaux de gris 8 bits ou en couleurs 24 bits. Le gain d'espace obtenu a pour contrepartie un risque légèrement supérieur puisque les méthodes de compression dans un TIFF sont définies dans des extensions qui ne sont pas nécessairement supportées par tous les outils logiciels. La BnF préfère de ce fait que le flux image contenu dans le fichier TIFF ne soit pas compressé.

Note : pour les images bitonales (noir et blanc), la BnF a utilisé dans les décennies passées la compression CCITT groupe 4, très efficace. La numérisation en noir et blanc n'étant plus d'actualité, on ne devrait rencontrer cette compression que dans des données anciennes.

  • la variante multi-pages permettant d'embarquer plusieurs images (nommées « IFD » pour Image File Directory par le standard) dans le même fichier. Les outils logiciels prenant en charge uniquement la version baseline ne sont pas tenus de traiter les images suivant la première ; certains rencontrent des difficultés pour afficher les fichiers multi-pages. Ces données images successives peuvent avoir des contenus différents ou être des représentations alternatives d'un même contenu : ainsi la sortie TIFF de certains matériels de numérisation comprend-elle un second IFD qui était une version en basse définition du premier, destiné à être utilisé comme vignette.

La complexité (CPO-SIM) et la transparence (CPO-TRA) du format TIFF dépendent de la compression utilisée. Dans sa version non compressée, le format reste simple et ne nécessite donc pas un niveau de compétence et d'équipement matériel et logiciel élevé.

Métadonnées internes

Outre le flux image, le format TIFF définit des tags TIFF décrivant à la fois la structure et les caractéristiques du flux image mais fournissant aussi quelques éléments de description du contenu (artiste, droits de propriété intellectuelle, date, etc.). Le site Aware Systems est la référence sur les tags TIFF, y compris sur ceux propriétaires.

La pratique BnF en matière d'intégration de métadonnées internes dans les images masters se limite aux tags TIFF et est décrite à l'annexe 1 du référentiel de numérisation des documents opaques.

En outre, TIFF est extensible et permet d’embarquer des métadonnées internes dans différents formats (EXIF, IPTC, XMP). Les métadonnées EXIF se trouvent dans un IFD distinct du(des) flux image.

Outils connus par la BnF

  • Pour la consultation, les principaux logiciels de traitement image le gèrent correctement (XnView, IrfanView, Photoshop, Gimp, ImageMagick, etc.).
  • Pour la manipulation et la conversion, la bibliothèque logicielle open source LibTIFF est complète et maintenue.
  • Pour la caractérisation, le module TIFF de l'outil JHOVE est utilisé à la BnF et prend en charge l'extraction du profil ICC à partir de sa version 1.18. Il fournit un rapport technique complet incluant des métadonnées techniques pour les images au format Metadata for Images in XML (MIX). On peut également citer d'autres outils permettant d'extraire certaines métadonnées : Apache Tika et Exiftool.
  • Pour la validation, JHOVE dispose d'un module de validation TIFF. Celui-ci est en outre capable d'avertir de la présence de tags TIFF inconnus. Néanmoins, le module ne s'avère pas capable de repérer des fichiers tronqués. Dans le cadre du projet européen PREFORMA, un profil d'application restreint aux fonctionnalités considérées comme durables a été développé : TI/A. L'outil DPF Manager, financé par le projet européen PREFORMA, permettait notamment de vérifier la conformité d'un fichier TIFF aux exigences TI/A. La maintenance de cet outil étant compromise, il est prévu de l'intégrer à l'outil JHOVE (information en date du 14 mars 2024)
  • Pour la consultation des tags TIFF, il existe l'outil AsTIFFTagViewer. Une composante de la bibliothèque LibTIFF, TIFFINFO permet également de récupérer des informations sur un fichier TIFF ; elle fonctionne en ligne de commande.

Usage ou présence dans les collections de la BnF

Le format TIFF a été utilisé depuis le début de la numérisation de conservation à la BnF, au début des années 1990. Il s'agit du format le plus représenté dans ses collections numériques. Depuis 2014, le format est progressivement remplacé par le format JPEG 2000 dans les nouveaux marchés de numérisation.

Clone this wiki locally