Skip to content
Bertrand Caron edited this page Sep 7, 2023 · 27 revisions

MPEG-1/2 Audio Layer III (MP3) Statut

Description

MPEG-1/2 Audio Layer III, plus connu sous son abréviation « MP3 », est la spécification audio des standards MPEG-1 et MPEG-2. Il s'agit d'un format de compression audio avec perte fondé sur des recherches psycho-acoustiques menées par le Fraunhofer Institute à partir de la fin des années 1980. La méthode d'encodage repose sur des filtres visant à éliminer les informations sonores peu perceptibles par l'oreille humaine. Elle permet une réduction importante de la taille du flux de données audio (CPO-COM) tout en conservant une qualité de restitution couramment jugée acceptable, et donne le choix du débit selon le compromis taille-qualité souhaité. Depuis 2017, tous les brevets du Fraunhofer Institute portant sur ce format sont arrivés à échéance ; il est donc désormais totalement libre de droits (CPO-LIB).

Le format MP3 n'est pas recommandé comme format de données audio en vue de la préservation à long terme, car sa compression avec perte, appliquée à chaque enregistrement, est susceptible, à l'occasion de futures opérations de préservation, de dégrader un signal déjà écrêté. À défaut de disposer des données dans un format alternatif, sa robustesse (CPO-ROB), sa simplicité (CPO-SIM) et l'arrivée à échéance des brevets portant sur lui (CPO-LIB) en font un format facilement préservable.

Sociabilité

Depuis la fin des années 1990, il est devenu l'un des formats de musique numérique les plus répandus, bien que des codecs plus performants (AAC, Vorbis, Opus, etc.) soient apparus depuis.

Il est de ce fait très largement géré par les logiciels de streaming audio, matériels audiovisuels et autres baladeurs, et également par tous les navigateurs. Dès le début des années 2000, des réseaux d'échange sur Internet via des logiciels de partage de fichiers tels que Napster ont beaucoup contribué à l'adoption de ce format par les consommateurs.

Il est utilisé comme format de diffusion majoritaire pour les livres audio sur support optique et téléchargement.

Contenu

Le format MP3 est une simple concaténation de frames audio, éventuellement suivies (ID3v1) ou précédées (ID3v2) de métadonnées ID3. Une extension non officielle Xing a défini un en-tête, situé dans une frame initiale, destiné à porter des métadonnées techniques sur les frames audio (nombre, longueur, etc.).

Les données audio MP3 ont des fréquences d’échantillonnage de 32 kHz, 44,1 kHz ou 48 kHz avec un nombre de canaux audio de 1 à 6. Un fichier MP3 peut être mono, double mono, stéréo, joint stéréo ou multicanal (MP3 Surround). Les canaux peuvent être groupés (cas du joint stéréo et du multicanal 5.1 surround) pour tirer parti de la corrélation intercanal et augmenter la compression. Le débit binaire peut varier entre 8 et 320 kbit/s en fonction du taux et du mode de compression choisis.

Le taux de compression varie en fonction du débit binaire (bitrate) choisi : plus ce dernier est bas, plus le taux de compression est élevé et plus le signal est altéré. Ce format de compression avec perte utilise différentes méthodes : algorithmes de regroupements de données identiques, filtrage des hautes fréquences, application d’une courbe en fonction de l’audition humaine, suppression de signaux quasiment inaudibles et utilisation d’un modèle psycho-acoustique de compression (« effet de masque »).

On notera également que différents modes de compression sont utilisables : CBR (Constant bitrate) pour un débit fixe, VBR (Variable bitrate) pour un débit variable visant à maintenir une qualité d’écoute théoriquement constante, et ABR (Average bitrate) qui est un compromis entre les deux premiers types. Si le mode de compression VBR offre le meilleur rapport entre qualité et compacité, seul le mode CBR permet de diffuser un fichier en streaming.

Outre les données audio, et métadonnées internes au format ID3, la version 2 d'ID3 dispose d'un champ image pour intégrer un visuel (tous les formats d'image sont acceptés, mais les formats JPEG et PNG sont recommandés pour des questions d'interopérabilité).

Organisme de maintenance et documentation de référence

Le format est normalisé par le groupe Moving Picture Experts Group qui maintient les standards ISO/CEI 11172-1 (MPEG-1) et ISO/CEI 13818-3 (MPEG-2).

La British Library a réalisé une évaluation de ce format pour la préservation à long terme.

Identifiants

Registre Identifiant
Wikidata Q42591
Bibliothèque du Congrès fdd000012
PRONOM fmt/134
Just Solve the File Format Problem MP3

Caractéristiques techniques

Un des avantages majeurs de MP3 est sa résilience (CPO-ROB) : les fichiers dans ce format restent presque toujours lisibles malgré des altérations (fichiers tronqués, mal formés, etc.). Les pratiques d'extraction et de conversion en vue de l'échange de musique ont conduit à la circulation de très nombreux fichiers plus ou moins invalides au regard de la norme, sans que cela ait nécessairement un effet perceptible lors de leur restitution.

Bien que cela soit une pratique rare, il est possible d'intégrer à chaque frame une empreinte numérique CRC. En cas d'altération du flux audio, on peut ainsi identifier la partie du fichier corrompue.

Les fichiers MP3 peuvent intégrer des mécanismes de gestion des droits numériques (DRM), notamment ceux diffusés par iTunes de 2003 à 2009.

Outils connus par la BnF

Il n'existe pas d'outil de validation officiel ni développé par la communauté de la préservation numérique. On pourra néanmoins utiliser avec profit les utilitaires suivants.

  • MP3 Validator, également appelé « MP3val », est un outil libre de vérification et de réparation de fichiers MP3 permettant de repérer certaines irrégularités (fichier incomplètement téléchargé, en-têtes mal formés notamment).
  • mp3_check propose également la vérification de cohérence entre l'en-tête du fichier et les données audio.

L'outil d'analyse et d'extraction de métadonnées techniques pour la BnF est MediaInfo, qui dispose d'une sortie native dans le format de métadonnées de caractérisation préféré par la BnF, MPEG-7.

Métadonnées internes

Le format MP3 permet d'embarquer des métadonnées internes au format ID3. Deux versions de ce format existent, qui diffèrent notamment par l'endroit du fichier où elles figurent (à la fin pour la version 1, au début pour la version 2).

Plus marginalement, on trouve également des fichiers MP3 comportant des métadonnées au format APE.

Usage ou présence dans les collections de la BnF

La BnF diffuse sur Gallica ses données audio au format MPEG-1 Layer III à un débit constant (CBR) de 320 kbit/s, ce qui équivaut à un taux de compression de 4,8 par rapport à son équivalent au format PCM.

Dépôt légal :

  • La migration de support opérée par la BnF sur les livres audio, conférences et formations reçus par dépôt légal est à l'origine des fichiers MP3 conservés par la BnF.
  • Certains flux rétrospectifs de musique dématérialisée sont attendus au format MP3, en l'absence d'une version non compressée en FLAC ou en WAVE.

Autres missions nationales Le format MP3 est représenté marginalement dans les fichiers adaptés collectés par la BnF au titre de l'exception handicap.

Dons / acquisitions / production interne Des fonds issus de collectes, conférences et entretiens sont présents au format MP3 dans les collections de la BnF.

Clone this wiki locally