Skip to content
Bertrand Caron edited this page Oct 30, 2024 · 20 revisions

Microsoft PST Statut

Description

Microsoft PST, ou « Personal folders file », est un format propriétaire (CPO-LIB) mais documenté (CPO-DOC) permettant d'enregistrer des messageries électroniques, leur organisation en dossiers et leurs contenus associés (pièces jointes, mais aussi contacts, entrées d'agenda, tâches, etc.). Il dépend étroitement de son logiciel de création, Microsoft Office Outlook.

L'usage principal du format est de disposer d'une sauvegarde locale, éventuellement accessible hors ligne, de messageries.

Bien que le format soit propriétaire, Microsoft le diffuse sous une licence relativement permissive : Open Specification Promise.

Sociabilité

Le format est très largement adopté par les particuliers et les administrations (CPO-SOC) du fait du caractère longtemps hégémonique du client de messagerie Outlook Express et du logiciel de serveur de messagerie Microsoft Exchange Server, qui restent aujourd'hui encore parmi les logiciels de leur type les plus utilisés (CPO-OUT).

Versions

La variante du format créée par le pack Office dans sa version 1997-2002 repose sur un encodage de caractères ANSI ; depuis 2003, le format repose sur Unicode. En outre, la taille maximale des fichiers est différente entre les deux versions (2 Gio pour la version 1997-2002, 20 Go pour les versions 2003 et 2007, 50 Go à partir de la version 2010).

Le format est mature mais toujours évolutif (CPO-STA) : au 1er janvier 2023, huit révisions majeures ont été réalisées depuis la version 1.0 de la spécification publiée en 2010.

Contenu

Le texte des messages contenus dans un PST peut être encodé de trois manières différentes : en texte brut, en HTML ou en RTF. Il arrive que les outils autres que ceux de Microsoft ne les gèrent pas tous.

Le format PST peut embarquer tout type de fichier en pièce jointe. Une table des fichiers attachés permet de savoir aisément si chaque message en contient.

Organisme de maintenance et documentation de référence

La société Microsoft reste l'organisation de maintenance du format et publie sa spécification (version actuelle, version archivée).

Identifiants

Extension : .pst.

Type MIME non officiel : application/vnd.ms-outlook-pst.

Registre Identifiant
Wikidata Q29651120 (famille de formats)
Q29651210 (version 1997-2002)
Q29651228 (version 2003-...)
Bibliothèque du Congrès fdd000377 (version 1997-2002)
fdd000378 (version 2003-...)
PRONOM x-fmt/248 (version 1997-2002)
x-fmt/249 (version 2003-...)
Just Solve the File Format Problem Personal_Folder_File

Caractéristiques techniques

Le format étant binaire et sa structure éclatée, sa transparence (CPO-TRA) et sa simplicité (CPO-SIM) sont limitées ; son utilisation est soumise à la disponibilité d'un logiciel adapté à sa restitution. En outre, le texte des messages peut être chiffré et un mot de passe peut être exigé pour lire le contenu du message. Toutefois, ce mot de passe étant enregistré sous forme d'une empreinte CRC-32 dans le fichier, cette protection est jugée faible (CPO-PRO).

Le format PST est autonome : il embarque l'ensemble des contenus nécessaires pour représenter une messagerie. Néanmoins, il arrive régulièrement que les fichiers PST soient accompagnés de fichiers PAB (Personal Address Book) qui contiennent séparément les contacts (CPO-AUT).

Les fichiers PST peuvent s'altérer, en particulier s’ils sont proches de leur taille maximale (CPO-ROB). Microsoft fournit avec Outlook Express un outil de réparation appelé scanpst.exe. La vérification d'intégrité de ces fichiers peut également être compromise par le fait que l'ouverture de ces fichiers par leur application de lecture les modifie systématiquement.

Conçu comme un format de sauvegarde local de données personnelles, il est généralement jugé inadapté aux usages professionnels. Son accès en lecture et écriture est en outre coûteux en ressources disque.

On notera également qu'il est impossible de lancer une analyse antivirus sur les fichiers PST à moins qu'ils soient ouverts dans une application Microsoft (Outlook ou Exchange).

Métadonnées internes

L'en-tête du fichier comprend une déclaration du format et de sa version, permettant une identification aisée par l'ensemble des outils dédiés à cette tâche.

Chaque item contenu dans un PST comprend également un en-tête comprenant de nombreuses propriétés. Concernant les messages, outre les champs habituels de description visibles dans un client de messagerie, l'en-tête en comprend de nombreux autres décrivant l'historique de gestion du message dans le logiciel.

Outils connus par la BnF

Emailchemy est un outil de conversion largement utilisé et reconnu par la communauté de la préservation numérique. Il convertit les fichiers PST vers des formats de messagerie ouverts. Propriétaire également, l'outil Aid4Mail présente des fonctionnalités similaires. La conversion vers MBOX est aussi assurée par la bibliothèque libpst.

Des bibliothèques logicielles ont été développées pour manipuler des fichiers PST, notamment en Java et en C (libpff). En outre, Microsoft avait développé en 2010 deux outils utiles pour la visualisation (PST View Tool) et la manipulation du format (PST File Format SDK, en C#). Leur maintenance semble être interrompue.

Des initiatives lancées par la communauté de la préservation numérique prennent en charge le traitement de ce format :

  • RATOM, pour Review, Appraisal, Triage of Mails combine des outils d'évaluation et de tri de messages électroniques PST et MBOX.
  • Mailbag propose un formalisme d'empaquetage standard d'une messagerie conservée sous de multiples formats (PST est l'un d'eux) - faisant ainsi état de l'absence d'un format idéal de préservation des messageries, et un outil open source pour produire des paquets conformes à la spécification. La spécification s'appuie sur le standard BagIt.

Usage ou présence dans les collections de la BnF

La BnF ne conserve actuellement pas de messageries au format PST.

Clone this wiki locally