Du bruit au signal (et inversement)

Aller au contenu | Aller au menu | Aller à la recherche

mardi 5 janvier 2010

Les métadonnées embarquées dans les documents PDF

Résumé : Depuis son introduction en 1993, le format PDF supporte un jeu très simple de métadonnées internes habituellement nommé Document Info. Il s'agit de six champs textuels libres qui décrivent le document et son moyen de production (Titre, Auteur, Sujet, Mots-clés, Producteur du PDF, Application) et deux champs de type date (Date de création, Date de modification). Adobe a ensuite défini XMP en 2001 et introduit cette dernière technologie progressivement dans tous les formats de fichiers gérés par ses applications. Les documents PDF supportent donc désormais deux types de métadonnées embarquées : le Document Info « historique » et les informations XMP beaucoup plus élaborées. Ce billet décrit trois caractéristiques permettant d'évaluer si un logiciel gère correctement ces métadonnées.

Lire la suite...

vendredi 19 décembre 2008

Nature publie des articles contenant des métadonnées XMP

La revue Nature publie désormais des articles au format PDF contenant des métadonnées XMP.

We now have a complete bibliographic record (including DOI) embedded in the PDF using structured markup. And, moreover, we also have a solid bedrock for adding in any additional metadata should the need arise. This semantic labelling is available on all new issues of Nature and will be added to other NPG titles over the coming months.

Comme on peut le voir sur cet exemple, cet enrichissement sémantique s'appuie sur le vocabulaire PRISM (Publishing Requirements for Industry Standard Metadata), développé par IDEAlliance, qui complète les schémas habituels (Dublin Core, etc.).

Encore un exemple de l'importance croissante que prend XMP comme je le disais dans un récent billet.

Sources:
Nature Now as XMP sur Catalogablog
XMP labelling for Nature sur Nascent, le blog de Nature

lundi 11 février 2008

Éditer les métadonnées des documents PDF

Une petite liste d'outils gratuits pour éditer les métadonnées classiques (titre, auteur, mots-clés, etc.) des documents PDF:

dimanche 10 février 2008

Tournez les pages de votre PDF

Après Scribd et consoeurs, voici Issuu qui non seulement widgétise votre PDF, mais y ajoute ce côté tourne livre si désuet mais qui plait tant et qui manquait à Scribd. Manque plus que le bruit de la feuille ;-).
.../...
Par Hubert Guillaud sur lafeuille
Vu aussi sur Bibliobsession et La mémoire de Silence