Open Data, libérez vos données !

image-data

Open ideas ©opensource.com via Flickr CC BY-SA

La lecture du premier article vous a peut-être convaincu de vous lancer dans la démarche de l’open access. Ce billet s’intéresse aux solutions techniques à privilégier pour ouvrir vos données.

Avec l’open data, les données sont accessibles à tout le monde, chacun peut les exploiter. Pour maximiser la réutilisation de vos données il faut choisir un format ouvert pour que vos fichiers soient archivables et interopérables.  Ainsi, leur gestion et leur accès seront facilités.

A titre d’exemple, on peut indiquer que :

  • Si vous avez un fichier texte, le format PDF est facile à produire, lisible par tous et pérenne. Mais il n’est pas modifiable.
  • Si vous avez un fichier texte, l’idéal sera un format Libre Office (ouvert et modifiable) plutôt qu’un format propriétaire.
  • Si vous avez un tableur, le format .csv est plus exploitable et ouvert que le format propriétaire .xls

Et puis on peut commencer petit, pas besoin d’attendre d’avoir une masse importante de données pour les rendre visibles !

Par contre, il est nécessaire de leur donner un contexte qui permette de bien les identifier parmi toutes celles disponibles sur le web. Pensez donc à donner un bon titre à votre document (mettez les mots-clés), une liste descriptive de termes caractérisant le contenu, des informations légales, la licence de réutilisation…Ce réflexe que tout bibliothécaire a naturellement lorsqu’il signale des documents il faut l’avoir aussi lorsqu’on dépose sa production sur Internet. C’est un gage de fiabilité pour la réutilisation.

L’objectif étant que vos données puissent être lues à la fois par des humains et des machines, il est important qu’elles soient documentées en utilisant par exemple le Dublin Core, qui est pauvre mais universel pour tous les types de documents.

Enfin, je rappellerais que, comme dans toutes les administrations de l’Etat, le Ministère de l’Enseignement Supérieur promeut l’utilisation des logiciels libres et des formats ouverts. (cf. Article L123-4-1 du Code de l’Education : « les logiciels libres sont utilisés en priorité ».)

Si vous avez vous-mêmes des exemples de réalisation qui vont dans ce sens, n’hésitez pas à les mettre en commentaire.

Pour aller plus loin :

Anne-Sophie Guilbert

Une réflexion sur “Open Data, libérez vos données !

  1. Bonjour Anne-Sophie,

    Le Dublin-Core que vous évoquez ici, est une toute petite partie du langage de description RDF (xml amelioré) permettant de décrire et de partager des informations sous forme de triplet (Sujet, propriété, Objet).
    Ces informations peuvent être intégrées/cachées dans une page web, c’est ce qu’on appelle le web sémantique, ou enregistrées dans un fichier. On peut également les mettre àdisposition sur un serveur/endpoint accessible par le biais de requêtes Sparql.
    Afin de mettre en place un serveur de données pour héberger des données « Dublin-Core » ou RDF, je vous conseille d’utiliser « Apache Fuseki » qui vous fournira toute les capacités pour stocker vos données et effectuer des requêtes dessus, les modifier.
    Pour toute question complémentaire sur ce sujet, vous pouvez jeter un oeil à cette adresse httpp://smag0.blogspot.fr/p/blog-page_14.html ou me contacter via twitter @dfaveris

    J'aime

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s