Open Data / données ouvertes

Rédigé par J.Y. Bréard Aucun commentaire
Classé dans : E2L Mots clés : open, data, réutilisation
Open Data : qu'est-ce que c'est ?

L’Open Data


Concevoir et coder des logiciels c’est très bien. Si l’on veut créer du code, indispensable, pour déjouer les captations de données par les GAFAM, on peut le faire avec uniquement du code. Par contre, si vous voulez réaliser des programmes permettant de :

  1. afficher le prix des carburants sur une recherche géographique,

  2. optimiser le parcours pour passer par tous les panneaux électoraux d’une commune,

  3. comment se répartissent les collèges et lycées relativement à l’indice de position sociale (IPS),

  4. faire un site donnant le tableau de bord de l’épidémie de COVID19i,

  5. etc.

vous aurez besoin de … données.


Problème : la plupart des jeux de données sont loin d’être gratuits. Le prix de jeux de données privés peut paraître exagéré – il l’est parfois – mais il faut prendre en compte le coût de la collecte et de l’entretien d’un jeu de données qui peut être énorme : combien de (jour x travailleur) faut-il pour constituer un BD géographique sur la France entière ? Même pour un thème donné, par exemple le réseau de distribution d’eau ou le réseau d’évacuation des eaux usées ce peut être considérable.


Mais il y a tout un champ, très important, de données accessibles et réutilisables avec des licences adaptées : les données produites par les administrations françaisesii.


Historique de l’Open Data


En France, cela commence avec la La loi du 17 juillet 1978 portant diverses mesures d'amélioration des relations entre l'administration et le public et diverses dispositions d'ordre administratif, social et fiscal. Celle-ci affirme la liberté d’accès aux documents administratifs et de la réutilisation des informations publiques.

Notez que la loi est désormais classée obsolète, elle a été remplacée par des éléments législatifs postérieurs (voir ci-dessous).


Dans l’esprit des rédacteurs de la loi de 1978, les informations concernées sont les actes administratifs, les dossiers montés par les administrations.


La loi impose des restrictions sur le type d’information communicable. On peut résumer les types de documents non communicables :

  • les documents en cours d’élaboration,

  • les documents en rapport avec la défense nationale, la sûreté de l’État, la sécurité publique, la monnaie, le crédit public… Bref, tout document dont la connaissance par des individus ou États mal intentionnés pourrait mettre en péril la nation.

  • les délibérations du pouvoir exécutif,

  • les documents qui pourraient déroger à la protection de la vie privéeiii.

Dans le même temps, la loi, anticipant les contentieux que les principes qu’elle pose vont amener, crée la Commission d’accès aux documents administratifs (CADA), une autorité administrative indépendante chargée de veiller à la liberté d’accès aux documents administratifs et aux archives publiques ainsi qu’à la réutilisation des informations publiques.


La loi concerne donc des « documents ». Mais son application va entraîner des demandes pour des « données » produites par des organismes étatiques justement spécialisés dans la production de données : INSEE, IGN, Cadastre, SHOM, Météo-France, CEREMA…


Lentement, ces demandes vont amener une évolution et ces données vont être mises à disposition. Pas toutes cependant et ce pour deux raisons :

  • certaines tombent sous le coup des restrictions citées ci-dessus. Il en va ainsi pour certaines données du SHOM par exemple,

  • le plus souvent, l’obstacle est lié aux modèle économique des organismes producteurs. L’État en est venu, au fil du temps, à ne pas couvrir l’entièreté du coût de collecte et structuration des données en demandant aux organismes de compléter le financement en vendant des licences. Passer à une gratuité total mettrait donc en péril la viabilité de la production de données. C’est ce qui a entraîné les ajustements survenus dans les années 2010 avec les exceptions entérinées par décret du 29 novembre 2016.


Allez donc voir sur le site Le site Open Data de l’administration, peut-être y trouverez-vous des idées de développement.


L’état actuel de la législation de l’Open Data en France


Article à suivre : les licences.


iCe site, créé par un analyste de la donnée, était tellement supérieur – en réactivité, lisibilité – aux informations diffusées par les sites étatiques qu’il est devenu de fait le site « officiel ».

iiOn se limitera ici à la France. Des dispositifs analogues sont en place dans d’autres pays.

iiiDans ce cas, on peut recourir à l’anonymisation du lot de données mais cela a un coût.

Écrire un commentaire

Quelle est le premier caractère du mot lceizb2 ?