Data Patch

De Resilience Territoire


Data Patch est logiciel libre, décentralisé et indépendant pour publier des données, les éditer, les valoriser, et les co-produire avec une communauté

💼 Porté par Co-demos, Jailbreak


Description : Data Patch est un logiciel open source en cours de développement proposant une solution indépendante et libre au problème de partage de données et de contribution ouverte.

Ce projet est né d'une expérience collective, celle du recensement des lieux d'inclusion numériques par les hubs numériques régionaux (PiNG, CONUMM, Rhinocc, Ternum), de la valorisation de ces bases de données ouvertes (cartographies interactives), et du besoin de faciliter la mise à jour de ces données par chaque communauté. Les hubs en charge de ces recensements sont souvent des structures associatives, avec peu de personnels dédiés à la question des données (surtout sur un sujet aussi précis). Plus fondamentalement c'est bien chaque communauté qui possède la connaissance, connaissance qu'il faut transformer en base de données. C'est bien chacun des membres de la communauté qui doit pouvoir à la fois accéder aux données mais surtout pouvoir y contribuer simplement. La base de données devient alors un véritable commun numérique.

Le besoin est donc double : partager de données, et permettre une modération des contributions libres. Un tel besoin pose en fait les questions suivantes :

  • Comment garder la maîtrise de ses données, savoir où elles se trouvent, qui y a accès, gérer les droits ?
  • Comment permettre à chacun de partager des données d'intérêt général, qu'elles puissent être facilement compréhensibles par les citoyens mais aussi interopérables avec d'autres services numériques ?
  • Comment faire un outil d'open data grand public, que le design soit pensé de telle sorte que tout citoyen puisse contribuer sans avoir un diplôme de polytechnicien ?
  • Comment améliorer des jeux de données en simplifiant la contribution de chacun, sans capter les informations personnelles ?
  • Comment éviter la centralisation à outrance des plateformes de partage de données, privées ou publiques (Google, Airtable, Open Data Soft, data.gouv.fr...), tout en garantissant l'interopérabilité des données ?
page d'accueil







En tant que projet de logiciel libre l'ensemble du code source est librement réutilisable, et toutes les données hébergées sur les différentes instances du logiciel peuvent être ouvertes par les utilisateurs à plusieurs niveaux (ouvrir en lecture, en collaboration, en modification directe...).


Vision du projet et définition considérée de la résilience

Data Patch a pour but que  :

  • des internautes puissent proposer librement des améliorations (corrections, ajouts, suppressions) à des données ouvertes par des producteurs de données ;
  • les producteurs de données puissent modérer ces propositions (accepter, corriger, refuser) tout en gardant la main sur l'hébergement et la gouvernance de leurs données (gestion des droits en lecture / écriture).
  • les données publiées puissent circuler et être valorisées, partagées, avec des services autres, par exemple des cartographies ou des listings interactifs.

Data Patch a pour ambition de permettre à chacun d'éditer et de publier des jeux de données, que ce soit pour un usage particulier, public ou citoyen.

Le cas typique est celui d'une structure comme un hub territorial (collectivité, association, entreprise, citoyen) qui créée un jeu de données et qui souhaiterait mobiliser sa communauté pour l'améliorer. Par exemple il pourrait s'agir de données recensant des lieux d'accompagnement sur un territoire, des listes de produits dangereux, des listes de références bibliographiques, des listes de résultats électoraux, les lieux de reconditionnement de matériel informatique....

Notre définition de la résilience et son lien avec les outils numériques est détaillé plus bas (cf. §2). Toutefois nous considérons que la capacité de résilience des territoires tient à leur capacité à produire, échanger, et valoriser des informations, et de pouvoir le faire en incluant les acteurs territoriaux de toute taille. C'est en ce sens ce projet peut être considéré comme participant à une meilleure résilience numérique des territoires car il vise :

  • Une meilleure maîtrise de l'open data territorial : alléger la dépendance à des outils et des infrastructures propriétaires, fermés, et opaques ; maîtriser l'outil de publication de données publiques ; gérer les droits des utilisateurs en lecture / écriture / contribution...
  • Une mise à jour des données collaborative et modérée : simplifier le parcours de contribution / modération sur des jeux de données ; rendre intuitif le parcours de contribution (sans inscription), avec un parcours de deux clics pour modérer les contributions par le ou les administrateurs du jeu de données.
  • Une mise en valeur des citoyens contributeurs : la contribution des communautés, au-delà de l'aspect purement technique/data, sera mise en valeur que ce soit graphiquement (heatmap des contributions, historique des versions) ou par un système de communication (envoi d'emails de remerciements et de commentaires entre producteurs/modérateurs et contributeurs).
  • Une meilleure intelligibilité de l'open data : la comptabilité avec des outils de valorisation de données type cartographies interactives (Apiviz), data-visualisation...


Fonctionnalités

Les fonctionnalités de base de Data Patch sont multiples afin de rendre son utilisation la plus simple et ouverte possible :

  • Identification sécurisée oauth2, validation du compte par email, récupération de son mot de passe par email ;
  • Import et export de jeux de données sous divers formats (csv, xls, gsheet, github...) ;
  • Système de notifications à la fois par mail et dans le back office permet aux modérateurs de valider ou non les propositions, le tout en un parcours de deux clics ;
  • Travail sur l'UX, drag & drop des objets manipulables (espace de travail, jeux de données, lignes, colonnes...) pour un usage intuitif ;
  • API requêtable par des sites tiers (CORS) et sécurisée pour des usages et une valorisation sur des services tiers ;
  • Multilingue, pour un usage au-delà des frontières de l'hexagone ;
  • Publication sur des services tiers ;


page espaces de travail
page groupes
préférences et options d'un jeu de données
page d'édition d'un jeu de données
























Un commun numérique pour DES communs numériques

Le projet Data Patch revendique un statut de commun numérique à plusieurs niveaux :

  • Le code source comme commun en tant que tel, ouvert intégralement, fait de l'outil lui-même un commun numérique. N'importe qui peut ainsi participer à l'amélioration du code source, selon les règles d'usage en matière de contribution sur des logiciels ouverts (sur Github ou Gitlab) : création ouverte de "tickets" ou "issues" pour relever des bugs ou proposer de nouvelles fonctionnalités, gestion collaborative de la roadmap ; système de relectures croisées des améliorations du code par l'équipe maintenant le logiciel (pull request) ; etc ...
  • Les données publiées avec Data Patch en font un instrument permettant à des communautés de créer de communs de données. En mettant à disposition un outil libre et gratuit pour manipuler collaborativement des données. Celles-ci sont appelées à être entièrement gérées par les communautés elles-mêmes. Chaque communauté peut elle-même définir ses propres règles afin de déterminer qui a le droit de les lire, de les modifier, de proposer des modifications, comment ces données sont valorisées et visualisées...


Synergies avec d'autres projets de communs

Nous avons identifié dans le wiki d'autres projets de communs avec lesquels il serait intéressant de trouver des synergies, nommément :

Tous ces projets ont pour point commun de chercher à cartographier / recenser des initiatives sur des territoires différents et avec des communautés de contributeurs identifiées. Tous ces projets sont spécifiques dans leur périmètre territorial et les thématiques auxquelles ils cherchent à répondre, toutefois la constitution de base de données collaborative est pour tous ces projets une problématique transverse et récurrente et pose la question de l'outillage.

Dans chacun de ces projets le porteur cherche à recueillir auprès de sa communauté des savoirs dispersés afin d'en produire une base de données structurée et largement consultable. Cette base de connaissances commune s'appuie sur la contribution de tous les membres, puis doit être mise à jour en continu au fur et à mesure que la communauté s'agrandit.

Dans chacun de ces projets on peut donc facilement imaginer qu'il y aura un besoin immédiat d'un outil adapté pour la contribution, simple, ne s'adressant pas à des spécialistes du numérique, ouvert, et qui permette la publication / valorisation de la base de donnée produite.

Ce sont précisément des cas d'usages recherchés par le projet Data Patch. Comme nous cherchons à le démontrer dans cet appel à communs, il nous semble qu'un tel outil n'existe pas encore en tant que tel, et que son développement nécessite un financement propre. La complexité technique (authentification, droits, contribution, API, interfaces, interopérabilité...) et le soin à apporter à l'expérience utilisateur (design pensé pour un large public), engendrent à eux seuls des coûts importants en terme de R&D.

En mutualisant la R&D et en proposant un outil libre et générique comme Data Patch on éviterait ainsi la dispersion des ressources dans chacun des projets. Cette mutualisation serait de fait une économie directe pour ces projets. Ils pourraient alors allouer plus directement leurs ressources sur leurs thématiques et leurs actions spécifiques.




...

Organisations utilisatrice ou intéressée par utiliser la ressource : Co-demos, Jailbreak

Contributeurs :

Défi auquel répond la ressource : 1- Connaissances - Ressources, 3- Mieux décider ensemble

Autre commun proche : Agora des solutions citoyennes, Boîte à outils des circuits courts, Démarche CodeSocial, Espace de documentation pour les entreprises face aux risques naturels et technologiques majeurs, Impulser des dynamiques collectives vers la résilience locale: méthodes et outils, Infolab du territoire, J'agis pour la biodiversité dans mon quartier, OSCARTES, Ressources pour la production en commun de semences paysannes

Richesse recherchée : Cas d'usages, Financement, Expérimentation, Contributeur - Communauté

Compétences recherchée : Général/Approches, Général/Enjeux, Facteurs de résilience/Gouvernance, Facteurs de résilience/Infrastructure, Facteurs de résilience/Instruments

Communauté d'intérêt :

Type de licence ? Creative Commons, GNU Affero General Public License

Niveau de développement : Preuve Concept & 1er client

Cloud / Fichiers : https://github.com/co-demos/fastapi-boilerplate, https://github.com/co-demos/datapatch-front

Capture d’écran 2021-05-19 à 17.12.11.png

Tags : Base de données, Contribution, Modération

Catégories : Logiciel, Données, Connaissance

Thème : Général/Enjeux, Facteurs de résilience/Gouvernance, Facteurs de résilience/Infrastructure

Candidat Appel à Communs : candidat 18 Juin

Référent ADEME :

Référent du commun : Jpy


Les 5 parties ci dessous sont à remplir obligatoirement pour analyser le commun et vous conseiller

Candidat Appel à Communs : candidat 18 Juin

Montant Aide souhaitée (en Euro) à l'Appel à Communs Résilience : 63700

1.Détails du Financement :

Plan de financement, chronogramme

Le financement demandé a pour objectif de permettre la réalisation du MVP (Minimal Viable Product) de Data Patch. Data Patch est un projet déjà en cours de développement. La phase de conception s'est étendue entre mars et avril 2021. Actuellement Data Patch est en phase de développements depuis fin avril 2021. Toutes ces phases ont jusqu'ici été réalisées bénévolement.

Le montant de l'aide demandé correspond à 66,4 % du budget global du projet. Le budget global se répartit en plusieurs catégories de dépenses :

  • Gestion de projet : 9.5% ;
  • Développements - contribution/modération : 58.4% ;
  • Design : 13.1% ;
  • Développements - cartographie : 2.9% ;
  • Documentation / tutoriels : 8.0% ;
  • Développements - admin sys : 8.0%.


Le plan de financement, le rétroplanning sur 6 mois, ainsi qu'une visualisation récapitulative sont détaillés et téléchargeables via les liens suivants :


Justification de l'éligibilité

  • le Commun vise bien des défis identifiés : "Connaissances - ressources", "Mieux décider ensemble" ;
  • le porteur a un statut juridique lui permettant de recevoir des aides publiques : le porteur est une entreprise, son taux actuel d'aide est compatible avec la demande d'aide ;
  • A COMPLETER --- les fiches Acteurs des structures impliquées sont renseignées sur le Wiki ;
  • la fiche commun est renseignée sur les 4 blocs (financement, résilience & territoire, impacts environnementaux et Synthèse) et l'auto-diagnostic ;
  • les choix liés à la licence et au modèle de développement du commun sont explicités et justifiés

La licence Affero GPL ou MIT pour le code source ; pour les données les licences sont celles de choisies par les utilisateurs avec un large choix de licences libres pour les bases de données ; pour les livrables la licence est CC 3.0 BY FR.

Le projet de commun produira des livrables sur une durée courte (6 mois).


Financement post Appel à communs

Le modèle économique post Appel à commun reposera sur l'accompagnement et sur le soutien des utilisateurs. Pour rester cohérent avec la philosophie d'un projet de logiciel libre et accessible Data Patch n'a pas vocation à fonctionner, ni avec un système d'abonnement, ni en valorisant les données hébergées (jeux de données ou données personnelles) avec la publicité. Il est vital que son financement et son modèle économique soient indépendants de toute injonction uniquement commerciale ou publicitaire.

Les partenaires du projet recherchent des financements complémentaires auprès de collectivités ou d'organismes nationaux (ANCT). Le modèle de développement du commun est pour l'instant de le compléter et le maintenir au fil des opportunités de financement sur projet (contrat privé ou marché public), sur appel à communs (aides publiques), ou plus simplement en valorisant l'accompagnement de porteurs de projets de communs numériques (aide à la structuration des données, méthodologie, sensibilisation à l'open data, ...) .

Il enfin est envisagé de faire appel au financement participatif (ou crowfunding). Note : Le lien indiqué ici revoit vers une page Tipee en préparation et sur laquelle n'a pas encore été engagé de communication.

Pensées comme complémentaires de la co-production par le bénévolat et des acteurs publics, les campagnes de crowdfunding permettront à la fois de diversifier les sources de financement, d'élargir la communication autour du projet, et de développer le nombre d'utilisateurs et de contributeurs.


Justification du mode de financement

Lors d'un projet de service numérique - qui plus est avec un logiciel libre - les coûts de développement initiaux sont incompressibles (création du MVP). Un logiciel libre visant à proposer une facilité d'utilisation proche de services tels que GSheet ou Airtable ne peut être développé et amélioré qu'en faisant appel à des compétences spécifiques. Ce projet demanderait d'être développé à temps plein, seul ou en équipe. Idéalement Data Patch nécessiterait a minima 3 ou 4 temps pleins, et cela sur plusieurs années : un.e développeu.r.se full-stack / frontend, un.e devops / data engineer, un.e designer UI/UX, voire un business developer... Dans l'industrie cela représenterait aujourd'hui des salaires variant entre 3000 €/mois net à 5000 €/mois net. Cet investissement initial pour un logiciel libre, gratuit et cherchant à rester gratuit, n'a pas le profil pour attirer pas les investisseurs privés en masse. De fait les développements déjà réalisés sur Data Patch l'ont été grâce au bénévolat. Mais un telle situation de bénévolat n'est pas tenable sur la durée.

Le financement via des subventions publiques est aussi un aspect qu'il s'agit de soigneusement étudier pour assurer l'indépendance du projet. Néanmoins - en dehors du présent appel à communs - la question de la dépendance aux subventions et au pouvoir politique ne se pose que très rarement lorsqu'il s'agit de développer un outil libre d'intérêt général à la fois générique, ouvert, et "from scratch".

L'administration finance effectivement des logiciels libres, mais en général dans deux cas assez spécifiques :

  • soit il s'agit d'un besoin très circonscrit d'une administration ou d'un service, réduisant alors le champ d'usage à un public très restreint et souvent spécialiste. Cités comme des réussites les solutions issues de l'éco-sytème betagouv / datagouv sont pourtant de cet ordre. Les plateformes créées et gérées par des services centraux (Premier Ministre, ministères) peuvent accentuer un mouvement de centralisation des données, parfois de mise en silo, du fait de leur spécialisation sectorielle ou des publics utilisateurs. De plus la complexité technique des systèmes historiquement mis en place freine grandement la réutilisation des logiciels par d'autres acteurs moins aguerris techniquement ;
  • soit il s'agit de la réutilisation d'une solution libre déjà existante portée par une structure privée, privant ainsi la puissance publique de sa capacité à développer en propre des projets ou produits numériques d'intérêt général.

L'Etat reste encore le mieux loti en termes de moyens pour se doter ou développer des outils numériques innovants. Au niveau régional ou départemental, penser et financer le développement "from scratch" de solutions numériques libres reste l'exception ou le privilège d'agglomérations importantes comme à Lyon ou Paris. Dans le reste des territoires ou de la société civile (associations, fondations, entreprises) ne subsiste que l'offre d'acteurs privés en capacité de mobiliser des capitaux à la mesure des défis techniques que supposent ces services : Open Data Soft ; Microsoft ; Google, etc...

Les coûts de ces services propriétaires sont très variables mais il peut se révéler compliqué d'en estimer le poids réel. Un service "gratuit" comme Google Sheet se paie par un hébergement de données sur des serveurs appartenant à Google puis par la récupération des données personnelles par cette société ; des services par abonnement comme Open Data Soft ou Airtable se paient soit par une sur-facturation dépendant de l'usage plus ou moins intense de l'outil (facturation à l'usage de l'API, au flux de données) ou encore par la limitation de certaines fonctionnalités majeures (limitation du nombre de personnes dans un groupes par exemple)...

Bref, que ce soit par manque d'outils répondant à un besoin particulier, de compétences en propre / internalisées, d'une forte centralisation, ou encore du peu de financements dédiés, au final l'offre de solutions libres et immédiatement utilisables par des acteurs locaux se révèle plutôt maigre. Les acteurs publics territoriaux ont pourtant l'obligation d'être conformité avec la loi sur l'ouverture des données publiques.

En tant que nation nous peinons ainsi à nous donner les moyens de développer les outils numériques essentiels d'une réelle infrastructure numérique démocratique, décentralisée, citoyenne et faire que chacun puisse partager des données sur des outils libres, les améliorer, le tout de façon décentralisée mais inter-opérable... Pour amorcer la réalisation d'une telle infrastructure l'appui de la puissance publique nous semble autant essentiel qu'au coeur de sa mission de service public.



...

2.Détails Résilience et Territoire :

Contenu sur la résilience territoriale

Comme nous y reviendrons plus bas nous estimons que la capacité de résilience des territoires tient à leur capacité à produire, échanger, et valoriser des informations, bref à faire circuler le savoir propre à une géographie. Aujourd'hui une grande partie de l'information et du savoir est numérisée ou peut potentiellement l'être. Ajoutons qu'une grande partie de ce savoir est aussi détenue par les citoyens ou des acteurs privés comme les associations maillant le territoire (1,5 millions d'associations en France).

Pour faire face aux nombreuses crises passées, actuelles ou à venir (qu'elles soient climatiques, sociales, ou sanitaires), les acteurs publics locaux, nationaux, les associations, entreprises et citoyens doivent pouvoir se coordonner et échanger des informations. Bien que la production d'information soit historiquement très centralisée en France (administration d'Etat, presse...) il est devenu évident qu'il existe un besoin de mieux faire circuler l'information et mettre en avant les actions des acteurs locaux, surtout en période de crise. La situation est d'autant plus critique que dans un même mouvement l'information est devenue pléthorique, que les crises se montrent de plus en plus brusques et soudaines - notamment en ce qui concerne la crise sanitaire mais bientôt aussi la crise climatique, et que les actions à mener en réponse doivent se concrétiser rapidement sur le terrain.

Penser la résilience territoriale dans ce contexte implique de repenser les infrastructures informationnelles, et plus précisément ce qui nous concerne les infrastructures logicielles de données. Qu'elles soient publiques ou privées ces infrastructures sont aujourd'hui globalement des plateformes (SAAS), centralisatrices (Etat ou GAFAM), et leur maîtrise échappe largement au citoyen et aux associations. Cette situation de dépendance verticale et/ou de dépendance technologique engendre une invisibilisation des acteurs territoriaux. Cette invisibilisation représente un risque majeur en situation de crise lorsque ce sont ceux-là mêmes les premiers à répondre au niveau local.

Nous pensons que le contexte actuel impose de manière urgente la création et la mise à disposition d'outils numériques libres pour les acteurs essentiels de l'action locale que sont les citoyens et les associations, mais aussi les petites et moyennes collectivités. Ces outils de résilience numérique doivent permettre de : échanger des informations ; co-construire des bases de connaissances communes ; les diffuser et les valoriser à toutes les échelles géographiques ; de décentraliser l'hébergement du savoir ; et enfin d'avoir la maîtrise ces outils numériques.


Lien et ancrage territorial

hub numérique PiNG - base de données : fiches des lieux
hub numérique PiNG - base de données : cartographie interactive
hub numérique PiNG - base de données : fiche détaillée

Les premiers partenaires du projet - soit les hubs numériques Occitanie, Pays de la Loire et Bourgogne France Comté - sont responsables du recensement des lieux d'inclusion numérique au niveau régional. Leur travail de recensement s'appuie sur leur connaissance fine de ces lieux, à leur ancrage historique justifiant leur statut de référent local sur cette thématique. Chaque hub est au contact de plusieurs centaines de lieux comme le montre leurs cartographies :

Sans les recensements des hubs, le travail de ces acteurs / lieux d'inclusion numérique serait peu visible auprès d'instances telles que la région ou les ministères, mais également auprès des publics locaux visés (agents en charge de rediriger des citoyens vers les structures locales adaptées).

Les 'hubs' ont 4 missions :

  • Recenser, articuler et coordonner les acteurs de la médiation numérique pour faire converger les projets vers des priorités territoriales définies avec les collectivités ;
  • Lever des fonds et aider à mobiliser toute sources de financement (notamment européennes) en montant des projets à plus grande échelle ;
  • Mutualiser et apporter de la valeur aux acteurs de terrain en créant des centres de services partagés (mutualisation de parcours de formations pour les aidants, partage d’outils et de ressources humaines…) ;
  • Évaluer l’efficacité des services rendus sur le territoire et en informer les collectivités et les instances de pilotage au niveau national.

La valeur et la qualité de ces recensements sont ainsi très liés à cette relation entre un "hub régional" et sa communauté d'acteurs locaux : le hub est historiquement légitime pour être un référent central pour tous les acteurs, et les acteurs eux-mêmes possèdent la connaissance de leur lieu. Ensemble ils co-construisent des bases de connaissance, le hub jouant un rôle de coordination et de diffusion essentiel.

Notre communauté d'utilisateurs actuelle se décompose comme suit :

  • Les 4 hubs régionaux membres du groupement : Occitanie ; Pays de la Loire ; Bourgogne Franche Comté. Chaque hub possède lui-même une communauté d'acteurs et de lieux de taille variable.
  • Chaque hub alloue en général 2 à 3 personnels en interne, responsables du recensement.
  • En tout ces 4 hubs ont recensé environ 1800 lieux / acteurs.

La communauté des hubs numériques est une communauté qui ne se résume pas à ces seuls 4 hubs. En tout ce seront à terme 11 hubs qui couvriront le périmètre de cette mission pour un numérique inclusif pour le territoire français. La communauté d'utilisateurs est donc appelée à grandir. Conséquemment les bases de données que ces hubs partageront entre eux ou avec l'administration centrale seront elles aussi appelées à s'étoffer. Il est donc certain que le besoin de rendre ces données interopérables, compréhensibles, et le besoin de faciliter leur mise à jour ne fera que devenir plus pressant.


Description de la communauté Territoire

Les territoires à partir desquels nous travaillons sont ceux sur de ces hubs numériques : Occitanie, Pays de la Loire, Bourgogne Franche Comté. Les communautés avec lesquelles nous à travaillons seront donc celles des hubs numériques partenaires, c'est-à-dire les lieux d'inclusion numérique. Ces communautés représentent environ 1800 lieux et donc d'acteurs actuellement, comme on peut le vérifier sur les cartographies mises en lien plus haut.

En développant sur un temps relativement court (6 mois) et avec des cycles courts de développement (voir le chronogramme plus haut), nous chercherons à vérifier et à mesurer avec ces groupes nos différentes hypothèses de travail, à ajuster nos objectifs, et à intégrer ces retours dans la feuille de route du projet (fonctionnalités, accompagnement, etc...). Les questions principales que nous chercherons à poser :

  • L'outil est-il facile à prendre en main par les producteurs de données ?
  • L'outil est-il facile à prendre en main par les contributeurs / la communauté des producteurs ?
  • L'outil peut-il être facilement être installé en propre par les services techniques du producteur de données ? Ce besoin d'indépendance technique est-il exprimé ?
  • L'outil permet-il de valoriser correctement les données mises en commun (tableurs partagés, cartographie interactives, formulaires...) ?
  • Une relation se tisse-t-elle correctement entre un producteur de données et sa communauté (email, message, notifications...) ?


Justification du/des défis choisis

  • Défi "Ressources - connaissances" : le projet Data Patch vise à la fois à contribuer à créer des nouvelles connaissances numériques mises en communs (des jeux de données ouverts, collaboratifs et contributifs ), et à proposer une ressource / outil numérique ouvert précis, libre, permettant cette création de bases de données collaboratives.
  • Défi "Mieux décider ensemble" : par son principe de contribution ouverte sur les données et ses fonctionnalités d'échanges directs entre producteurs de données et citoyens contributeurs (messages, mails), le projet Data Patch cherche à améliorer la qualité de jeux de données publics, à instaurer un lien plus direct et de confiance entre producteurs de données et citoyens, et à simplifier la production/diffusion/circulation de nouvelles informations sur le territoire.


Impact du commun sur la résilience

Nous avons précédemment évoqué comment la capacité de la résilience des territoires tient à leur capacité à produire, échanger, et valoriser des informations relatives à une géographie ou une thématique particulière. Cette capacité est déterminée à la fois par la compétence technique des individus, par les moyens financiers des structures, par la relation de confiance entre citoyens et représentants de la puissance publique, mais aussi par les outils à leur disposition.

Les services techniques des collectivités ou les structures para-publiques qui produisent des données d'intérêt public utilisent au quotidien majoritairement des outils de type tableur, en ligne (GSheet, Airtable, ...) ou installés sur leur ordinateur (Excel, Open Office). Malheureusement ces outils ne répondraient qu'à une partie de toutes les contraintes d'une approche open data complètte :

  • produire des jeux de données : en saisie directe ou en important des fichiers locaux ou distants ;
  • mettre à jour et améliorer des jeux de données de manière collaborative ou non : corriger des inexactitudes ; ajouter ou supprimer des entrées ; ajouter ou supprimer des colonnes, ... ;
  • publier des données : les rendre accessibles à des services tiers ; les exporter sous divers formats, les re-publier sur d'autres plateformes ... ;
  • valoriser des jeux de données : cartographie ; listes ; filtres ; exports... ;

A quelques exceptions près comme BaseRow ou FramaCalc les services en ligne sont pour l'ensemble des outils propriétaires. Leur le code source est fermé, leurs serveurs sont invisibilisés (le "cloud"), et leurs coûts peuvent se révéler prohibitifs à long terme. Les coûts d'abonnement sont parfois calculés en fonction du nombre de requêtes (Open Data Soft), du nombre de collaborateurs au sein d'un groupe ou en fonction du nombre de jeux de données mis en ligne (Airtable)... Des coûts qui paraissaient modiques au départ peuvent alors augmenter exponentiellement au fur et à mesure que s'ajoutent les jeux de données et nouveaux utilisateurs.

Une réelle résilience des acteurs des territoires en termes de systèmes d'information et de bases de données implique que les acteurs territoriaux puissent avoir une maîtrise complète de leurs outils : qu'il s'agisse a maxima d'une maîtrise de leurs outils numériques (codes sources) et des bases de données, ou a minima d'avoir voix au chapitre dans la gouvernance de ces outils (la manière dont ils sont développés, leur coût, les fonctionnalités à ajouter, etc...).

Le projet Data Patch se propose comme une réponse à ce problème en garantissant à fois la transparence d'un projet open source et une architecture décentralisée. Ajoutons qu'une des fonctionnalités nodales de l'outil est la contribution ouverte et la modération des contributions. L'outil proposé vise de cette manière à consolider des liens avec une communauté autour de thématiques particulières. Cette fonctionnalité apparaît centrale pour à la fois permettre d'améliorer des données de manière non invasive, et d'installer une relation de confiance entre les usagers/citoyens et les producteurs de données.


...

3.Détails Impacts environnementaux :

Estimation des Impacts et Gains Environnementaux à court et moyen termes

Il serait compliqué de prouver les gains environnementaux directs ou à court terme de l'usage de Data Patch. On peut estimer que l'outil puisse néanmoins avoir un impact indirect, du moins quand il est utilisé dans le cadre de projets à caractère environnemental tels qu'on en trouve dans cet appel à communs.

Comme nous l'avons détaillé plus haut dans l'introduction, le projet Data Patch à pour première externalité positive de permettre aux porteurs de projet de mieux cibler leur ressources humaines et financières sur leur action spécifique, et non dans des développements numériques et techniques sortant de leur champ de compétences.

Data Patch propose simplement un moyen qui facilite la constitution de bases de connaissances ouvertes et améliorables par des communautés. Data Patch aura donc plutôt pour effet de catalyser l'action des porteurs de projets, qu'il s'agisse de mobiliser ou sensibiliser autour de thématiques environnementales au sens large, de les cartographier, de les planifier, ou de les documenter.


Publication de certaines données environnementales en open data

Le logiciel Data Patch a pour principale fonctionnalité de faciliter la publication en open data de tout type de jeu de données. La licence choisie lors de l'ouverture des jeux de données est de la responsabilité des producteurs de données. Les licences proposées par l'application Data Patch font toutefois la part belle aux licences libres.


Lien avec la communauté Open Data

Les participants au projet connaissent bien les acteurs de l'open data en France. Le lien serait à renforcer surtout avec les communautés Open Data France, Datactivist, APRIL, ADULLACT, AFUL, la MedNum ainsi qu'avec les associations et collectivités locales sensibles aux problématiques de l'open data et du logiciel libre (Réseau Français des Fablabs, région Occitanie, ou le département de Loire-Atlantique par exemple).


...

4.Synthèse du projet de Commun :

Expérience du porteur de Commun dans le domaine

  • Julien Paris - Collectif Co-demos : après une formation initiale d'architecte DPLG puis dans la recherche je me suis reconverti dans le numérique en tant que développeur fullstack. Je développe uniquement des logiciels ouverts et je milite ainsi à ma manière pour soutenir le mouvement de l'open data et du logiciel libre. Ces dernières années j'ai principalement travaillé pour des institutions ministérielles (Bercy, CGET, Agence Bio), inter-ministérielles (DINUM), des associations et think tanks acteurs de l'intérêt général (PiNG, Ternum, Rhinocc, Décider Ensemble), ainsi que des structures publiques comme des bibliothèques près de Nantes. J'ai aussi participé au programme "Entrepreneur d'Intérêt Général" d'Etalab en 2018. J'ai produit des outils numériques libres permettant la publication et la visualisation de données : Apiviz, baromètre des résultats des politiques publiques, tableau de bord des aides aux entreprises, Solidata, Synapse...


Informations liées au Commun et au problème identifié

Le projet répond à 2 objectifs principaux, chacun faisant écho à un défi :

  • Défi 1-Connaissances - Ressources // Objectif : Proposer un outil libre et une plateforme ouverte facilitant la production de communs numériques (bases de données ouvertes) : c'est-à-dire simple à prendre en main par les producteurs de données ou les citoyens, techniquement stable, peu chronophage pour les producteurs de données ;
  • Défi 3-Mieux décider ensemble // Objectif : Consolider des communauté thématiques autour de ces communs numériques.


Description des actions, livrables et planning associé en proposant des points de passage (communauté/commun à tel niveau d'ici 3, 6, 9, 12 mois)

Comme vous pourrez le voir dans le chronogramme téléchargeable plus haut le chantier budgété dans le cadre de cet appel à communs est planifié sur 6 mois. Ceci ne nous empêche pas d'anticiper des actions au-delà de cette période (indiquées ci-après comme "hors périmètre chiffré").

La raison de ce phasage à 6 mois est la suivante. Dans le cas d'un projet d'innovation numérique une étape essentielle est de réaliser la preuve de concept fonctionnelle de l'outil développé, encore appelée "MVP" (Minimum Viable Product). Au terme de cette phase il doit être vérifié que l'outil fonctionne techniquement, que sa conception et son architecture permettent d'en faire un véritable logiciel libre (simple à installer / instancier), et que la communauté des premiers utilisateurs peuvent apporter des retours en continu lors de cycles courts de développement.

Ce n'est qu'au terme de cette phase primordiale qu'est la validation du MVP en étroite relation avec les premiers utilisateurs (en l'occurrence les hubs numériques) que des actions ultérieures pourront être possibles. Ce n'est qu'après la réalisation du MVP qu'il sera pertinent de penser à de nouvelles actions et de leur trouver des modes de financement propres.

À 3 mois - dans le périmètre chiffré

  • Code source intégralement ouvert (déjà en place) ;
  • Développement et mise en production de la version beta de l'outil, comprenant les fonctionnalités de base : import, export, édition, authentification, gestion des droits, module de contribution
  • Tests utilisateurs auprès de la communauté des hubs numériques ;

À 6 mois - dans le périmètre chiffré

  • Intégration des retours utilisateurs issus de la première phase ;
  • Documentation d'installation et tutoriels d'utilisation ;
  • Amélioration des fonctionnalités de collaboration en temps réel ;
  • Interopérabilité avec des solutions existantes de data-visualisation et de valorisation de données : Open Street Map, Apiviz....
  • Dockerisation des codes sources pour une instanciation / réutilisation simplifiée ;

À 9 mois - hors périmètre chiffré

  • Ajout de modules de visualisation : fiches, tableur, kanban, calendrier .... ;
  • Développement des fonctionnalités permettant une décentralisation et une industrialisation de la solution : Activity pub ;
  • Cycles/sprints d'amélioration continue ;
  • Elargissement du premier cercle d'utilisateurs à des

À 12 mois - hors périmètre chiffré

  • Industrialisation de la solution : appel à intérêt auprès de structures régionales et départementales en France métropolitaine et DOM/TOM, étude de cas d'usage à l'international (Espagne, Angleterre, Italie).


Taille de la communauté de contributeurs et d'utilisateurs impliquée

Notre communauté d'utilisateurs actuelle se décompose comme suit :

  • Les 4 hubs régionaux membres du groupement : Occitanie ; Pays de la Loire ; Bourgogne Franche Comté. Chaque hub possède lui-même une communauté d'acteurs et de lieux de taille variable.
  • Chaque hub alloue en général 2 à 3 personnels en intterne, responsables du recensement.
  • En tout les 4 hubs ont recensé environ 1800 lieux / acteurs.

La communauté des hubs numériques est une communauté qui ne se résume pas à ces seuls 4 hubs. D'autres territoires


Estimation du Rapport Coût / Impact du Commun dans le domaine de la résilience

L'évaluation de l'impact direct de ce commun numérique sur la résilience d'un territoire est très difficile et ne peut se mesurer qu'à moyen terme. La réflexion sur le type d'indicateurs à créer pour cette évaluation est encore ouverte : économies financières réalisées par les structures ? économies en terme de temps ? montée en compétences ? ...

On peut pourtant estimer qu'en mutualisant le développement et la mise en place de Data Patch des économies d'échelles seraient mesurables. Si l'outil était utilisé - ne serait-ce que par une petite portion - des projets listés dans la description au paragraphe "Synergies avec d'autres projets de communs" il serait possible de déterminer l'économie réalisée.

On peut imaginer un scénario inverse, où chacun de ces projets mettrait en place des outils différents de gestion de base de données, ad hoc, non génériques, même libres, par de prestataires différents... Le coût d'un tel investissement peut facilement se chiffrer en milliers voire dizaines de milliers d'euros (que ce soit en développement ou en conseil) pour chaque projet.

La raison d'être du projet est bien de mutualiser la R&D d'un besoin générique et récurrent, dans tous les projets où un producteur de données (type hub numérique régional, association) est appelé à co-construire une base de connaissances avec une communauté plus diffuse. L'amortissement que permettrait la mutualisation et la mise à disposition d'un tel système d'information est conséquent. Il limiterait le risque à la fois de saupoudrage de l'argent public et d'obsolescence des solutions numériques réalisées.

Le projet Data Patch présente l'avantage de ne pas être spécifique à un territoire et d'intégrer dès sa conception la possibilité de pouvoir être utile à des projets très différents sur le fond, mais qui ont tous ce même besoin de constituer des bases de connaissances communes.

Le logiciel est entièrement open source, il s'appuie sur des communautés open source (librairies Python, framework Javascript très utilisées et pérennes) et s'ouvrira rapidement à celles de l'open data (Open Data France, Datactivist), permettant la reprise du code par une large communauté de développeurs et d'investir les financements dans le développement de l'outil tout en en faisant bénéficier toutes les communautés porteuses de projets territoriaux.



...

5.Autodiagnostic :

Le problème est-il défini ? seul ou par plusieurs personnes ?

La formalisation du diagnostic et du problème originel ont été le fruit d'une expérience et d'un travail commun entre les hubs numériques (Rhinocc, CONUMM, PiNG), et les porteurs de projet. Cette formalisation s'est traduite d'abord par une proposition de besoin sur la plateforme de consultation de l'ANCT ainsi qu'une première proposition de projet.

Le problème est bien celui de faciliter la mise à jour de ces données ouvertes et d'intérêt général. Ces données sont de fait des communs numériques, co-construits d'une part par une structure responsable de collecter, et d'autre part par une communauté plus ou moins large de contributeurs.

Le but est de résoudre ce problème sans passer par des logiciels propriétaires. Cela demande la mobilisation de savoirs techniques spécifiques, une attention au design, et une conception/ingénierie spécifique à un projet de logiciel libre. C'est à ce constat que nous (porteurs de projet et partenaires) avons collectivement abouti, maintenant après plus d'un an à travailler de concert sur des projets de recensement de lieux à l'échelle régionale, le tout avec des moyens très limités.


Généralisation du problème

Le problème plus généralement c'est que le "cloud" c'est l'ordinateur de quelqu'un d'autre. Les données personnelles ou produites par des institutions publiques ou des entreprises privées font rarement exception.

Qu'on ait besoin de cartes interactives, de listes des fiches, des filtres de sélection, bref dès qu'on a besoin d'un site vivant et agréable il faut bien stocker des données quelque part, les rendre accessibles mais protégées du piratage, et être certain de comprendre leur gouvernance.

Que vous utilisiez Google Sheet ou Airtable vos données (tableurs, listings, textes...) sont stockées sur des serveurs et par des sociétés (GAFAM) sur lesquelles nous - citoyens, internautes lambda, petites structures, associations, parfois administrations - n'avons aucun que très peu voire aucun levier pour vérifier ce qu'il en est fait. A une époque où l'échange d'informations fiables est devenu un sujet critique il est semble dangereux qu'une poignée sociétés privées, souvent extra-européennes, soient de fait en situation de monopole sur les infrastructures de partage de données.

Au-delà du problème technique et monopolistique il existe un autre angle mort, celui de la contribution ouverte et de la modération. Le temps de la donnée produite d'"en haut" est en passe d'être révolu. Les citoyens et utilisateurs sont de plus en plus demandeurs de ne plus être considérés comme de simples consommateurs d'information, mais bien comme des participants, des contributeurs.

Que ce soit sur les réseaux sociaux ou les plateformes de contenus ou d'open data, la contribution ouverte bute souvent sur le problème de mise à jour ou de modération. La méthode de modération des plateformes / réseaux sociaux propriétaires est essentiellement réalisée ex post par la plateforme elle-même : chacun peut écrire ce qu'il veut, ce qu'il écrit est immédiatement publié, est visible par tous, et si - et uniquement si - le contenu est signalé ce sont des employés de plateforme qui se chargent de supprimer le contenu...

Pour que les informations gagnent en qualité il est nécessaire qu'elles puissent être relues par des pairs, modifiées, validées, avant d'être enfin re-publiées... Une personne seule ne suffit pas pour ce travail, il est toujours nécessaire et préférable de mobiliser une intelligence collective.

A l'heure de l'économie de l'attention on peut comprendre en quoi les GAFAM n'ont pas d'intérêt économique à améliorer la qualité de l'information grâce aux utilisateurs, mais qui causerait un "ralentissement" des flux permanent de données sur leurs plateformes. Les startups traditionnelles n'ont d'ailleurs aucun intérêt à laisser des internautes contribuer sur une plateforme sans qu'ils y troquent des informations personnelles (email, âge, préférences, etc...). A notre sens ce n'est pas un hasard que seuls des services ouverts et libres comme Wikipédia ou Framasoft se soient emparés de ce problème.


Y a-t-il d’autres contributeurs prêts à travailler sur ce Commun ?

  • Dans le cadre de nos expériences communes dans le domaine du partage de données ouvertes et de cartographie ou de data-visualisation, nous sommes au contact avec une quinzaine d'"acteurs métier" qui partagent la vision de notre projet. Ces acteurs sont aussi des promoteurs de l'open data. A ce stade ce ne sont pas des contributeurs à proprement parler, mais chacun des échanges aide à préciser le besoin.
  • Ce ne sera pas notre rôle de "porter" une communauté d'intérêt particulière. En revanche si le projet est retenu et qu'il prend de l'ampleur, nous prévoyons plutôt de porter notre effort sur les personnes de type "parties prenantes" pour : identifier de nouveaux acteurs intéressés par notre proposition ; identifier des bugs à corriger ou des fonctionnalités à ajouter ; voire à terme de créer une sorte de "collège" d'utilisateurs. Ces personnes pourraient devenir contributeurs, peut-être prescripteurs, et initier alors une véritable communauté.
  • Enfin, Data Patch faisant un usage d'autres logiciels libres pour fonctionner, les auteurs de ces logiciels contribuent indirectement à ce commun.


Préciser la compréhension du contexte, la définition considérée de la résilience et l'impact du Commun sur le défi considéré

Ces points sont détaillés dans la partie n.2 "2.Contenu Résilience et Territoire", mais on pourrait les résumer ainsi :

  • Dans un contexte où les crises (climatiques, sociales, ou sanitaires) s'accentuent et s'accélèrent, le rôle des acteurs locaux (associations, collectivités, citoyens) est essentiel pour garantir des réponses concrètes et efficaces au niveau territorial. Le risque est que pour des raisons structurelles (centralisation) ou techniques (plateformisation, GAFAM) ces acteurs soient invisibles aux yeux de la puissance publique centrale.
  • Notre définition de la résilience territoriale se focalise sur la capacité des territoires à mettre à la disposition de tous ces acteurs locaux des infrastructures informationnelles / numériques efficaces pour créer des communs de connaissances numériques, tout en évitant les écueils de la centralisation et de la plateformisation propriétaire qui priveraient ces acteurs de la maîtrise de leurs outils numériques.

Notre projet cherche à avoir un impact double, en résonance avec les défis 1 et 3 :

  • Défi "Ressources - connaissances" : contribuer à créer des nouvelles connaissances numériques mises en communs (des jeux de données ouverts, collaboratifs et contributifs ), et à proposer une ressource / outil numérique ouvert précis, libre, permettant cette création de bases de données collaboratives.
  • Défi "Mieux décider ensemble" : améliorer la qualité de jeux de données publics, instaurer un lien plus direct et de confiance entre producteurs de données et citoyens, et simplifier la production/diffusion/circulation de nouvelles informations sur le territoire.


Est-ce que les contributeurs sont structurés via une association, entreprise pour recevoir des financements ?

Le porteur de projet est une entreprise.


Est ce que les besoins sont exprimables pour développer le commun ? oui/non

Oui, une première phase de formalisation commune des besoins a été réalisée afin de formuler une proposition dans le cadre de la consultation de l'ANCT :

Développer le commun suppose pour nous d'élargir la base de premiers utilisateurs à partir de celle que nous représentons actuellement, ceci lors de cycles courts de R&D. La première communauté et première utilisatrice est celle des référents régionaux Hubs Numériques ou France Connectée avec lesquels nous travaillons depuis plus d'un an :

  • Rhinocc - hub numérique Occitanie ;
  • PiNG - hub numérique Pays de la Loire ;
  • Ternum - hub numérique Bourgogne Franche Comté ;
  • CONUMM - hub France Connectée ;

Cette communauté est elle-même représentative d'environ 1800 lieux ou acteurs territoriaux. Notre premier objectif sera d'abord de mieux qualifier / ajuster l'outil (retours utilisateurs), puis d'élargir l'utilisation/adoption de l'outil par d'autres hubs numériques sur le territoire français - ou si le projet était retenu d'en proposer l'usage à d'autres projets retenus dans cet appel à communs ( cf. §"Synergies avec d'autres projets de communs" dans la description ).

En parallèle ou après la première phase de réalisation (MVP), il s'agira d'élargir l'adoption de l'outil par d'autres référents locaux acteurs de la transition écologique ou de l'innovation sociale. Une exploration à l'international est également envisageable. Le logiciel est dès sa conception conçu comme multilingue et certains partenaires possèdent des homologues à l'international.

Pour développer davantage le commun, l'objectif à terme sera de constituer des collèges d'utilisateurs, parties prenantes (associations ou acteurs publics). Le rôle de ces collèges sera à la fois de faire remonter des besoins, et de participer à l'essaimage / adoption de l'outil sur de nouveaux territoires et par de nouveaux acteurs (rôle de prescription).


Quels sont les besoins à ce jour pour passer à l'étape suivante  :

  • conseils
  • sur le sujet des communs
  • conseils sur le sujet de la résilience
  • mentorat
  • accès à des données
  • accès à des cas d’usages
  • besoin d’expérimenter en situation “réelle” (usager, infrastructures)
  • des contributeurs et d’autres parties prenantes
  • accès à des financement



...


Liste des CR d'atelier en lien avec ce Commun Data Patch: aucun pour le moment


Suivi des actions

Search actions Add an action See this page for more information
Open
+ A faire0
+ En cours0
+ Fait0