Un référentiel pour toute la science

Pour le scientifique, c'est l'esprit qui est le chasseur solitaire. En herbe ou chevronné, dans le brouillard aux frontières de la connaissance, vous êtes seul. Personne ne sera là pour vous guider par la main à la clairière. Vous avez vos instruments, vos facultés critiques et le corpus qui vous a été laissé par vos pairs et vos prédécesseurs… dans le meilleur des cas.

Photo de Cristina Gottardi sur Unsplash

Malheureusement, quel que soit l’institution universitaire, le groupe de réflexion ou le centre de recherche qui vous emploie, il est peu probable que leurs budgets soient sans fond. Par conséquent, la portée de leurs archives, leurs bases de données et leur accès aux revues sont limités.

Là-bas, les bras tendus, embrassés par le brouillard, les scientifiques ont trop souvent trop de problèmes à résoudre.

Premièrement, des données scientifiques utiles sont enfermées dans des silos de connaissances. Il est dispersé sur d'innombrables bases de données déconnectées sur le Web, non seulement par institution, mais également par champs différents. Travailler dans une université peut signifier que vous n’avez pas accès aux ressources d’une autre. Si le budget de votre ministère avait été bouleversé par les priorités l’an dernier, vous pourriez vous retrouver sans accès aux ressources sur lesquelles vous comptiez auparavant.

Deuxièmement, alors que les ensembles de données montent en flèche, mais que les infrastructures informatiques des chercheurs ne parviennent pas à suivre le rythme, la découverte devient une impossibilité de gérer, d’analyser, de filtrer, de trier et de partager ces ensembles de données. Oser des analyses interdisciplinaires vous pose encore plus de problèmes.

Troisièmement, même si vous disposez de l’infrastructure nécessaire pour analyser des ensembles de données volumineux à partir de champs disparates, vos ensembles de données sont probablement incompatibles. Les deux n'étaient pas structurés pour être interopérables. Les domaines de la science ne disposent pas d’une ontologie convenue sur laquelle ils peuvent mapper leurs données et communiquer entre eux.

Pour que les scientifiques se trouvent sur le point de faire une avancée qui ne soit entravée que par le manque de fonds, d’absence d’accès ou de puissance informatique, c’est, si je peux emprunter une expression, monter Science Creek sans pagaie.

Chaque scientifique peut être seul, mais chaque personne s’appuie sur un effort mondial qui aboutit au corpus de connaissances scientifiques et technologiques dont nous disposons aujourd’hui. Et que peut-on accomplir lorsque scientifiques et non-scientifiques s’unissent pour faire avancer une seule tâche?

Regardez des petits groupes qui ont fait des choses incroyables, comme le Harvard Observatory Computers, plusieurs dizaines de femmes qui ont catalogué et classé plus de 10 000 étoiles. Regardez des mégaprojets comme le supercollidé CERN, l'expérience de fusion ITER, le projet du génome humain, le zoo Galaxy et même Wikipedia.

Ces initiatives inspirantes ont galvanisé un très grand nombre de personnes qui croient au pouvoir de la science, à l'innovation issue de la collaboration, au dépassement des limites et à la pensée différente.

Ne serait-il pas plus pratique que toutes les données scientifiques soient stockées dans un seul référentiel ouvert? Ne serait-il pas préférable qu'il y ait une ontologie commune sur laquelle ces données pourraient être cartographiées, afin de faciliter la communication entre les domaines?

Nous construisons ce référentiel.

Photo de Lysander Yuen

L'initiative Science Open Data - SODI

Fondée par The Brane, SODI est en train de créer le tout premier site Web de données scientifiques à vocation générale qui hébergera toutes les connaissances scientifiques, le tout en libre accès.

Comme la redécouverte de la pierre de Rosette par un soldat français lors de la campagne de Napoléon en Égypte, il a fallu un dispositif de traduction pour franchir le gouffre de la connaissance qui remonte au 5ème siècle, lorsque les derniers lecteurs de hiéroglyphes ont été perdus, à Jean-François Champollion. percée utilisant la pierre en 1822.

Tout comme une pierre de Rosette, ou peut-être le poisson Babel du Guide de la galaxie de Hitchhiker, une ontologie unique pour toutes les données scientifiques peut servir de traducteur universel pour communiquer entre disciplines, dissoudre les silos de connaissances et unir toutes les sciences.

La pierre de Rosette a joué un rôle clé dans la réduction des connaissances en 13 siècles. Photo de David Mallett.

Une couche conceptuelle de termes d'index de haut niveau

La structure de ce référentiel est notre ontologie fondamentale. L’interconnexion obtenue à partir de ce système de classification des connaissances permettra à SODI de découvrir des modèles, des lacunes et des connexions significatifs dans tous les domaines et d’accélérer à terme l’innovation et la découverte scientifiques et technologiques.

Mais il y a tellement de données que l’une des équipes ne peut pas créer une telle couche à elle seule. C’est pourquoi ce projet sera un effort de collaboration entièrement à source ouverte et les données resteront accessibles à tous.

SODI appelle tous les scientifiques de données talentueux, les experts en intelligence artificielle et les experts en ontologies du web sémantique à joindre leurs efforts et à consolider toutes les données scientifiques en ligne dans un référentiel ouvert de toutes les sciences.

Nous faisons également appel à tous ceux qui croient en la science et veulent jouer un rôle crucial dans l’avenir de notre civilisation mondiale. Nous invitons des citoyens scientifiques, des défenseurs de l’environnement et des passionnés de science à passer le mot.

Rejoignez tous nos ontologistes du web sémantique, experts en intelligence artificielle, spécialistes de l'information et des données, dans nos Slack et GitHub.

Pour tous les autres scientifiques, voici une pagaie. Laissons cette connaissance silencieuse derrière le monde. Joyeusement, joyeusement.

Pour en savoir plus sur SODI et sur la manière de vous impliquer, cliquez sur moi.