Les jeux de données ou "dataset"
Afin de qualifier au mieux les jeux de données, un ensemble de propriété va être défini.
Chaque propriété de ce jeu de donné aura une valeur.
Cette valeur peut être
- unique ou multiple,
- des valeurs de base, des chaînes de caractères, des entiers, ...
- des URI qui référencent d'autres données
- issu d'un ensemble de valeur que nous appelons vocabulaire.
Norme utilisée
Un jeu de donnée peut suivre plusieurs normes :
- https://www.dublincore.org/specifications/dublin-core/dcmi-terms/dcmitype/Dataset/
- https://www.w3.org/TR/vocab-dcat/#Class:Dataset
- https://ec-jrc.github.io/dcat-ap-jrc/#dataset
Enregistrement des jeux de données dans Virtuoso
Nous devons distinguer les graphes des catalogues.
Un jeu de donnée (dataset) est rattaché à un catalogue via un triplet <catalogueURI> dcat:dataset <datasetURI>
.
C'est cette dernière information qui permet de connaître de manière sûre l'ensemble des jeux de données d'un catalogue.
Ce triplet est injecté dans un graphe. Plusieurs graphes sont disponibles.
- un graphe public, qui contient des ressources (catalogues, jeux de données, distribution) accessible librement, sans authentification.
- plusieurs graphes communautaires, un par communauté, contenant des ressources accessibles (et contribuables) aux membres de ces communautés
- plusieurs graphes privés, un par utilisateur, contenant des ressources propriété de l'utilisateur
Il est ainsi possible d'insérer un jeu de donnée dans un catalogue de différentes manières :
- un jeu de donnée qui appartient à un graphe utilisateur (et donc privé) ET relié à un catalogue appartenant au graphe public
- dans ce cas, seul l'utilisateur du graphe correspondant pourra voir ce jeu de donnée dans l'arboresence
- et l'administrateur de la plateforme
- un jeu de donnée qui appartient à un graphe communauté relié à un catalogue de ce même graphe
- visible par les membres de la communauté
- un jeu de donnée qui appartient à un graphe utilisateur (et donc privé) d'un catalogue lui aussi sur ce graphe utilisateur
- seul l'utilisateur le voit