-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathrefnoms.inc.php
226 lines (217 loc) · 8.24 KB
/
refnoms.inc.php
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
<?php
/*PhpDoc:
name: refnoms.inc.php
title: initialise et exploite la liste des référentiels et des nomenclatures DiDo
doc: |
La classe RefNom contient:
- la définition des listes de référentiels et nomenclatures avec pour chacun son type, son nom et les formats disponibles
- des modèles de définition des ressources JSON-LD pour le Dataset et la Distribution
- les méthodes pour générer
- la liste des URI des datasets
- la ressource JSON-LD en fonction de l'URI
Point à voir:
- j'utilise 'https://www.iana.org/assignments/media-types/' comme prefix d'URI pour les types de média IANA,
c'est celui qui est utilisé dans les exemples du standard DCAT.
Ces URI ne sont pas déréfençables.
Le W3C recommande d'utiliser 'https://www.w3.org/ns/iana/media-types/' qui sont déréférençables.
journal: |
21/7/2021:
- ajout d'un type aux accessURL et downloadURL
9-11/7/2021:
- création
*/
// construit un ensemble d'Uris par concaténation du préfixe $uriPrefix avec chaque valeur de l'ensemble $setOfIds
function setOfUris(string $uriPrefix, array $setOfIds): array {
$set = [];
foreach ($setOfIds as $id)
$set[] = $uriPrefix.$id;
return $set;
}
class RefNom {
// IANA Media Types
const MEDIATYPE_ROOT = 'https://www.iana.org/assignments/media-types/';
const MEDIATYPES = [
'csv'=> 'text/csv',
'json'=> 'application/json',
'geojson-LOCATION'=> 'application/geo+json', // GéoJSON avec jointure sur LOCATION
'geojson-AREA'=> 'application/geo+json', // GéoJSON avec jointure sur AREA
];
// Liste des référentiels et nomenclatures
// sous la forme [id => ['kind'=> ('referentiels'|'nomenclatures'), 'name'=> {name}, ('theme'=> {theme})?, 'formats'=> {formats}]]
const ITEMS = [
'polluantsEau' => [
'kind'=> 'referentiels',
'name'=> "Référentiel des polluants de l'eau",
'theme'=> 'Environnement',
'formats'=> ['csv','json'],
],
'stationsAir' => [
'kind'=> 'referentiels',
'name'=> "Référentiel des stations de mesures de la qualité de l'air",
'theme'=> 'Environnement',
'formats'=> ['csv','json','geojson-LOCATION'],
],
'stationsEsu' => [
'kind'=> 'referentiels',
'name'=> "Référentiel des stations de mesures de la qualité des eaux superficielles", // à confirmer
'theme'=> 'Environnement',
'formats'=> ['csv','json','geojson-LOCATION'],
],
'ports' => [
'kind'=> 'referentiels',
'name'=> "Référentiel des ports",
'theme'=> 'Environnement',
'formats'=> ['csv','json'],
],
'cog' => [
'kind'=> 'referentiels',
'name'=> "Référentiel du COG",
'formats'=> ['csv','json','geojson-LOCATION','geojson-AREA'],
],
'geozones' => [
'kind'=> 'referentiels',
'name'=> "Référentiel des GéoZones",
'formats'=> ['csv','json'],
],
'bilanEnergie'=> [
'kind'=> 'nomenclatures',
'name'=> "Nomenclature du bilan de l'énergie",
'theme'=> 'Énergie',
'formats'=> ['csv','json'],
],
'cslFilieres'=> [
'kind'=> 'nomenclatures',
'name'=> "Nomenclature des filières du Compte satellite du logement (CSL)",
'theme'=> 'Logement',
'formats'=> ['csv','json'],
],
'cslOperations'=> [
'kind'=> 'nomenclatures',
'name'=> "Nomenclature des opérations du Compte satellite du logement (CSL)",
'theme'=> 'Logement',
'formats'=> ['csv','json'],
],
];
// modèle de ressource dcat:Dataset JSON-LD paramétré par $id et $item
static private function datasetModel(string $id, array $item): array {
return [
'@id'=> "https://dido.geoapi.fr/id/$item[kind]/$id",
'@type'=> 'Dataset',
'title'=> $item['name'],
'description'=> $item['name'],
'theme'=> isset($item['theme']) ? [
ThemeDido::mapping('data-theme')[$item['theme']],
ThemeDido::mapping('uri')[$item['theme']],
]
: [],
'keyword'=> [$item['kind'] == 'referentiels' ? "Référentiel DiDo" : "Nomenclature DiDo"],
'license'=> [
'@id'=> 'https://www.etalab.gouv.fr/licence-ouverte-open-licence',
'@type'=> 'dct:LicenseDocument',
],
'distribution'=> setOfUris("https://dido.geoapi.fr/id/$item[kind]/$id/formats/", $item['formats']),
];
}
// modèles de ressource dcat:Distribution JSON-LD
static private function distribModels(string $format, string $id, array $item): array {
// fin et options pour l'URL de téléchargement en fonction du format
$dlUrlOptions = [
'csv'=> 'csv?withColumnName=true&withColumnDescription=false',
'json'=> 'json',
'geojson-LOCATION'=> 'spatial/geojson?geoField=LOCATION',
'geojson-AREA'=> 'spatial/geojson?geoField=AREA',
];
// titre et description de la distribution en fonction du format
$titles = [
'csv'=> "Téléchargement CSV de $item[name]",
'json'=> "Téléchargement JSON de $item[name]",
'geojson-LOCATION'=> "Téléchargement de $item[name] en GéoJSON avec jointure sur LOCATION",
'geojson-AREA'=> "Téléchargement de $item[name] en GéoJSON avec jointure sur AREA",
];
return [
'@id'=> "https://dido.geoapi.fr/id/$item[kind]/${id}/formats/$format",
'@type'=> 'Distribution',
'title'=> $titles[$format],
'description'=> $titles[$format],
'license'=> [
'@id'=> 'https://www.etalab.gouv.fr/licence-ouverte-open-licence',
'@type'=> 'dct:LicenseDocument',
],
'mediaType'=> [
'@id'=> self::MEDIATYPE_ROOT.self::MEDIATYPES[$format],
'@type'=> 'dct:MediaType',
],
'conformsTo'=> [
'@id'=> "https://dido.geoapi.fr/id/$item[kind]/$id/json-schema",
'@type'=> 'dct:Standard',
],
'accessURL'=> [
'@type'=> 'foaf:Document',
'@id'=> "https://data.statistiques.developpement-durable.gouv.fr/dido/api/v1/$item[kind]/$id/".$dlUrlOptions[$format],
],
'downloadURL'=> [
'@type'=> 'foaf:Document',
'@id'=> "https://data.statistiques.developpement-durable.gouv.fr/dido/api/v1/$item[kind]/$id/".$dlUrlOptions[$format],
],
];
}
// retourne un référentiel, une nomenclature ou une de leurs distributions à partir de son URI
static function getByUri(string $uri): ?array {
if (!preg_match('!^https://dido.geoapi.fr/id/(referentiels|nomenclatures)/([^/]+)(/formats/([^/]+))?$!', $uri, $matches)) {
echo "No match ligne ",__LINE__,"\n";
return null;
}
$kind = $matches[1];
$id = $matches[2];
$format = $matches[4] ?? null;
if (!$format) { // référentiel ou nomenclature
return self::datasetModel($id, self::ITEMS[$id]);
}
else { // distribution CSV/JSON/...
return self::distribModels($format, $id, self::ITEMS[$id]);
}
}
// retourne la liste des URI des jeux de données, cad des référentiels et des nomenclatures
static function dsUris(): array {
$uris = [];
foreach (self::ITEMS as $id => $item) {
$uris[] = "https://dido.geoapi.fr/id/$item[kind]/$id";
}
return $uris;
}
// retourne les référentiels, nomenclatures et leurs distributions comme JSON-LD en sél. les DS dans $uris
static function jsonld(array $uris): array {
$graph = [];
foreach (self::ITEMS as $id => $item) {
$dataset = self::datasetModel($id, $item);
if (!in_array($dataset['@id'], $uris))
continue;
$graph[] = $dataset;
foreach ($item['formats'] as $format)
$graph[] = self::distribModels($format, $id, $item);
}
return $graph;
}
// retourne le schema JSON, utilise le fichier swagger
static function jsonSchema(string $uri): ?array {
if (!preg_match(
'!^https://dido.geoapi.fr/id/(referentiels|nomenclatures)/([^/]+)/json-schema$!',
$uri,
$matches
)) {
return null;
}
$id = $matches[2];
$swagger = file_get_contents(__DIR__.'/import/swagger.json');
$swagger = json_decode($swagger, true);
$schema = $swagger['components']['schemas']["item_$id"];
$schema['type'] = 'object';
return [
'$schema'=> 'http://json-schema.org/draft-07/schema#',
'$id'=> $uri,
'description'=> $schema['description'],
'type'=> 'object',
'properties'=> $schema['properties'],
];
}
};