Metadades geoespacials
Autor: Dr. Joan Nunes. Universitat Autònoma de Barcelona
Promotor: Institut Cartogràfic de Catalunya, 2013
Les metadades geoespacials, també anomenades metadades de la informació geogràfica o simplement metadades en el context de la informació geoespacial, són la documentació que descriu les dades geoespacials i en general qualsevol tipus de recurs relacionat amb la informació geogràfica, com és ara mapes, documents, serveis, aplicacions, etc. En el cas de les dades, les metadades descriuen el contingut, la qualitat, l'estructura, el format, l'origen, els procediments d'obtenció, la vigència temporal, l'autor i les condicions de distribució d'unes dades, entre d'altres característiques necessàries per a la seva correcta utilització i citació.
Les metadades no formen part de les dades, per això s'anomenen meta- dades. Les metadades són un document a part (un text, una fitxa, etc.) que acompanya les dades per tal de saber què són, com estan organitzades i com s'han produït les dades, o bé s'enregistren en bases de dades per poder consultar-les en línia dins d'una organització o públicament a través d'Internet. Les metadades també són utilitzades pels programes informàtics per interpretar correctament el format de les dades o per intercanviar informació entre programes per fer possible la interoperabilitat del programari. En aquest darrer cas, alguns formats de dades inclouen dins del mateix fitxer de dades, o en fitxers a part, un conjunt mínim de metadades d'ús per al programa més que no pas per a l'usuari. Amb el temps, però, s'ha anat tendint a unificar el suport de les metadades, particularment per mitjà de fitxers en llenguatge XML.
Exemple de metadades descriptives d'un conjunt de dades geoespacials. Font: https://www.meted.ucar.edu/
Les metadades han guanyat molta importància en les dues darreres dècades a mesura que tota la informació s'emmagatzema i es distribueix per mitjans informàtics, que creix el volum i riquesa de dades disponibles de tota mena, i que el valor de la informació ha esdevingut central per al funcionament de la societat. És a dir, a mesura que es feia realitat l'anomenada societat de la informació.
Les institucions han promogut la definició i adopció d'estàndards de metadades, per tal de descriure de manera unificada el contingut, l'estructura, la qualitat i els procediments de producció de les dades, de manera que es puguin crear bases de dades de metadades a nivell nacional i internacional, les infraestructures de dades espacials (IDE), que permetin als usuaris saber la informació geoespacial que hi ha disponible, triar amb coneixement quina pot satisfer millor les seves necessitats i saber realment què obtenen quan adquireixen unes dades. L'estàndard internacional de metadades geoespacials emprat a Europa i arreu del món és l'estàndard ISO 19115 i altres relacionats. Als EUA es fa servir encara l'estàndard CSDGM de FGDC, anterior, força semblant i que es tendeix a unificar amb l'estàndard ISO.
SUMARI
- Origen
- Definició
- Els estàndards de metadades geoespacials ISO
- Altres estàndards de metadades geoespacials
- Serveis de catàleg de metadades geoespacials
- Cicle operatiu de producció i ús de metadades geoespacials
- Temes relacionats
- Referències
- Lectures recomanades
Origen
El concepte de metadades és tan antic com el de documentació i es desenvolupà particularment en els camps de la biblioteconomia, l'arxivística i el documentalisme, mitjançant el desenvolupament de tècniques de catalogació i de classificació de documents. L'exemple més típic de metadades és el de la fitxa bibliogràfica d'un llibre en el catàleg d'una biblioteca.
El terme metadades s'atribueix a Philip Bagley (1968), que l'utilitzà sobretot en el sentit de descripció de l'estructura de les dades, segons el concepte de metadades estructurals, més que no pas amb el de metadades de contingut, que és el que ha tingut major difusió i aplicacions en els camps de gestió d'informació, tecnologia de la informació, biblioteconomia i, més tard, en els sistemes d’informació geogràfica.
En l'àmbit de la informació digital els primers exemples d'utilització de metadades, lligats precisament al camp de la biblioteconomia, aparegueren a la dècada de 1960 amb la definició i ús dels formats estàndard de catalogació MARC (Machine-Readable Cataloging), internacional, i LCSH (Library of Congress Subject Headings), propi dels Estats Units. En ambdós casos es tractava essencialment de formats d'informatització de la fitxa bibliogràfica tradicional, conforme a la visió històricament predominant en documentació per la qual les metadades són una informació addicional complementària de les dades però no una part essencial d'aquestes. Posteriorment, la complexitat creixent de les tecnologies de la informació i el ràpid desenvolupament de les biblioteques digitals han canviat aquesta percepció de les metadades entre els gestors d'informació. Les metadades actualment no es veuen ja com un element auxiliar passiu que conté la descripció d'un recurs d'una biblioteca, sinó com un component fonamental actiu d'aquest recurs, imprescindible per a usar-lo o gestionar-lo (USGS, 2004).
En el camp de la informació geoespacial els primers esforços per a crear i utilitzar metadades descriptives de les dades geogràfiques daten de la dècada de 1980, als Estats Units, amb la creació l'any 1983 d'un comitè de coordinació de les activitats de cartografia digital de les diverses agències federals, el Federal Interagency Coordinating Committee on Digital Cartography (FICCDC), per tal de poder assimilar el creixement de la informació geoespacial digital a l'època i la gran diversitat de formats i procedències de les dades geogràfiques digitals. Aquest comitè es convertiria l'any 1990 en el Federal Geographic Data Committee (FGDC, 2006a), que el 1992 elaborà l'esborrany del primer estàndard de metadades geoespacials a nivell mundial, aprovat finalment el 1994 amb el nom de Content Standard for Digital Geospatial Metadata (CSDGM) i que és l'estàndard de metadades oficial per a totes les agències governamentals dels Estats Units d'àmbit federal, estatal o local per a documentar conjunts de dades geoespacials digitals (FGDC, 2006b).
Paral·lelament a la creació del que seria el FGDC l'Office Management of the Budget del goven d'Estats Units creà també el 1990, mitjançant la promulgació de la Circular A-16, la primera infraestructura de dades espacials, la National Spatial Data Infrastructure (NSDI), per coordinar la producció, l'ntercanvi i l'ús de les dades geogràfiques entre les organitzacions públiques i privades de tot Estats Units (OMB, 2002). L'any 1994, un cop aprovat l'estàndard de metadades geoespacials CSDGM, l'ordre executiva 12906 establí l'obligació de totes les agències federals de produir metadades estandarditzades per a totes les dades geogràfiques de nova creació a partir de la data.
A Europa, el procés es desenvolupà de forma similar encara que més lentament. L'any 1994 s'introduí també la idea d'infraestructura de dades espacials (Bangemann, 1994), si bé de forma no executiva, tan sols com a recomanació al Consell Europeu. D'altra banda, a finals de 1998 el Comité Européen de Normalisation enllestí una proposta d'estàndard de metadades geoespacials, la norma CEN TC/287 N 449, que donada la proximitat en el temps seria ràpidament substituïda per l'estàndard de metadades geoespacials ISO 19115 Geographic information - Metadata (ISO/TC211, 2003), que fou aprovat el 2003 i gestat en el període 1999-2002 com a harmonització dels diferents estàndards de metadades geoespacials en ús o en projecte, entre els quals i de forma destacada la norma CEN TC/287 N 449.
De manera semblant l'ANZLIC (Australia New Zealand Land Information Council, actualment Spatial Information Council of Australia and New Zealand) va publicar el 1996 la primera versió de les seves directrius de metadades.
A finals de la dècada de 1990 i principis de la de 2000, l'estímul combinat de creació d'infraestructures de dades espacials, per part dels organismes governamentals, i de recerca per aconseguir un major grau d'interoperabilitat del programari de SIG, per part dels fabricants de programari i d'organismes com l'Open Geospatial Consortium (OGC), proporcionà l'impuls decisiu a la creació i ús de les metadades geoespacials per a resoldre tant les necessitats de descripció i difusió de la informació geoespacial, per mitjà de les infraestructures de dades espacials, com d'interpretació i d'interoperabilitat de les dades per part dels programes, per mitjà de formats de codificació, com el popular llenguatge XML (Extensible Markup Language), que facilitessin l'intercanvi de metadades entre programes i a través del web (Chan and Zeng, 2006; Danko, 2008).
Des de mitjans de la dècada de 2000, la disponibilitat de l'estàndard ISO 19115, la consolidació de les infraestructures de dades espacials, el desenvolupament de la tecnologia de SIG web, acompanyat l'emergència del web semàntic geoespacial (Egenhofer, 2002; Fonseca and Sheth, 2002), i la publicació d'estàndards de serveis de catàleg de metadades (OGC, 2007) comportarien dos nous impulsos decisius per al desenvolupament de les metadades geoespacials. D'una part, s'ha produït la normalització de les metadades geoespacials, ja que la majoria d'organismes, infraestructures de dades espacials, programari i usuaris d'arreu del món, han anat adoptant progressivament l'estàndard de metadades geoespacials ISO/TC211 19115, reconvertint els seus fitxers de metadades i reformant els estàndards i formats de metadades prèviament utilitzats com a perfils o subconjunts de l'estàndard ISO 19115, afegint-hi opcionalment elements de metadades addicionals com a extensions formals de l'estàndard ISO 19115. D'altra banda, mitjançant la creació de geoportals, han entrat en funcionament els serveis web de catàlegs de metadades, que permeten la consulta i descobriment públics dels recursos d'informació geoespacial existents arreu del món.
Definició
Les metadades es defineixen habitualment com "dades sobre les dades" (Duval, 2001). De manera més precisa, les metadades són informació estructurada que descriu. explica, localitza o fa possible recuperar, usar o gestionar un recurs d'informació, especialment en un entorn distribuït com la xarxa interna d'una organització o Internet (De Carvalho Moura et al., 1998).
Quan s'integren en els sistemes d'informació com un component essencial per a l'ús dels recursos d'informació, les finalitats o propòsits per als quals poden servir les metadades són segons Haynes (2011) les següents:
- Descripció i identificació de recursos d'informació: les metadades permeten reconèixer l'existència, unicitat i autenticitat de cada recurs d'informació, i proporcionen coneixement sobre el contingut i l'estructura de les dades.
- Recuperació i difusió de la informació: la finalitat principal de les metadades en infraestructures de dades espacials i catàlegs en general és fer possible el descobriment i l'obtenció dels recursos d'informació.
- Gestió de recursos d'informació: les metadades poden servir també, en el treball intern de les organitzacions, per a organitzar l'emmagatzematge, el manteniment, la localització i, en definitiva, la conservació dels recursos d'informació.
- Interoperabilitat: la descripció completa dels detalls de contingut i estructura de les dades permeten, quan és usada pels programes en lloc de pels usuaris, interpretar correctament les dades o recursos d'informació i intercanviar-les i usar-los des de diferents programes.
- Gestió de la propietat intel·lectual i drets comercials: les metadades contenen informació sobre els drets de propietat intel·lectual i drets d'explotació comercial, la qual cosa permet donar-los a conèixer, reforçar-ne el compliment i integrar la informació i normes de propietat en els canals electrònics de distribució.
Addicionalment les metadades poden servir també per a la gestió d'usuaris, tant per a autoritzar l'accés als recursos i resoldre els aspectes de seguretat i confidencialitat, com per a dur el control de l'ús dels recursos (com en el cas del servei de préstec d'una biblioteca) i fer-ne estadístiques.
Finalitats de les metadades. Font: Adaptat de Haynes (2011).
Les finalitats per a les quals poden servir les metadades són prou àmplies i diverses com perquè calgui considerar diferents tipus especialitzats de metadades. L'organització d'estàndards d'informació i documentació nord-americana National Information Standards Organization (NISO) distingeix tres tipus de metadades: descriptives, estructurals i administratives (NISO, 2004). Les metadades descriptives descriuen els recursos d'informació mitjançant elements com títol, autor, tema, resum, etc. per a facilitar-ne la identificació, la recuperació i el coneixement del contingut. Les metadades estructurals documenten l'organització interna dels components del recurs d'informació, les relacions internes entre aquests components i les relacions amb altres components externs al recurs d'informació. Les metadades administratives serveixen per a gestionar els recursos d'informació, mitjançant elements com número de versió, ubicació, data d'arxivament, etc., amb finalitats de gestió de fitxers, gestió de drets i conservació dels recursos. Dins de les metadades administratives solen diferenciar-se dos subtipus: les metadades de gestió de drets i les metadades de conservació. Altres categoritzacions solen coincidir en diferenciar les metadades segons que proporcionin una descripció dels aspectes de contingut o bé dels aspectes estructurals dels recursos d'informació. Així, Bretheron and Singley (1994) distingeixen entre metadades estructurals, o de control, que decriuen l'organització dels recursos d'informació en tant que sistemes o components d'un sistema informàtic, i metadades de guia, que serveixen a les persones per a trobar i conèixer els recursos. De manera semblant, Kimball (2008) divideix les metadades en dues categories, metadades tècniques i metadades de negoci, a les quals afegeix una tercera categoria de metadades de procés.
La principal diferència s'estableix, doncs, entre les metadades estructurals i les metadades de contingut, o metadades descriptives o metacontingut. La majoria dels estàndards de metadades estan dedicats principalment a les metadades de contingut, de les quals n'especifiquen els elements o ítems a documentar (és a dir, cada metadada individual) i l'esquema o organització dels elements de metadades, mitjançant un model de metadades que pot ser jeràrquic, lineal o pla. En els esquemes de metadades jeràrquics els elements de metadades s'associen en cadena formant jerarquies entre elements superiors i inferiors. En els esquemes de metadades lineals, tots els elements de metadades són independents els uns dels altres, raó per la qual es considera un esquema unidimensional. Un exemple ben conegut d'esquema lineal o unidimensional de metadades és el conegut estàndard Dublin Core (DCMI 1995-2012), pensat per a documentar i recuperar recursos tot tipus de recursos web i bibliogràfics. Els esquemes de metadades plans agrupen els elements de metadades segons dos eixos o categories principals.
Per a expressar la informació de les metadades de contingut, estructurada segons un determinat esquema o model de metadades, s'utitlitza la sintaxi d'un o altre llenguatge de marques, com és ara HTML, XML o RDF, o d'un llenguatge de programació. Els llenguatges més emprats per a expressar metadades són els llenguatges de marques, i en particular el llenguatge XML, ja que la informació de metadades, consistent en parells metadada - valor descriptiu, s'acomoda fàcilment a l'estructura bàsica etiqueta-valor dels llenguatges de marques.
Un darrer aspecte a considerar en la definició de les metadades és el major o menor grau d'estructuració de les metadades, l'anomenada granularitat. Les metadades amb una granularitat alta permeten un nivell d'organització i de manipulació tècnica més gran de les metadades que possibilita serveis i aplicacions més sofisticades. En contrapartida, les metadades amb una granularitat baixa proporcionen menys informació però es poden crear i mantenir amb costos molt més baixos i són per tant molt més factibles. Més enllà de la producció, el manteniment de les metadades i de les aplicacions d'ús (edició, publicació, consulta, etc.) de les metadades resulta afectat decisivament pel nivell de granularitat. En particular, un alt grau d'estructuració comporta que, quan les estructures i models de les metadades esdevenen obsolets, la recuperació i aprofitament de la informació de metadades esdevé difícil i costosa. La granularitat de les metadades és un factor de primer ordre a considerar en el funcionament a llarg termini de serveis d'informació basats en metadades com són les infraestructures de dades espacials.
Les metadades geoespacials, i en particular els estàndards de metadades geoespacials, s'han desenvolupat sobretot com a metadades descriptives o de contingut, atesa la finalitat principal d'afavorir el descobriment i recuperació dels recursos d'informació geoespacial, promoguda per les infraestructures de dades espacials que han estat el factor decisiu d'adopció de les metadades en el camp de la informació geoespacial. La part estructural de les metadades geoespacials ha estat abordada en el cas dels estàndards geoespacials del Comité Tècnic 211 d'ISO (Geographic Information) a través de la definició d'esquemes d'aplicació i catàlegs d'elements, mitjançant els estàndards ISO 19109 i 19110, respectivament, (ISO/TC211, 2005a; 2005b). Les metadades administratives no han estat gens desenvolupades en el cas de les metadades geoespacials. En aquest sentit, sense negar la importància de les metadades descriptives i de la publicació de catàlegs de metadades a través dels geoportals de les infraestructures de dades espacials, de cara a la difusió i ús de la informació geoespacial, els professionals dels sistemes d’informació geogràfica han objectat sovint que les metadades geoespacials, tal com resulten de l'aplicació dels estàndards de metadades, no són apropiades per a la gestió i administració de les dades i dels recursos d'informació geoespacial. Paral·lelament, l'alta granularitat de les metadades definides pels estàndards geoespacials, com l'estàndard de metadades geoespacials ISO 19115, en dificultà l'adopció i aplicació inicial, pel gran nombre d'elements de metadades potencialment a documentar i per la complexa organització de l'estructura de metadades en què emmagatzemar-los. La flexibilitat, però, que proporciona l'elevada opcionalitat dels elements de metadades de l'estàndard ISO 19115, ha permès definir conjunts mínims de metadades molt resumits i simples, amb els elements de metadades imprescindibles per a la identificació dels recursos, que resulten fàcils d'aplicar i han permès resoldre la producció massiva de metadades geoespacials que requeria la posada en marxa de les infraestructures de dades espacials (Longhorn, 2005; Semerjian, 2008).
Els estàndards de metadades geoespacials ISO
El Comitè Tècnic 211 de l'organització internacional d'estandardització ISO defineix les metadades descriptives de la informació goespacial mitjançant els estàndards ISO 19115 i ISO 19139, que estableixen respectivament el contingut i estructura de les metadades geoespacials, i la implementació d'aquests continguts i estructures per mitjà del llenguatge XML A més, remet a l'estàndard ISO 19109, de definició de catàlegs d'elements, per a l'especificació de l'estructura i detall de continguts de les dades geoespacials.
Contingut i estructura de les metadades geoespacials: ISO 19115
L'estàndard ISO 19115 Geographic Information - Metadata (ISO/TC211, 2003) és l'estàndard de metadades geoespacials acceptat i implantat arreu del món, al qual s'han anat reconvertint les metadades creades segons altres estàndards previs. De tots els estàndards de la sèrie ISO 19100, dedicada a la informació geogràfica, relacionats amb les metadades ISO 19115 és el més important ja que estableix el contingut i l'estructura (l'esquema o model) de les metadades geoespacials. L'estàndard ISO 19115, publicat el 2003, proporciona una especificació abstracta de l'esquema de les metadades geoespacials, sense indicacions de com implementar-lo. Aquestes indicacions conformen l'estàndard ISO 19139, publicat el 2007. Posteriorment ISO ha ampliat l'estàndard ISO 19115 amb extensions per a dades ràster i d'imatges, que es publicaren el 2009 com a ISO 19115-2.
L'estàndard ISO 19115, segons la pròpia definició, té per objecte proporcionar informació d'identificació, extensió geogràfica, qualitat, esquemes espacial i temporal, referència espacial i distribució de les dades geogràfiques digitals, tot afegint que, si bé l'estàndard és aplicable principalment a les dades geogràfiques, es pot estendre a altres tipus de recursos d'informació geoespacial, com és ara mapes, documents de text i altres (ISO/TC211, 2003). La finalitat principal de l'estàndard ISO 19115 és, com s'ha indicat, facilitar que els usuaris puguin determinar si unes determinades dades pertanyents a una determinada organització poden ser d'utilitat per a ells i com poden accedir-hi. L'estàndard ISO 19115 cerca explícitament promoure l'ús correcte i la recuperació efectiva de les dades geogràfiques, establint una terminologia, definicions, estructures i procediments d'extensió de les metadades. L'estàndard no cobreix l'estructura ni el detall del contingut de les dades, per a la qual cosa remet a la utilització de catàlegs d'elements, definits segons l'estàndard 19109.
Diagrama UML del model de metadades definit per l'estàndard ISO 19115 al nivell més alt de la jerarquia, que mostra les classes corresponents als diferents bloc d'informació, tipus de dades complexos i extensions del model de metadades. Cada una d'aquestes classes es modelitza mitjançant el seu propi diagrama UML. Font: ISO/TC211 (2003).
El contingut de les metadades geoespacials segons l'estàndard ISO 19115 comprèn 12 blocs d'informació descriptiva, inclosa la informació descriptiva de les pròpies metadades (estàndard emprat, codificació, etc.). Aquests blocs són: informació de metadades, identificació, restriccions, qualitat, manteniment, representació espacial (vectorial o ràster), sistema de referència espacial, contingut (explícit en el cas de dades ràster o mitjançant referència a un catàleg d'elements en el cas de dades vectorials), presentació, distribució i esquema d'aplicació. Cada un d'aquests blocs es modelitza com una classe, formada per altres classes inferiors que acaben tenint com a propietats descriptives els atributs individuals de metadades. A més dels blocs d'informació indicats, l'estàndard contempla alguns tipus de dades complexos, modelitzats igualment com a classes, per a les informacions de citació, d'extensió espacial i d'unitats de mesura. Finalment, a fi de permetre l'expansió coherent del model de metadades, l'estàndard ISO 19115 contempla la possibilitat d'afegir extensions segons la mateixa estructura de l'estàndard, cada una de les quals es modelitza també com una classe més.
L'estructura de l'esquema de metadades de l'estàndard ISO 19115 és jeràrquica i recursiva, amb classes que formen part de la definició d'altres classes, totes les quals al nivell més alt de la jerarquia es relacionen amb la classe arrel Informació de metadades. En conjunt l'esquema de l'estàndard ISO 19115 compren més de 300 elements de metadades, entre els quals 86 classes, 282 atributs i 56 relacions. Aquesta estructura complexa es modelitza en forma orientada a objectes mitjançant 16 diagrames UML, corresponents a cada una de les classes principals (blocs d'informació i tipus de dades complexos) i al conjunt del model.
Diagrama UML del model de metadades de l'estàndard ISO 19115 corresponent a la classe MD_SpatialRepresentation, d’informació sobre la representació espacial de les dades. Font: Elaboració pròpia a partir de ForRose model 14-03-2007 disponible a http://www.isotc211.org/.
No tots els elements del model de metadades de l'estàndard ISO 19115 s'han de documentar obligatòriament. En aquest sentit l'estàndard qualifica cada element de metadades segons tres categories que són: obligatori (M, mandatory), condicional (C) o opcional (O).
La categoria obligatori (M) correspon a les entitats o elements de metadades que s'han de documentar sempre.
La categoria condicional (C) indica que sota determinada condició almenys una entitat o element de metadades s'ha de documentar. Les situacions condicionades poden venir donades per alguna de les situacions següents:
- quan hi ha dues o més opcions entre les quals escollir, cal documentar almenys una de les opcions.
- quan s'ha documentat una determinada entitat o element de metadades que implica que cal documentar els que en depenen.
- quan s'ha documentat una determinada entitat o element de metadades amb un determinat valor que comporta que cal documentar altres elements o entitats que n'amplien la informació.
La categoria opcional (O) s'aplica a les entitats o elements de metadades que es poden deixar sense documentar en qualsevol circumstància. Les entitats i elements de metadades opcionals serveixen per a qui desitja documentar completament les dades. Les entitats de metadades opcionals poden contenir altres entitats o elements de metadades que siguin obligatoris, però aquestes entitats o elements no s'han de documentar si no es documenta l'entitat opcional superior.
Cada organització pot adaptar el model de metadades de l'estàndard ISO 19115 a les seves particularitats definint el que s'anomena perfil de metadades de l'estàndard, que és el subconjunt d'elements de metadades de l'estàndard format pels elements obligatoris i condicionals usats més els elements opcionals que l'organització necessita o està en condicions de poder documentar. Els perfils mantenen la compatibilitat del model de metadades estàndard entre organitzacions i alhora fan possible un alt grau de personalització.
L'estàndard ISO 19115 defineix un nucli de metadades (core metadata) que inclou un conjunt mínim de metadades necessari per a cobrir les aplicacions bàsiques. El nucli de metadades està format pels elements de metadades obligatoris i alguns elements opcionals importants fins a un total de 22 elements. El nucli de metadades d'ISO 19115 és només un perfil recomanat. Els elements que comprèn no necessàriament han d'estar inclosos en tot perfil de metadades de l'estàndard.
| ||||||||||||||||||||||
Nucli de metadades de l'estàndard ISO 19115. Font: ISO/TC211 (2003). |
El nucli de metadades d'ISO 19115, d'altra banda, es correspon força però no totalment amb l'estàndard Dublin Core. Altres organitzacions han definit també els seus propis nuclis de metadades dins del seu perfil. Per exemple, el Núcleo Español de Metadatos (NEM), definit per la Infraestructura de Datos Espaciales de España (IDEE, 2010), que inclou part del nucli de metadades de l'estàndard ISO 19115, més els elements necessaris per a completar l'estàndard Dublin Core i alguns altres elements addicionals.
Cal afegir finalment que l'estàndard ISO 19115, a més de ser un estàndard de metadades geoespacials apte no sols per a documentar dades sino també altres tipus de recursos d'informació geoespacial, permet en el cas de les dades documentar característiques descriptives de les dades a nivell d'objecte individual, a nivell de conjunt de dades i a nivell de sèrie.
Les metadades d'objecte documenten un objecte individual dins d'un recurs d'informació concret, amb la finalitat de descriure característiques particulars de la dada o dades relatives a aquell objecte. Per exemple, les metadades sobre una carretera concreta poden servir per a indicar que la informació sobre el seu traçat prové d'una font diferent, com és ara els plànols de projecte en el cas d'una carretera en construcció, que la de la resta de carreteres del conjunt de dades o de la sèrie cartogràfica, la font d'informació de les quals és la restitució fotogramètrica.
Les metadades de recurs documenten un recurs d'informació determinat en el seu conjunt. Les metadades de recurs descriuen, per exemple, les característiques d'un conjunt de dades, d'un servei en línia, d'un mapa o d'un document. Les metadades de recurs són el tipus més habitual de metadades.
Les metadades de sèrie documenten una col·lecció o una sèrie de recursos d'informació que comparteixen característiques comunes de contingut, d'autor o d'altres. Les metadades de sèrie s'utilitzen, per exemple, per a descriure les característiques generals d'una sèrie cartogràfica, comunes a tots els fulls de la sèrie, cadascun dels quals, en tant que conjunt de dades separat, es documenta mitjançant les corresponents metadades de recurs.
L'existència dels diferents nivells i l'estructura el model de metadades de l'estàndard ISO 19115 permet que les metadades de cada nivell heretin les metadades dels nivells superiors, de manera que s'evita la redundància d'informació i es redueix l'esforç de documentació.
Implementació en XML de les metadades geoespacials: ISO 19139
L'estàndard ISO 19139 (ISO/TC211, 2007) proporciona l'esquema d'implementació XML de l'estàndard ISO 19115. ISO 19139 especifica el format dels registres de metadades d'ISO 19115 en XML i serveix per a descriure, validar i intercanviar metadades geoespacials codificades en llenguatge XML. ISO 19139 defineix la codificació XML de les metadades geoespacials i un esquema d'implementació XML derivat d'ISO 19115.
La publicació de l'estàndard ISO 19139 ha fet possible resoldre els problemes d'interoperabilitat de metadades produïdes segons l'estàndard ISO 19115 i codificades en format XML, que és el suport més habitual d'intercanvi de metadades, ja que entre la publicació d'ISO 19115 i la d'ISO 19139 la implementació de les metadades conformes a l'estàndard ISO 19115 en format XML no disposava de directrius específiques d'implementació i cada programa d'edició de metadades generava fitxers XML segons esquemes de codificació diferents, cosa que dificultava l'intercanvi de metadades entre diferents programes i organitzacions.
Altres estàndards de metadades geoespacials
L'estàndard de metadades geoespacials nord-americà CSDGM del FGDC
Malgrat que ISO 19115 està sent ràpidament adoptat com l'estàndard de metadades geoespacials d'aplicació en les infraestructures de dades espacials i en les aplicacions basades en estàndards geoespacials a nivell mundial, resta un bon nombre d'aplicacions basades encara en altres estàndards de metadades geoespacials, principalment als Estats Units, ja que disposaren abans d'un estàndard de metadades propi, l'estàndard Content Standard for Digital Geospatial Metadata (CSDGM) del Federal Geographic Data Committee (FGDC).
L'estàndard de metadades CSDGM és semblant en finalitat i contingut a l'estàndard ISO 19115. Igual que aquell, fou pensat essencialment per a documentar les característiques descriptives de les dades geogràfiques. CSDGM defineix per tant metadades essencialment descriptives, encara que inclou alguna informació estructural més sobre les dades que no pas ISO 19115, i és aplicable principalment a conjunts de dades, més que a altres tipus de recursos d'informació geoespacial. Conseqüentment, CSDGM és més concret que ISO 19115 i inclou dins de les metadades descriptives del conjunt de dades la descripció del detall i estructura del contingut (entitats i atributs) de les dades, ja que no remet a una informació externa a les metadades, com és ara un catàleg d'elements, com fa ISO 19115. CSDGM considera 10 blocs d'informació a documentar en les metadades:
- Identificació. Comprèn la informació bàsica com títol, autor, resum, finalitat, extensió geogràfica, dates de compilació de les dades, data de compleció, data de publicació i restriccions d'accés.
- Qualitat de les dades. Informació sobre l'exactitud de posicionament, l'exactitud temàtica, etapes de processament i llinatge de les dades.
- Organització de les dades espacials. Informació sobre el mètode de representació espacial (ràster o vectorial) emprat per a representar les entitats o fenòmens geogràfics, més el detall i recompte d'elements espacials per tipus d'elements (punts, línies, polígons, etc.).
- Referència espacial. Informació dels sistemes de coordenades horitzontal i vertical, incloent els paràmetres de la projecció cartogràfica, sistema de coordenades i dàtum geodèsic.
- Informació d'entitats i d'atributs. Descripció de cada entitat representada i de cada un dels atributs associats a cada classe d'entitats, incloent nom, tipus de dades, longitud, precisió i domini de valors.
- Distribució. Informació d'accés a les dades que inclou formats de distribució, punts de distribució, URLs, preus i condicions.
- Referència de les metadades. Informació sobre les metadades inclosos l'autor i la data d'elaboració.
- Citació. Referència completa del conjunt de dades, incloent la informació de publicació i de recurs en línia en cas aplicable.
- Informació temporal. Documentació dels atributs temporals del conjunt de dades.
- Informació de contacte. Identificació i dades de contacte de les organitzacions i persones responsables del conjunt de dades.
L'estàndard de metadades general de recursos web Dublin Core
Dublin Core és un estàndard de metadades genèric per a documentar recursos multimèdia en línia, típicament recursos web. Tot i no ser un estàndard específic de metadades geoespacials, el seu caràcter bàsic i la seva popularitat han motivat que sovint es prengui com a guia per a establir el conjunt mínim de metadades geoespacials imprescindibles a utilitzar com a nucli del perfil d'estàndards específics com ISO 19115.
L'estàndard Dublin Core és un model de metadades de recursos web elaborat i promogut per DCMI (Dublin Core Metadata Initiative) amb la finalitat de fomentar l'adopció d'estàndards interoperables de metadades i de promoure el desenvolupament de vocabularis especialitzats de metadades per a descriure els recursos en línia que permetin crear sistemes més intel·ligents de descobriment dels recursos (DCMI 1995-2012). Dublin Core s'implementa també generalment mitjançant XML i fou adoptat com a estàndard per ISO (ISO 15836) l'any 2003. El nom prové de la ciutat de Dublin (Ohio, USA), on es va reunir l'any 1995 el grup d'experts en metadades i web que originà la iniciativa i la definició del model.
L'atractiu i el gran potencial de Dublin Core és la seva simplicitat. Dublin Core consta només de 15 elements de metadades, tots els quals poden ser opcionals, es poden repetir i poden aparèixer en qualsevol ordre. Dublin Core es va dissenyar expressament simple per proporcionar un conjunt de característiques descriptives (metadades) de base, que fossin capaces de proporcionar la descripció bàsica sobre qualsevol recurs, independentment del tipus de recurs, del format d'origen, l'àmbit d'especialitat temàtica o l'origen cultural.
Els 15 elements de metadades de l'estàndard Dublin Core, agrupats segons el tipus d'informació a què fan referència, són els següents:
- Contingut. Comprèn la informació descriptiva del recurs: títol, paraules clau, descripció, font, idioma, relació (indicació d'un recurs relacionat amb el recurs objecte de les metadades) i cobertura (abast espacial o temporal del contingut del recurs).
- Propietat intel·lectual. Aplega les característiques relatives a autoria i drets: autor o creador, editor o distribuïdor, altres col·laboradors i drets.
- Materialització. Són les característiques relatives a la concreció material o instància del recurs: data de disponibilitat del recurs, tipus de recurs, format i identificador del recurs.
Dublin Core té nombrosos avantatges, entre els quals la simplicitat, la flexibilitat, la independència sintàctica, la interoperabilitat semàntica, l'alt grau de normalització i de consens internacional i la modularitat de l'arquitectura de metadades per a la web. Per aquest motiu té nombroses aplicacions en la documentació de recursos en línia, com és ara pàgines web o altres, i és àmpliament utilitzat per si mateix en organitzacions educatives i científiques, biblioteques, organitzacions governamentals i empreses, a més de servir com a inspiració per a definir nuclis bàsics de metadades de la informació geoespacial i d'altres dominis d'informació.
Serveis de catàleg de metadades geoespacials
El conjunt de les metadades descriptives de la informació geoespacial disponible en una organització, en un sistema o, en el cas d'una infraestructura de dades espacials, en un territori constitueix el catàleg de metadades geoespacials, que en realitat, tal com s'ha anomenat posteriorment, és el catàleg de dades geoespacials o, donada l'evolució dels estàndards de metadades vers tot tipus de recursos d'informació geoespacial, el catàleg de recursos d'informació geoespacial (Nogueras-Iso et al., 2010) d'aquella organització, sistema o territori.
Per tal de facilitar la consulta del catàleg de dades geoespacials, cal organitzar les metadades en bases de dades de metadades i utilitzar una aplicació de servidor de catàleg de metadades, que publiqui les metadades en forma de serveis de catàleg interoperables, principalment en forma de serveis web (Di and Bai, 2008). Com en d'altres tipus de serveis d'informació geoespacial es requereixen estàndards específics per tal que els serveis de catàleg puguin ser interoperables. En aquest sentit, Open Geospatial Consortium va publicar la primera versió del seu estàndard per a serveis de catàleg de metadades Catalogue Service (CAT) l'any 1999, al qual afegiria els perfils per al protocol CORBA l'any 2001 i per al protocol Z39.50, emprat en les aplicacions documentals i de biblioteques, l'any 2002. Finalment, el 2004 reformulà el model general de servei de catàleg i la implementació mitjançant el protocol HTTP, coneguda com araCatalogue Service for Web (CS-W). La versió actual, 2.0.2, data de 2007 (OGC, 2007).
Open Geospatial Consortium (OGC) defineix l'estàndard OpenGIS Catalogue Services Specification per mitjà d'un model abstracte i de diversos models d'implementació que estableixen les interfícies entre clients de consulta i servidors de catàleg. Els serveis de catàleg són aplicacions que permeten publicar i consultar les metadades descriptives de recursos d'informació com dades, serveis i altres productes d'informació. Les metadades accessibles a través dels serveis de catàleg proporcionen característiques dels recursos d'informació que poden ser utilitzades tant pels usuaris de les aplicacions de consulta com per altres programes que requereixen les metadades per a processar les dades. Els serveis de catàleg són necessaris per a fer possible el descobriment dels recursos i donar a la informació registrada en els catàlegs autoritat i a les metadades que la descriuen i documenten caràcter vinculant.
El model abstracte dels serveis de catàleg d'OGC comprèn un model de catàleg d'informació (el model de catàleg de metadades o model de metadades), una gramàtica en Bakus-Naur Form per a un llenguatge de consulta mínim (l'anomenat OGC_Common Catalogue Query Language), un conjunt d'atributs consultables (noms, definicions, tipus de dades) corresponent als elements de metadades, i un format comú de registre que defineix els elements a retornar com a resultat de les consultes, tant el subconjunt d'elements del resultat resumit o sumari com el conjunt sencer de metadades corresponent al resultat complet. Com a model de catàleg de metadades, l'estàndard OpenGIS Catalogue Services Specification , en la seva darrera versió, ha adoptat l'estàndard de metadades geoespacials ISO 19115 (OGC, 2007), que anteriorment només era un perfil de l'estàndard de serveis de catàleg.
Els diversos models d'implementació corresponen als diferents protocols per als quals es proposa la implementació de l'estàndard de serveis de catàleg. Fins a la versió 2.0.2 OGC ha publicat models d'implementació per als protocols Z39.50, CORBA i HTTP. Aquest darrer és el que es coneix com a Catalogue Service for Web (CS-W), que és el més emprat per als serveis de catàleg web des de finals de la dècada de 2000. El model d'implementació Catalogue Service for Web (CS-W) de l'estàndard OpenGIS Catalogue Services, que empra el protocol HTTP, es basa en l'estàndard ebXML Registry Information Model (ebRIM) de la Organization for the Advancement of Structured Information Standards (OASIS) com a metamodel o model abstracte de serveis de catàleg web. ebRIM proporciona un model de comunicació de quina informació hi ha enregistrada en el catàleg i com està organitzada.
Gràcies a la implementació en forma de serveis i a la utilització de protocols de serveis estàndard, els catàlegs de metadades es poden consultar des de qualsevol aplicació web client capaç d'interpretar aquest tipus de serveis i es poden interconnectar entre si. La interconnexió entre catàlegs de metadades permet desenvolupar les infraestructures de dades espacials (IDE) d'acord amb una arquitectura distribuïda. Així, no cal que tot el catàleg de metadades d'una IDE estigui en la mateixa base de dades en un sol servidor. Les organitzacions amb capacitat tècnica i/o un volum de dades geoespacials important poden crear el seu propi catàleg de metadades i connectar-lo al catàleg general de la IDE, el qual redirigeix les consultes al catàleg corresponent i en recupera i serveix els resultats sense que l'usuari noti cap diferència.
Cicle operatiu de producció i ús de metadades geoespacials
La producció i ús de les metadades geoespacials té lloc a través d'un conjunt d'operacions o cicle operatiu que es desenvolupa en diferents entorns de treball i que comprèn, a grans trets, la seqüència d'operacions formada per producció, emmagatzematge i distribució, publicació i consulta.
Producció de metadades geoespacials
Les metadades geoespacials es produeixen i transfereixen habitualment en forma de fitxers en format XML, d'acord amb els estàndards de metadades geoespacials (ISO 19115/19139/ 19119). Per a produir les metadades geoespacials s'utilitzen programes especialitzats per a la introducció i la modificació de metadades descriptives de dades geogràfiques o d'altres recursos d'informació geoespacial, anomenats editors de metadades, que incorporen l'esquema XML del model de metadades d'un determinat estàndard de metadades geoespacials (ISO ISO 19115/19139 a Europa i progressivament arreu del món, CSDGM a Estats Units).
Exemples d'editors de metadades: el programa MetaD, creat i distribuït per la Infraestructura de Dades Espacials de Catalunya, IDEC (esquerra); i el programa MetaDiba del Catàleg de metadades de la cartografia digital de la Diputació de Barcelona (dreta). Font: http://www.geoportal-idec.cat i http://www.diba.cat.
Un editor de metadades implementa generalment el conjunt d'elements de metadades, i també el seu caràcter obligatori, condicional o opcional, les dependències funcionals entre elements i la codificació de valors o el contingut admissible per a documentar la informació o altres recursos relacionats, segons un determinat estàndard de metadades. Els editors de metadades solen ser aplicacions d'escriptori independents, encara que també n'hi ha que són aplicacions web, que permeten l'edició compartida en xarxa de les metadades geoespacials. En alguns casos, l'editor de metadades pot anar acoblat al visualitzador de dades geogràfiques o programa de SIG d'escriptori, com en el cas d'ArcGIS o de MiraMon, de manera que l'edició de metadades es pot dur a terme al mateix temps que s'examinen les dades. En molts casos, els editors de metadades són gratuïts o de codi obert per a fomentar l'elaboració de metadades.
Emmagatzematge i distribució de metadades geoespacials
De cara a la publicació i consulta en forma de catàleg, les metadades s'emmagatzemen en bases de dades relacionals o relacionals orientades a objectes, amb diferents esquemes de base de dades segons l'aplicació de servidor de catàleg de metadades utilitzada. A aquest efecte, els fitxers XML de metadades produïts pels editors de metadades s'han de carregar en la base de dades de catàleg corresponent. La producció i emmagatzematge de les metadades són habitualment operacions fora de línia, que es realitzen amb aplicacions independents utilitzant els fitxers XML com a vehicle de transferència de les metadades entre aplicacions i de distribució a tercers. En alguns casos, però, les aplicacions d'edició de metadades actuen directament sobre la base de dades de catàleg, estalviant el pas intermedi de generar fitxers XML, que només es produeixen, com a exportació, a efectes d'intercanvi i distribució de les metadades a altres sistemes o organitzacions.
Cicle operatiu de producció i ús de les metadades espacials. Font: Elaboració pròpia.
Publicació de metadades espacials. Serveis de catàleg de metadades
Per fer les metadades accessibles a través de la xarxa, ja sigui públicament o a nivell intern d'una organització, cal disposar d'una aplicació específica que generi i faci públics els serveis de catàleg de metadades. Un servidor de catàleg de metadades, o servidor de metadades, és un tipus de programari intermediari especialitzat que permet publicar i consultar catàlegs de metadades d'informació geoespacial en les aplicacions client a través d'Internet, mitjançant la generació i publicació de serveis de metadades web, o serveis de catàleg, que des de finals de la dècada 2000 són serveis estàndard d'acord amb l'estàndard Catalogue Service for Web (CS-W) d'Open Geospatial Consortium.
Els servidors de metadades inclouen sovint les eines de gestió interna i d'incorporació (publicació) de les metadades en el catàleg, habitualment també en forma d'aplicacions web client d'administració del catàleg. Les aplicacions de servidor de catàleg de metadades poden ser aplicacions generals, sovint de codi obert com per exemple GeoNetwork, o bé aplicacions a mida desenvolupades per les pròpies organitzacions que publiquen el seu catàleg de metadades.
Consulta de metadades geoespacials
La consulta de metadades i el descobriment dels recursos d'informació geoespacial i de les seves característiques requereix d'aplicacions client de consulta dels serveis de metadades web. Les aplicacions web de consulta de metadades, anomenades client de consulta de metadades o visualitzador de metadades, són aplicacions web especialitzades, desenvolupades com a pàgines HTML amb JavaScript i altres components, que permeten la cerca i consulta de metadades, per condicions temàtiques, geogràfiques, d'autor, mitjançant la cerca, l'exploració de l'índex del catàleg o bé directament sobre el mapa. Els visualitzadors de metadades són una de les prestacions característiques que proporcionen els geoportals de les infraestructures de dades espacials.
Temes relacionats
- Geoportal.
- Infraestructura de dades espacials.
- Sistemes d’informació geogràfica.
- Sistema de referència espacial.
Referències
Bagley, P. (1968) Extension of programming language concepts. Philadelphia, Pennsylvania: University City Science Center. https://web.archive.org/web/20121130091053/http://www.dtic.mil/dtic/tr/fulltext/u2/680815.pdf [consulta 26 novembre 2012].
Bangemann, M. (1994) Europe and the Global Information Society – Recommendations to the European Council. Brussels: European Commission.
Bretherton, F.P. and Singley, P.T. (1994) "Metadata: A User's View" in Proceedings of the International Conference on Very Large Data Bases (VLDB).
Chan, L.M. and Zeng, M.L. (2006) "Metadata Interoperability and Standardization - A Study of Methodology Part 1", D-Lib Magazine, 12, 6.
Danko, D.M. (2008) "Metadata and Interoperability, Geospatial" in Shekar, S. and Xiong, H. (eds.) Encyclopedia of GIS, New York: Springer.
DCMI (1995-2012) DCMI Specifications. Dublin Core Metadata Initiative.
http://dublincore.org/specifications/ [consulta 26 novembre 2012].
De Carvalho Moura, A.; Machado Campos, M. and Barreto, C. (1998) "A survey on metadata for describing and retrieving Internet resources", World Wide Web, 1, 4, 221-240.
Di, L. and Bai, Y. (2008) "Catalogue Information Model" in Shekar, S. and Xiong, H. (eds.) Encyclopedia of GIS, New York: Springer.
Duval, E. (2001) "Metadata Standards, What, Who & Why", Journal of Universal Computer Science, 7, 7, 591-601.
Egenhofer, M.J. (2002) "Toward the Semantic Geospatial Web" in Proceedings of the Tenth ACM International Symposium on Advances in Geographic Information Systems. McLean, Virginia: Association for Computing Machinery.
FGDC (2006a) The Federal Geographic Data Committee. http://www.fgdc.gov [consulta 26 novembre 2012]
FGDC (2006b) Content Standard for Digital Geospatial Metadata.
http://www.fgdc.gov/standards/projects/FGDC-standards-projects/metadata/base-metadata/index_html [consulta 26 novembre 2012].
Fonseca, F. and Sheth, A. (2002). The Geospatial Semantic Web. UCGIS White Paper. University Consortium for Geographic Information Science. http://www.personal.psu.edu/faculty/f/u/fuf1/Fonseca-Sheth.pdf [consulta 26 novembre 2012]
Haynes, D. (2011) Metadata – What is its purpose? http://aspiresquared.co.uk/2011/01/ metadata-what-is-its-purpose/ [consulta 26 novembre 2012]
IDEE (2010) Núcleo Español de Metadatos (NEM v 1.1). Madrid: Infraestructura de Datos Espaciales de España, Consejo Superior Geográfico. https://1library.co/document/yjrl07mz-n%C3%BAcleo-espa%C3%B1ol-metadatos-t%C3%ADtulo-identificador-versi%C3%B3n-objetivo-descripci%C3%B3n.html [consulta 26 novembre 2012].
ISO/TC211 (2003) ISO 19115: Geographic information - Metadata, Geneva, Switzerland: International Organization for Standardization (ISO).
ISO/TC211 (2005a) ISO 19109: Geographic information - Rules for application schema, Geneva, Switzerland: International Organization for Standardization (ISO).
ISO/TC211 (2005b) ISO 19110: Geographic information - Methodology for feature cataloguing, Geneva, Switzerland: International Organization for Standardization (ISO).
ISO/TC211 (2007) ISO 19139: Geographic information - Metadata - XML schema implementation, Geneva, Switzerland: International Organization for Standardization (ISO).
Kimball, R. (2008) The Data Warehouse Lifecycle Toolkit (2nd Edition). New York: Wiley.
Longhorn, R. (2005) "Geospatial Standards, Interoperability, Metadata Semantics and Spatial Data Infrastructure" in NIEeS Workshop on Activating Metadata, Cambridge.
NISO (2004) Understanding Metadata. Bethesda, Maryland: NISO Press.
http://www.niso.org/publications/press/UnderstandingMetadata.pdf [consulta 20 octubre 2012].
Nogueras-Iso, J.; Zarazaga-Soria, F.J. and Muro-Medrano, P.R. (2010) Geographic Information Metadata for Spatial Data Infrastructures: Resources, Interoperability and Information Retrieval. New York: Springer.
OASIS (2002) ebXML Registry Information Model (ebRIM).Organization for the Advancement of Structured Information Standards. http://www.oasis-open.org/committees/regrep/documents/2.0/specs/ebrim.pdf [consulta 26 novembre 2012].
OGC (2007) OpenGIS Catalogue Services Specification (Version 2.0.2). Wayland, Maryland: Open Geospatial Consortium.
OMB (2002) Circular No. A-16 Revised, August 19, 2002. Washington, DC: The White House - Office of Management and Budget.
Semerjian, C.J. (2008) "Metadata" in Shekar, S. and Xiong, H. (eds.) Encyclopedia of GIS, New York: Springer.
USGS (2004) Content Metadata Standards for Marine Science: A Case Study, USGS Open-File Report 2004-1002. Reston, Virginia: United States Geologic Survey.
http://pubs.usgs.gov/of/2004/1002/html/evol.html [consulta 26 novembre 2012].
Lectures recomanades
Moellering, H. (2005) (ed.) World Spatial Metadata Standards. Oxford: Elsevier.
https://web.archive.org/web/20121130091053/http://www.dtic.mil/dtic/tr/fulltext/u2/680815.pdf