Geoetiquetatge | icgc

Geoetiquetatge

Autor: Dr. Joan Nunes. Universitat Autònoma de Barcelona  
Promotor: Institut Cartogràfic de Catalunya, 2013 

El geoetiquetatge o geoindexació (geotagging) és el procés de georeferenciar documents o continguts digitals, com és ara imatges, fitxers multimèdia, pàgines web, missatges, adreces web, notícies o comentaris publicats en fòrums o xarxes socials, etc., afegint informació de la localització geogràfica dins les metadades dels fitxers o serveis corresponents.

La localització geogràfica se sol indicar per mitjà de coordenades i concretament per mitjà de coordenades geogràfiques de latitud i longitud, més que no pas coordenades projectades, pel fet que les coordenades geogràfiques permeten compartir i integrar informació a nivell global.  Idealment la localització geogràfica indicada en el geoetiquetatge correspon a la localització geogràfica del contingut del fitxer o servei geoetiquetat. Molt sovint, però, d'ençà de la proliferació de sistemes automàtics de geoetiquetatge, la localització geogràfica indicada correspon al lloc on ha estat creat el fitxer o servei, que no necessàriament coincideix amb el lloc a què fa referència el contingut. Alternativament, en lloc de coordenades, de vegades s'utilitzen descriptors o referències geogràfiques indirectes, com és ara adreces, codis postals o topònims, que permeten derivar-ne la posició en coordenades mitjançant geocodificació.

El geoetiquetatge permet realitzar cerques d'informació sobre llocs, visualitzar la informació sobre serveis de mapes web, especialment en forma de mapes personals o remescles (mashups) i relacionar informació mitjançant la posició. En el context de les aplicacions sensibles a la localització (location-aware applications), com els serveis basats en la localització o les xarxes geosocials, la georeferenciació dels continguts mitjançant geoetiquetatge permet  subministrar als usuaris, de forma automàtica o selectiva, tot tipus d'informacions i continguts, com és ara notícies, activitats, comentaris o imatges, relatius a un lloc específic, aquell on es troba l'usuari o bé un altre escollit lliurement.

El geoetiquetatge és un exemple d'ús creatiu no previst de la tecnologia geoespacial per part del gran públic i constitueix una de les activitats significatives de la cartografia web i de l'anomenada neogeografia.

Imatge

 

SUMARI

  1. Origen
  2. Definició
  3. Tècniques de geoetiquetatge  
    3.1  Geoetiquetatge manual  
    3.2  Geoetiquetatge automàtic mitjançant geolocalització  
    3.3  Geoetiquetatge automàtic de fotografies  
  4. Estàndards de geoetiquetatge  
    4.1  Fotografies  
    4.2  Missatges de text  
    4.3  Entrades de DNS  
    4.4  Pàgines HTML  
    4.5  Geoblocs i aplicacions de folksonomia  
  5. Riscos del geoetiquetatge
  6. Temes relacionats
  7. Referències
  8. Lectures recomanades

Origen

El geoetiquetatge apareix a mitjans de la dècada de 2000 com a activitat de cartografia web duta a terme pel públic consistent a afegir continguts sobre serveis de mapes, generalment en forma de punts de localització de llocs o fets d'interès personal o d'un col·lectiu, sovint amb continguts o documents associats, fent servir el mapa com a suport o índex. La pràctica del geoetiquetatge com a activitat de cartografia web ha estat possible gràcies a l'aparició d'aplicacions com Google Maps i altres que proporcionen serveis de mapes web a través d'una aplicació que permet afegir continguts d'usuari de forma fàcil i senzilla a través del web per part del públic en general no expert. El geoetiquetatge, o geoindexació, reprodueix l'ús particular dels mapes analògics com a suport d'anotacions, però a gran escala i amb caràcter públic, de manera que permet desenvolupar usos personals però també projectes col·lectius de cartografia col·laborativa, com per exemple, Placeopedia, Wikimapia o Tagzania, entre d'altres.

Imatge

 

Posteriorment, la incorporació continuada de continguts geoespacials al web i la creixent disponibilitat de dispositius mòbils amb receptors de GPS incorporats, que permeten la geolocalització dels usuaris, han portat cap a finals de la dècada de 2000 al desenvolupament d'applicacions de serveis basats en la localització i de xarxes geosocials, en les quals el geoetiquetatge per a georeferenciar els continguts es genera automàticament en el moment de la publicació gràcies a la geolocalització dels usuaris. Així, els missatges, notícies o comentaris publicats i els fitxers pujats adquireixen automàticament les etiquetes de geoetiquetatge que permeten georeferenciar-los i utilitzar la localització geogràfica com a criteri de cerca o de proveïment de serveis en funció del context geogràfic.

Més enllà del geoetiquetatge automàtic en el moment de la publicació de continguts en el web, basat en la geolocalització, s'han anat desenvolupant sistemes automàtics de geoetiquetatge en el moment de la producció, per a determinats tipus de continguts especialment favorables com la fotografia digital, mitjançant incorporació de receptors de GPS a les càmeres fotogràfiques digitals o l'ús del receptor de GPS inclòs en els telèfons intel·ligents per a geoetiquetar automàticament les fotografies captades amb la càmera del telèfon mòbil.

Definició

El geoetiquetatge descriu tant l'activitat manual de cartografia web de georeferenciar continguts sobre un servei de mapes interactiu creant punts d'interès i associant-hi continguts relacionats, com és ara imatges o documents, que en virtut d'aquesta vinculació resulten georeferenciats, com el procés automàtic de georeferenciar continguts web en el moment de la publicació, gràcies a la geolocalització, o de georeferenciar documents, com les fotografies digitals, en el moment de la producció, gràcies a la incorporació de dispositius de posicionament automàtic en les càmeres fotogràfiques o telèfons mòbils dotats de càmera.

Convé distingir, però, aquells casos en què el geoetiquetatge, i per tant la georeferenciació, només té existència dins del context d'una aplicació web determinada (aplicació de serveis de mapes web, de serveis basats en la localització o de geoxarxa social), d'aquells casos en què el geoetiquetatge és permanent perquè forma part de l'emmagatzematge independent del document, ja sigui mitjançant la inclusió de la referència geogràfica dins les metadades formals del document, o bé mitjançant l'emmagatzematge de la referència geogràfica en algun tipus d'estructura de dades ad hoc. En el primer cas, cal parlar de geoetiquetatge d'entrades de bases de dades, mentre que en el segon cas es tracta pròpiament de geoetiquetatge de documents. A mesura que les aplicacions web amb component geoespacial, i en particular les aplicacions de xarxes geosocials, han anat madurant i s'han anat interconnectant entre si, l'intercanvi d'informació i la interoperabilitat de les aplicacions ha afavorit el desenvolupament i l'ús progressivament preferent de les formes permanents o independents de geoetiquetatge de documents, amb la definició de models de metadades específics i estàndards de geoetiquetatge de documents i continguts web.

Tècniques de geoetiquetatge

El geoetiquetatge es pot realitzar de forma manual o automàtica segons el tipus de continguts, d'aplicacions emprades i de recursos o dispositius disponibles.

Geoetiquetatge manual

La forma més senzilla i antiga de geoetiquetatge és el geoetiquetatge manual localitzant i marcant damunt d'un servei de mapes web interactiu la posició del lloc al qual fa referència el contingut del document, imatge, notícia o missatge que es vol geoetiquetar. L'aplicació de serveis de mapes crea un punt d'interès, amb les coordenades  del punt indicat punxant el mapa, i hi associa el document o contingut introduït per l'usuari. Aquest tipus de geoetiquetatge manual es desenvolupà a partir de 2005, gràcies a l'aparició de serveis de mapes web d'ús general amb cobertura mundial i capacitat per a desenvolupar aplicacions personalitzades com Google Maps, i ha estat la base de nombrosos projectes de geoindexació de llocs d'interès, articles de viquipèdia, etc., com per exemple Geonames (anteriorment Placeopedia), Wikimapia o Tagzania, i els específics de fotografies com Panoramio o Flickr, entre els més coneguts.

Imatge

GeonamesViquipèdiaPlaceopedia
http://www.geonames.org/

Aquest tipus de geoetiquetatge té com a principal limitació el fet que la georeferenciació dels continguts o documents només existeix i és efectiva dins de l'aplicació web en la qual té lloc. Aquesta limitació, però, també la tenen en general els procediments automàtics de geoetiquetatge de les aplicacions de xarxes geosocials i similars. En ambdós casos es tracta de geoetiquetatge d'entrades de bases de dades.

El geoetiquetatge manual també s'utilitza en el cas de geoetiquetatge de documents, especialment en el cas de fotografies digitals, quan no es disposa de procediments o dispositius de geoetiquetatge automàtic.

En el cas que el tipus de document a geoetiquetar disposi d'un estàndard de metadades que contempli el geoetiquetatge i que aquest formi part de l'emmagatzematge en fitxers del document, com per exemple en el cas del format JPEG de fotografies digitals, se solen utilitzar aplicacions especialitzades per a geoetiquetar manualment un determinat tipus de documents. Generalment solen ser aplicacions d'escriptori independents, especialitzades en la documentació d'un determinat tipus de document i de format, que permeten geoetiquetar o modificar fora de línia el geoetiquetatge i altres metadades del document.

Imatge

 

Geoetiquetatge automàtic mitjançant geolocalització

El geoetiquetatge automàtic mitjançant geolocalització té lloc dins de les aplicacions web o per a telèfons mòbils, de serveis basats en la localització o de xarxes geosocials, cada vegada que un usuari, que hagi autoritzat la determinació i publicació de la seva localització geogràfica, publica un contingut nou, com és ara una notícia, missatge, comentari o puja un document per a compartir. En el cas de les aplicacions web, de fet ni tan sols cal que l'usuari hagi autoritzat la publicitat de la seva localització geogràfica, ja que la geolocalització a nivell de ciutat, per mitjà de l'adreça IP, és automàtica.

En funció del tipus de contingut publicat, i depenent de si aquest és específic d'una determinada aplicació de xarxa geosocial o bé és genèric i interoperable entre diferents aplicacions, i disposa en major o menor grau d'un estàndard de metadades que inclou el geoetiquetatge o, com a mínim, d'una estructura de dades o format per a emmagatzemar el geoetiquetatge de manera independent i permanent, el geoetiquetatge automàtic mitjançant geolocalització realitza geoetiquetatge d'entrades de bases de dades o bé geoetiquetatge de documents.

El geoetiquetatge automàtic mitjançant geolocalització presenta l'inconvenient que la localització geogràfica emprada per a geoetiquetar el document o recurs web en el moment de la publicació és la localització geogràfica de l'usuari, la qual pot no tenir res a veure amb la localització geogràfica del contingut del document o recurs. Per exemple, un comentari o notícia sobre les illes Galápagos publicat des de Manresa resultarà geoetiquetat automàticament amb les coordenades de Manresa, no amb les de les Illes Galápagos, la qual cosa té poc sentit a l'hora de facilitar la cerca de continguts per localització geogràfica.

Geoetiquetatge automàtic de fotografies

Les fotografies digitals són un cas específic de document o de contingut digital molt definit, per al qual s'han establert estàndards de metadades o, si més no, estructures de dades per a emmagatzemar documentació relativa a les característiques de la imatge digital emmagatzemada en diferents formats d'imatge.

Una de les característiques generades i emmagatzemades automàticament des de sempre en el moment de la producció en el cas de les fotografies digitals és la data i hora de realització de la fotografia digital, enregistrada per la mateixa càmera digital. Recentment, aquest concepte de documentació automàtica de la imatge en el moment de la producció s'ha estès al geoetiquetatge, amb la finalitat d'enregistrar automàticament, a més del moment, el lloc de realització de cada fotografia digital (Bobbitt, 2009).

Per poder realitzar el geoetiquetatge automàtic de les fotografies, les càmeres digitals o els telèfons mòbils han de dur incorporat un receptor de GPS que permeti determinar la localització, o bé s’han de poder connectar a un receptor de GPS extern independent. A més cal que el receptor GPS incorporat o acoblat dugui inclòs el programari necessari per a traslladar la informació de posició captada pel receptor GPS i geoetiquetar automàticament la fotografia digital en el moment d'enregistrar-la. Alternativament, en cas de no disposar d'un ni altre, les posicions es poden enregistrar de forma independent i introduir-les en el registre de metadades dels fitxers de les fotografies digitals per mitjà d'una aplicació independent de documentació de fotografies de forma manual o mitjançant algun tipus de sincronització semiautomàtica.

Imatge

 

Els inconvenients del geoetiquetatge automàtic mitjançant geolocalització no es plantegen en el cas del geoetiquetatge automàtic de fotografies en el moment de produir la fotografia, ja que la posició del lloc on es pren la fotografia generalment es pot considerar, salvant les distàncies, igual a la posició del lloc fotografiat, si més no com a punt de vista.

Estàndards de geoetiquetatge

A mesura que s'ha estès la pràctica del geoetiquetatge automàtic s'han anat desenvolupant estàndards o, si més no, formats per a enregistrar la informació de geoetiquetatge i compartir-la entre diferents aplicacions en aquells tipus de documents o de continguts digitals més ben tipificats i/o d'ús més general.

Fotografies

En el cas de les fotografies digitals emmagatzemades en el format JPEG s'han desenvolupat formats de metadades específics, com el format Exchangeable image file format (EXIF) o el format Extensible Metadata Platform (XMP) que permeten emmagatzemar la informació de geoetiquetatge mitjançant les etiquetes GPSLatitude i GPSLongitude o bé GPSPosition en diferents formats i unitats.

Un exemple de format EXIF, en graus minuts i segons indicant l'hemisferi, seria el següent

GPSLatitude      : 57 deg 38' 56.83" N  
GPSLongitude     : 10 deg 24' 26.79" E  
 

GPSPosition      : 57 deg 38' 56.83" N, 10 deg 24' 26.79"

 

o bé, en graus decimals, amb l'hemisferi implícit en el signe de les coordenades (negatives per als hemisferis S i W):

GPSLatitude      : 57.64911  
GPSLongitude     : 10.40744  
 

GPSPosition      : 57.64911 10.40744

 

La informació de les coordenades de geoetiquetatge en el format estàndard EXIF s'emmagatzema internament com a sèries de números racionals en el registre sub-IFD de GPS. Aquesta informació la poden llegir i escriure la majoria de càmeres digitals i escàners de les darreres generacions i l'usuari la pot llegir i editar, juntament amb altra informació documental de les imatges, mitjançant programes especialitzats, com per exemple gThumb, EFIX Reveal o EfixTool.

Missatges de text

En el cas dels missatges de text SMS, s'ha definit l'estàndard GeoSMS, que enregistra la informació de posició geogràfica en forma d'un o més GeoURI (geoidentificador universal de recurs) inserits en el cos del missatge de text. Per exemple:

Hola, sóc a la biblioteca geo:-37.801631,144.980294

 

En l'estàndard GeoURI, la posició s'expressa com un parell de valors numèrics separats per coma, que indiquen respectivament la latitud i la longitud en graus decimals. Opcionalment, s'hi pot afegir un tercer valor que indiqui l'altitud, separat també per una coma. A més de la posició en coordenades 2D o 3D, l'estàndard GeoURI permet afegir paràmetres per a indicar l'error o incertesa del posicionament en metres (paràmetre u, "uncertainty" ) i el sistema de referència espacial (paràmetre crs, "coordinate reference system"), separats per punt i coma. Els sistemes de referència espacial s'expressen mitjançant el codi de la base de dades EPSGGeodetic Parameter Dataset. El sistema de referència espacial per defecte és el World Geodetic System 1984 (WGS-84), que és l'emprat en el sistema de posicionament global GPS i el que mostren per defecte els receptors de GPS. L'exemple anterior amb indicació de 50 m d'incertesa i sistema de referència espacial UTM zona 31 N basat en el datum ED50 seria:

Hola, sóc a la biblioteca geo:-37.801631,144.980294;u=50;crs=23031

 

Entrades de DNS

Les entrades d'un servidor de noms de domini (DNS) es poden geoetiquetar per mitjà de l'estàndard RFC 1876, que defineix atributs de localització de les adreces IP, que inclouen la latitud, longitud, altitud i precisió de la localització corresponent a cada adreça IP.  A la pràctica, però, molt poques adreces IP estan georeferenciades per mitjà de coordenades geogràfiques i per tant es fan servir més els mètodes estimats de geolocalització per a localitzar les adreces IP dinàmicament en el marc d'una determinada aplicació.

Pàgines HTML

Les pàgines web o documents HTML es poden geoetiquetar utilitzant diversos estàndards (The Internet Engineering Task Force, 2007):

  • estàndard GeoURL: L'estàndard GeoURL utilitza l'etiqueta ICBM per a indicar les coordenades de latitud i longitud:

  •  estàndard GeoURI: Els identificadors GeoURI es poden incloure també dins del codi HTML d'una pàgina web per a geoetiquetar-la

Casa meva

  • format GeoTag: El format GeoTag defineix diverses etiquetes per a expressar la localització geogràfica d'una pàgina web per mitjà de coordenades, topònims o àrees:




  • estàndard RDF: L'estàndard RDF (Resource Description Framework) és un model de metadades emprat per a descriure el contingut i estructura d'informació implementada en forma de pàgines i, en general, recursos web, definit pel consorci W3 Group. Aquest estàndard defineix també un cert nombre d'etiquetes per a expressar la posició geogràfica i geoetiquetar pàgines i recursos web. L'expressió completa de la posició en RDF, requereix fer referència prèviament a les URL on estan definides les codificacions d'etiquetes de RDF, igual que en el cas del llenguatge XML. Per exemple:

xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns#
xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#">

      55.701
      12.552


  • microformat Geo: El microformat Geo és un format d'etiquetes específic per a expressar coordenades geogràfiques de latitud i longitud en el sistema de referència espacial WGS-84 i etiquetar pàgines HTML:


50.167958;
-97.133185

Els diferents estàndards per a geoetiquetar pàgines HTML serveixen també per a geoetiquetar en general recursos o continguts web (notícies, comentaris, etc.) inclosos dins d'una pàgina HTML, ja que cada recurs sol ser en si mateix una pàgina HTML inclosa dins d'una altra pàgina HTML. La varietat d'estàndards existents demostra, tanmateix, que no hi ha un únic estàndard globalment acceptat i que cada aplicació ha d'implementar un o altre dels estàndards que conviuen en el web. Moltes aplicacions, com per exemple el lloc web Flickr per a compartir i geoindexar fotografies, enregistren tots els diversos formats en cada document o contingut geoetiquetat per tal de facilitar l'intercanvi amb altres aplicacions.

Geoblocs i aplicacions de folksonomia

A l'hora de geoetiquetar recursos, com és ara blocs, comentaris o fotografies, per part dels usuaris en les aplicacions d'etiquetatge de continguts, o aplicacions de folksonomia, no es disposa d'estàndards de geoetiquetatge pròpiament dits, però s'utilitzen convencions que permeten als usuaris afegit metadades de localització als recursos d'informació mitjançant les anomenades etiquetes de màquina o etiquetes triples. Una de les convencions d'aquest tipus més utilitzades és la que ha establert el lloc wev Geobloggers, emprada també, entre d'altres, per Panoramio, Flickr i del.icio.us. Un exemple de la sintaxi emprada en aquest tipus d'etiqueta triple seria el següent:

  • geotagged 
  • geo:lat=57.64911 
  • geo:lon=10.40744  
     

Un altre exemple de convenció, proposada per Flickr, per a especificar com visualitzar amb Google Earth un recurs geoetiquetat és el següent, que indica l'angle, inclinació i abast:

  • ge:head=225.00 
  • ge:tilt=45.00 
  • ge:range=560.00   
     

La dificultat i l'ambigüitat de gestionar etiquetes triples i convencions en les aplicacions d'etiquetes assignades lliurement pels usuaris desapareix, en el cas de les etiquetes de geoetiquetatge, en el moment en què les aplicacions basen el geoetiquetatge en la geolocalització i enregistren la posició de l'usuari.

Riscos del geoetiquetatge

El geoetiquetatge automàtic planteja els mateixos riscos per a la privacitat que qualsevol aplicació que utilitzi serveis de geolocalització. Fins a cert punt aquest mateix problema es pot plantejar en la publicació al web de fotografies digitals geoetiquetades automàticament en el moment de la producció, ja que l'usuari pot no ser conscient que la fotografia conté informació de la localització geogràfica des d'on s'ha pres, encara que el simple fet de publicar la fotografia ja desvetlla informació privada.

Un risc addicional de publicar fotografies i altre contingut etiquetat amb la localització i el temps és el fet que permet a terceres persones correlacionar aquesta informació amb altres informacions i fer un seguiment indesitjat que pot servir de base per a robatoris o altres actes criminals (Friedland and Sommer, 2010).

Temes relacionats

Referències

Bobbitt, R. (2009) "Photographers Have Several Camera Options for Geotagging Pictures with GPS Points". Directions Magazine. http://www.directionsmag.com/article.php?article_id=3283   [consulta 9 setembre 2012].

Friedland, G. and Sommer, R. (2010) "Cybercasing the Joint: On the Privacy Implications of Geo-Tagging", 5th Usenix Hot Topics in Security Workshop (HotSec2010)http://www.usenix.org/events/hotsec10/tech/full_papers/Friedland.pdf [consulta 9 setembre 2012].

The Internet Engineering Task Force (2007) "Geographic registration of HTML documents".  
http://tools.ietf.org/id/draft-daviel-html-geo-tag-08.txt   [consulta 9 setembre 2012]. 
 

http://en.wikipedia.org/wiki/Geocaching  [consulta 7 setembre 2012].

Lectures recomanades

Luo, J.; Joshi, D.; Yu, J. and Gallagher, A. (2011) "Geotagging in multimedia and computer vision - a survey", Multimedia Tools and Applications, 51, 1, 187–211.