Agregació espacial
Autor: Dr. Joan Nunes. Universitat Autònoma de Barcelona
Promotor: Institut Cartogràfic de Catalunya, 2013
L'agregació espacial és una operació espacial bàsica de geoprocessament de dades vectorials en els sistemes d’informació geogràfica, que uneix dos o més elements d'un mateix tipus geomètric per a formar un únic element nou.
Conceptualment, l'agregació espacial és una operació de generalització de la informació geoespacial, que combina dades individuals o més detallades per a obtenir dades de conjunt o més generals. L'agregació pot ser temàtica i agregar dades alfanumèriques per a produir un nou valor per a cada conjunt a partir dels valors individuals dels membres de cada conjunt (per exemple, la població de les comarques a partir de la població dels municipis; o la categoria "bosc de coníferes" que agrupa les categories "bosc de pi roig", "bosc de pi negre" i "avetosa"), o bé espacial i agregar dades espacials per a produir una nova geometria del conjunt a partir de les geometries individuals (per exemple, l'agregació dels polígons dels municipis per a formar els polígons de les comarques).
Exemple d'agregació espacial. Els polígons dels municipis s'uneixen (es dissolen) per a formar els polígons de les comarques.
Sovint l'agregació espacial és conseqüència d'una agregació temàtica i viceversa, però no sempre una de les dues operacions implica la necessitat de l'altra i en cap cas la desencadena automàticament. Per exemple, la sumarització del nombre d'habitants dels municipis, mitjançant la suma dels habitants dels municipis de cada comarca per a obtenir el nombre d'habitants de les comarques, pot requerir també agregar els polígons dels municipis per a formar els polígons de les comarques, a fi d'associar les dades de població de les comarques a la seva representació espacial per poder visualitzar espacialment la informació temàtica de població comarcal. En d'altres casos, però, pot ser que només es vulgui disposar de la dada temàtica de població comarcal per associar-la a cada municipi a fi de calcular el percentatge de la població del municipi sobre la població total de la comarca o bé per a fer-ne un ús independent, i que per tant no hi hagi necessitat de generar la representació espacial de les comarques mitjançant agregació espacial de la representació espacial dels municipis. Igualment la reclassificació de les categories de vegetació en categories més generals no implica necessàriament que calgui agregar espacialment les àrees de les categories més detallades de vegetació per obtenir les àrees de les categories més generals de vegetació, a menys que la finalitat sigui generar les àrees agregades.
L'agregació espacial com a tal no es pot realitzar amb dades de tipus ràster, per la diferent naturalesa del model de dades ràster, però sí que es poden realitzar operacions d'agregació temàtica que visualment produeixen un efecte equivalent a l'obtingut amb l'agregació espacial en el model de dades vectorial.
Origen
L'agregació espacial és una operació bàsica contemplada des del principi en el programari de SIG vectorial (Tomlinson, 1967, 1980; Tomlinson et al., 1976). Igual que altres operacions bàsiques d'anàlisi cartogràfica, l'agregació espacial té el seu antecedent en operacions manuals de manipulació d'informació cartogràfica realitzades en aplicacions de planificació, d'urbanisme, d'arquitectura del paisatge i de gestió forestal o de recursos naturals (McHarg, 1969), que en aquest cas simplement consistien a redibuixar el mapa de les unitats agregades a partir del mapa de les unitats originals.
Definició
L'agregació espacial genera nous elements geomètrics unint la geometria de dos o més elements originals. En el cas que els elements a agregar siguin adjacents, l'agregació espacial genera un element nou del mateix tipus geomètric que els elements originals. En canvi, el cas que els elements originals siguin disjunts, el resultat és un element de tipus multipart, si el format de dades del programa de SIG utilitzat per a fer l'operació admet elements de tipus multipart. En cas de no admetre multielements l'operació d'agregació simplement no es produeix i el resultat és una còpia idèntica dels elements originals. L'opció d'agregar elements adjacents només és possible en el cas de línies i de polígons, ja que el cas de punts adjacents és materialment impossible. L'opció d'agregar elements disjunts per a formar elements multipart és possible amb tot tipus d'elements geomètrics, punts, línies i polígons, fins i tot a partir d'altres elements multipart.
Exemples d'agregació espacial d'elements adjacents (a dalt) o disjunts (a baix). Els elements adjacents (línies o polígons) s'agreguen en un sol element del mateix tipus. Els elements disjunts (punts, línies o polígons) s'agreguen en un sol element de tipus multipart (multipunt, multilínia o multipolígon).
Operacions d'agregació temàtica
Les principals operacions d'agregació temàtica són la reclassificació i la sumarització, que s'apliquen respectivament a atributs de tipus categòric i quantitatiu. L'agregació temàtica no implica necessàriament l'agregació espacial, però sovint n'és el punt de partida i, d'altra banda, alguns programes de SIG ofereixen la possibilitat de realitzar algunes operacions d'agregació espacial i d'agregació temàtica conjuntament en un mateix pas.
Reclassificació
La reclassificació en si és l'operació que assigna nous valors categòrics als elements d'un conjunt de dades vectorial, o també a les cel·les d'un conjunt de dades ràster, a partir dels valors d'un atribut categòric ja existent o mitjançant l'aplicació d'una classificació per intervals als valors d'un atribut quantitatiu.
La reclassificació pot servir per a canviar un tipus de codificació per un altre, per a agrupar les classes d'una classificació original en categories més generals d'una nova classificació, per a homogeneïtzar diversos conjunts de dades amb classificacions diferents o per a convertir un atribut quantitatiu en categòric. Quan la reclassificació té per finalitat agrupar les classes d'una classificació original més detallada en categories més generals és quan veritablement actua com a operació d'agregació temàtica, concretament de generalització de la classificació, que pot motivar o no una agregació espacial subseqüent.
Conceptualment, el que fa la reclassificació és assignar la pertinença de cada individu a un conjunt nou, més general, que conté el conjunt original al que pertany cada individu, que es pren com a base per establir, per agrupació, la nova classificació. L'assignació dels individus d'una classe d'elements a un nou conjunt es tradueix a nivell de dades en un nou atribut dels elements d'aquesta classe, típicament en forma d'una nova columna afegida a la taula d'atributs dels elements.
La reclassificació se sol dur a terme, en el cas de les dades vectorials, per mitjà de taules de correspondència entre els valors originals i els nous valors assignats, que es combinen mitjançant una unió relacional amb la taula d'atributs dels elements a reclassificar. La reclassificació no implica pèrdua de la informació original, ja que el resultat de la reclassificació en el cas de les dades vectorials és tan sols un nou atribut categòric afegit a la taula d'atributs dels elements reclassificats. Les taules de correspondència permeten disposar de múltiples classificacions alternatives per aplicar-les segons convingui i són molt ràpides de modificar en cas de voler canviar la reclassificació.
Exemple de reclassificació de dades vectorials per mitjà d'una taula de correspondència: a l'esquerra taula d'atributs dels elements amb la classificació original, a la dreta taula de correspondència entre els valors de la classificació original i una nova classificació més general.
Sumarització
La sumarització és l'operació que calcula estadístics de grup d'un o més atributs quantitatius per a les categories d'un atribut qualitatiu. Per exemple, la mitjana de la superfície de les parcel·les de cada tipus de conreu o la suma del nombre d'habitants dels municipis de cada comarca.
Conceptualment, el que fa la sumarització és calcular valors quantitatius agregats, descriptius d'un conjunt, a partir dels valors individuals dels membres del conjunt. Per aquest motiu, quan es produeix una reclassificació, sovint es considera necessari o d'interès calcular el valor dels atributs quantitatius per als nous conjunts establerts, i per tant pot tenir sentit o interès efectuar una sumarització d'un o més atributs quantitatius d'interès. Recíprocament, quan s'efectua una sumarització, es fa efectiva una determinada agrupació (o pertinença dels individus a una família de conjunts), i per tant pot tenir sentit produir mitjançant una agregació espacial els elements que permeten visualitzar els individus de la nova agrupació.
Exemple de resultat d'una sumarització: nova taula amb la superfície de cada categoria d'ús del sòl.
El resultat de la sumarització és una nova taula que ja no descriu els individus originals sinó els conjunts definits per les categories d'un atribut qualitatius dels individus originals. Per tant, la taula resultant de la sumarització conté només una fila per a cada categoria de l'atribut que ha servit de criteri de sumarització i tantes columnes com atributs quantitatius originals i diferents estadístics s'hagin calculat, més la columna amb els codis o noms de les categories i generalment una columna amb la freqüència o nombre d'individus originals de cada categoria.
Operacions d'agregació espacial
Hi ha diferents operacions d'agregació espacial. Segons el procediment o la finalitat de l'agregació espacial es distingeix entre combinació, dissolució o síntesi. En tots els casos el procés d'unió de la geometria dels elements és automàtica, el que varia és el criteri d'agregació i la manera de produir la geometria.
Combinació
La combinació (merge) és l'operació d'agregació espacial que s'efectua interactivament, a partir d'una selecció prèvia dels elements a agregar per part de l'usuari. El criteri per a agregar els elements en aquest cas pot ser qualsevol, una selecció basada en atributs, una selecció espacial o una selecció interactiva per part de l'usuari. Els elements a combinar no cal que tinguin valors iguals en cap atribut. Segons els diferents programes de SIG, s'ofereix com una operació de geoprocessament o bé com una operació d'edició de dades.
Els elements a combinar, dos o més, han de ser del mateix tipus d'element geomètric i pertànyer al mateix conjunt de dades o classe d'elements per tal que els registres de la taula d'atributs es puguin combinar també. Els elements a combinar poden ser adjacents, encavalcats o disjunts. En el cas d'elements adjacents o encavalcats, el resultat és un sol element del mateix tipus que els originals, que en combina la geometria. En el cas d'elements disjunts, la combinació dóna com a resultat un element de tipus multipart. La combinació de punts genera necessàriament un element multipunt, ja que els punts originals només poden ser disjunts. Si entre els punts originals hi ha algun punt en la mateixa posició que un altre, l'element multipunt manté com a parts tots i cada un dels punts originals encara que tinguin la mateixa posició. En el cas de línies i polígons, si hi ha una barreja d'elements contigus, d'elements encavalcats totalment o parcial i d'elements disjunts, els elements contigus o encavalcats s'uneixen i els disjunts s'afegeixen per a formar l'element multipart. L'operació de combinació només és possible en els models de dades vectorials que admeten elements multipart i, conseqüentment, no és possible en el model de dades vectorial topològic. Altrament, l'edició de dades en el model de dades vectorial topològic sovint no és directa.
Exemple de combinació d'elements: tres parcel·les combinades per a formar una única parcel·la; la parcel·la resultant conserva l'atribut del codi d'illa i rep un valor nou per al codi de parcel·la.
Pel que fa als atributs, segons els programes, és possible indicar quin valor prendrà cada un dels atributs en l'element resultant de la combinació, ja sigui el valor d'un dels elements combinats o bé el resultat d'una operació sobre els valors de tots els elements que s'han combinat, com és ara una suma o una promig.
Dissolució
La dissolució (dissolve) és l'operació d'agregació espacial clàssica, que s'efectua de forma massiva, sobre tots els elements d'un conjunt de dades, emprant com a criteri el valor d'un o més atributs temàtics. Tots aquells elements que compateixen el mateix valor de l'atribut o atributs indicats com a criteri s'agreguen. Els elements que són contigus s'agreguen en un sol element continu, els elements disjunts s'agreguen en un sol element de tipus multipart.
Exemple de dissolució d'elements: les àrees de vegetació de classes més detallades (esquerra) s'agreguen en àrees de vegetació de classes més generals (dreta), combinant els polígons veïns que tenen la mateixa categoria de vegetació més general, com és ara vegetació forestal, arbustiva, etc. Noteu que el primer dígit dels codis de la classificació més detallada (esquerra) són els codis de la classificació més general (dreta).
En els programes de SIG basats en el model de dades vectorial topològic, la dissolució actua només sobre els elements adjacents. En els programes basats en models de dades vectorials que admeten elements multipart tots els elements d'un mateix valor de l'atribut o atributs emprats com a criteri s'agreguen en un sol element multipart. Això pot no ser desitjable, ja que, per exemple, en cas de dissoldre un conjunt de dades que representa la vegetació, el resultat serà un sol element multipart per a cada classe de vegetació, quan probablement interessa més tenir cada àrea de vegetació separada. Per aquest motiu els programes que admeten elements multipart, donen l'opció de triar entre un resultat d'elements multipart o d'elements unipart, que és equivalent al resultat dels programes basats en el model de dades vectorial topològic, ja que només s'uneixen els elements contigus.
Els elements resultants només conserven els atributs que han intervingut com a criteri d'agregació espacial. Alguns programes donen l'opció, a més, de sumaritzar un o més atributs quantitatius presents a la taula d'atributs dels elements originals.
La dissolució s'aplica principalment a línies o polígons i s'utilitza, entre d'altres finalitats, per a derivar unitats territorials jeràrquiques a partir d'altres de nivell inferior (per exemple, illes a partir de parcel·les o comarques a partir de municipis) i per a agregar espacialment el resultat d'una reclassificació; és a dir per a generalitzar espacialment una classificació temàtica en classes més generals, com per exemple vegetació o usos del sòl. En aquest sentit, és una de les operacions bàsiques de geoprocessament.
Síntesi
La síntesi és l'operació d'agregació espacial amb finalitats de generalització cartogràfica de la pròpia representació espacial, a efectes de reflectir l'agregació que resulta d'una reducció del grau de detall o escala de la representació espacial per tal de disminuir una fragmentació excessiva de la representació espacial original (per exemple, un conjunt d'àrees de bosc esmicolades i/o perforades per clarianes). Sovint la reducció de detall de la generalització cartogràfica mitjançant agregació, o síntesi, implica un canvi de conceptualització del fenomen o entitat representada (per exemple, l'agregació d'un conjunt d'edificacions individuals en una àrea edificada).
Exemple de generalització cartogràfica mitjançant agregació o síntesi d'elements.
L'automatització de les operacions de generalització cartogràfica, entre les quals l'operació d'agregació o síntesi, és complexa i difícil. Tradicionalment, són operacions que s'han realitzat de forma manual sota el criteri expert del cartògraf, que té en compte i combina múltiples factors en forma de decisions particulars. No obstant, ha estat sempre un camp de recerca molt actiu en l'àmbit de la cartografia assistida per ordinador i dels sistemes d’informació geogràfica. En el cas de l'operació de síntesi, des de mitjans de la dècada de 2000, alguns programes de SIG ofereixen solucions raonablement bones.
En el cas de l'operació de síntesi, a més del valor d'un o més atributs o condicions que porten a la selecció dels elements a agregar, el criteri d'agregació no és l'adjacència sinó la distància. Tots aquells elements que satisfan les condicions de selecció i que són més pròxims entre si que un cert llindar de distància, inclosos els elements contigus, s'agreguen en un sol element nou de tipus polígon. L'operació de síntesi només és aplicable a conjunts de punts o de polígons, no de línies, ja que conceptualment la generalització de línies utilitza altres procediments de generalització, i el resultat és sempre un polígon continu per a cada conjunt d'elements agregats.
En cap cas es produeixen elements multipart, que deixarien la forma de la representació espacial visualment intacta. La finalitat és necessàriament la producció d'una àrea contínua a partir dels elements originals, la qual cosa implica generar un contorn que els inclogui, aprofitant parts dels contorns dels elements originals, en el cas dels polígons, i traçant parts noves que els uneixin. Alguns programes, per tal d'aconseguir un resultat més acurat i estètic segons la naturalesa de les entitats generalitzades, ofereixen fins i tot l'opció de fer que les diferents parts del contorn del polígon a generar mantinguin angles rectes, per tal d'ajustar-se a la representació d'elements com edificacions o similars. En el cas de la síntesi d'un conjunt de punts, el polígon resultant és el polígon convex que inclou tots els punts.
Operacions d'agregació temàtica amb dades ràster
Reclassificació ràster
Conceptualment la reclassificació de dades ràster és equivalent a la reclassificació d'atributs de les dades vectorials. La reclassificació ràster assigna nous valors a les cel·les d'un ràster segons els valors originals i produeix com a resultat un nou ràster amb els nous valors. La correspondència entre els valors originals i els valors nous se sol especificar també per mitjà d'una taula de correspondència o d'un fitxer de text que conté la correspondència entre valors originals i valors nous. La reclassificació de dades ràster, igual que la reclassificació d'atributs de les dades vectorials, s'aplica tant a valors de cel·la categòrics per agrupar categories detallades d'una classificació en categories més generals d'una nova classificació, com a valors quantitatius per a classificar-los per intervals.
Exemple de reclassificació d'un ràster de valors categòrics: el ràster de l'esquerra distingeix entre matollar i prat i entre bosc de coníferes i bosc de caducifolis, mentre que el ràster de la dreta agrupa matollar i prat en una sola categoria i els dos tipus de bosc també.
Exemple de reclassificació d'un ràster de valors quantitatius: classificació del valor continu de distància (esquerra) en deu intervals (dreta).
La reclassificació de les dades ràster produeix sempre directament l'efecte visual d'una agregació espacial, encara que en realitat el ràster original i el ràster resultat de la reclassificació són simplement un conjunt de cel·les independents ordenades en files i columnes, i per tant són geomètricament idèntics.
Sumarització ràster
La sumarització calcula estadístics de grup d'un o més atributs quantitatius per a les categories d'un atribut qualitatiu. En el cas de les dades ràster la sumariització calcula estadístics de grup dels valors de les cel·les d'un ràster de valors quantitatius per a grups de cel·les definits de diverses maneres:
- mitjançant cel·les de resolució més gran d'un nou ràster a generar; es tracta d'una variant de remostreig mitjançant sumarització.
- mitjançant un veïnat d'un cert nombre de cel·les definit a l'entorn de cada cel·la; es tracta d'un cas de funció focal, concretament una sumarització focal, que alguns programes anomenen estadístics focals. El càlcul és semblant a l'anterior, però el resultat s'assigna a la cel·la en què es centra la finestra mòbil de veïnat que es desplaça de cel·la en cel·la i produeix un ràster de la mateixa resolució que l'original.
- mitjançant les categories definides per un altre ràster de valors categòrics; es tracta d'un cas de funció de classe, concretament una sumarització per classes. És el cas de sumarització ràster més semblant al de la sumarització vectorial. El càlcul assigna el valor de l'estadístic de grup a totes les cel·les que tenen el mateix valor de categoria en el ràster categòric. El resultat és un un ràster de la mateixa resolució que l'original.
- mitjançant grups de cel·les definides per un altre ràster de valors categòrics, en què cada grup de cel·les té un valor categòric diferent; es tracta d'un cas de funció zonal, concretament una sumarització zonal. El procediment de càlcul és idèntic al de la sumarització per classes. El que varia és el fet que les categories del ràster categòric identifiquen grups de cel·les contigües, és a dir àrees o zones més que no pas classes diferents. El resultat és un un ràster de la mateixa resolució que l'original. En la categorització original de funcions de l'àlgebra de mapes (Tomlin, 1990) no es distingeix entre funcions de classe i funcions zonals, totes es consideren funcions zonals.
Exemple de remostreig mitjançant sumarització: càlcul del valor màxim de les cel·les del ràster original (esquerra) contingudes dins les cel·les més grans del ràster resultant (dreta).
Desagregació
La desagregació és l'operació o procés invers de l'agregació, el qual té per finalitat obtenir dades de més detall que les dades originals. La desagregació pròpiament dita, tanmateix, no és possible, ja que per definició és impossible d'invertir una agregació, atès que comporta la pèrdua de la informació individual original. Això no obstant, es poden efectuar estimacions basades sempre en una aportació d'informació complementària i en supòsits de certa versemblança o operativitat.
En el context de la informació geoespacial, la desagregació espacial és l'operació que fracciona un element geomètric en elements geomètrics del mateix tipus, generalment mitjançant la superposició amb informació espacial complementària, per a obtenir dades de més detall. Un exemple de desagregació espacial és l'anomenada cartografia dasimètrica, que és una tècnica per a representar dades quantitatives agregades per unitats territorials de manera més detallada i acurada dins d'aquestes unitats, mitjançant la superposició dels límits d'àrees inferiors que exclouen, restringeixen o confinen la distribució de l'atribut en qüestió. Per exemple, la distribució espacial de la població municipal total (agregada) es pot representar més acuradament si es consideren únicament les àrees urbanitzades dins del municipi. Generalment, a falta de supòsits millors, el total de població municipal se sol repartir proporcionalment a la superfície de les àrees urbanitzades, o mitjançant supòsits de densitat si es té més informació.
Temes relacionats
- Àlgebra de mapes.
- Generalització.
- Model de dades ràster.
- Model de dades vectorial.
- Sistema d’informació geogràfica.
- Superposició.
- Unió relacional.
Referències
McHarg, I.L. (1969) Design with Nature, New York: Natural History Press.
Tomlin, C.D. (1990) Geographic Information Systems and Cartographic Modeling, Englewood Cliffs, New Jersey: Prentice Hall.
Tomlinson, R.F. (1967) An Introduction to the Geographic Information System of the Canada Land Inventory. Ottawa: Department of Forestry and Rural Development.
Tomlinson, R.F. (1980) "The handling of data for natural resources development". Proceedings of Workshop on Information Requirements for Dvelopment Planning in Developing Countries. Enschede: ITC.
Tomlinson, R.F.; Calkins, H.W. and Marble, D.F. (1976) Computer handling of geographical data. Geneva: UNESCO.
Lectures recomanades
Burrough, P.A. (1986) Principles of Geographical Information Systems for Land Resources Assessment, Oxford, UK, Clarendon Press. Chapter 5.
Tomlinson, R.F. (1980) "The handling of data for natural resources development". Proceedings of Workshop on Information Requirements for Dvelopment Planning in Developing Countries. Enschede: ITC.