Problema de la unitat espacial modificable. Institut Cartogràfic i Geològic de Catalunya

Autor: Dr. Joan Nunes. Universitat Autònoma de Barcelona
Promotor: Institut Cartogràfic de Catalunya, 2013

El problema de la unitat espacial modificable (modifiable areal unit problem, MAUP) fa referència a la dependència que presenten els resultats de les anàlisis estadístiques de dades agregades en unitats espacials respecte de les unitats espacials emprades. Així, per exemple, l'anàlisi de dades del cens de població, com és ara el percentatge de població de 65 anys i més, agregades en àrees, dóna resultats diferents per a cada tipus d'unitat espacial diferent (seccions, districtes, municipis o comarques) emparada per a agregar i analitzar les dades.

El problema de la unitat espacial modificable és una font de biaix estadístic, en la mesura que els resultats presenten una dependència sistemàtica respecte de la unitat d'anàlisi i per tant són qüestionables, però sobretot és una font d'incertesa respecte a dos aspectes fonamentals: a) quina és la validesa de l'anàlisi efectuada a un determinat nivell d'agregació, és a dir emprant una determinada unitat espacial d'agregació de les dades; i b) quina és la unitat espacial adequada per a l'agregació i anàlisi d'unes determinades dades, i per tant i en definitiva per a l'estudi d'u determinat fenomen i de la seva distribució espacial.

El problema afecta qualsevol anàlisi de dades agregades per zones, que ha estat el tipus de dades geogràfiques disponible i utilitzat de forma predominant en geografia quantitativa en les dècades de 1960 i 1970, raó per la qual ha estat considerat com una de les limitacions fonamentals d'una part substancial de l'anàlisi espacial en geografia. Fora de l'àmbit de la geografia, el problema de la unitat espacial modificable ha estat considerat també en ecologia del paisatge, atès que presenta també casos similars d'anàlisi de dades agregades espacialment amb problemes de dependència d'escala, i també en epidemiologia, en econometria i en sociologia.

El problema de la unitat espacial modificable es relaciona amb altres aspectes de les dades espacials i de l'anàlisi de dades agregades, com la dependència d'escala i la fal·làcia ecològica, però és un problema diferent, específic de la definició d'unitats zonals d'anàlisi. Segons les interpretacions es pot considerar un problema de mala conceptualització dels objectes d'anàlisi, que desapareix en especificar-los correctament i redefinir les dades i les anàlisis conformement, o bé com un problema intrínsec de la partició de l'espai en àrees significatives respecte de la distribució espacial d'un determinat fenomen, el qual, si bé és essencialment insoluble, pot ser aprofitat avantatjosament en favor d'un millor coneixement del comportament espacial del fenomen o de l'assoliment d'una partició de l'espai que maximitzi un determinat objectiu. La majoria de la recerca desenvolupada en relació al problema de la unitat espacial modificable s'ha adreçat en aquesta darrera direcció, així com a la reducció o objectivació del biaix estadístic introduït per l'agregació espacial de dades en àrees.

Sumari:

Origen
Definició
Recerca de solucions
3.1 Un problema inexistent
3.2 Un problema insoluble
Temes relacionats
Referències
Lectures recomanades

Origen

El problema de la unitat espacial modificable va ser evidenciat per primer cop per Gehlke i Biehl (1934).en un estudi que mostrava com els coeficients de correlació entre dues variables (delinqüència juvenil i renda familiar mitjana) agregades en unitats territorials diferents augmentaven a mesura que les dades eren agregades en unitats territorials cada cop més grans. El biaix resultava sistemàtic quan les unitats territorials s'agrupaven en nivells superiors respectant la restricció de contigüitat entre àrees (és a dir, agrupant només àrees veïnes), mentre que l'agrupació aleatòria d'àrees no necessàriament contigües donava resultats també diferents per a cada agrupació d'àrees però no sistemàticament creixents. A la vista dels resultats, els autors es qüestionaven: a) si l'anàlisi de correlacions entre variables per mitjà de dades agregades descriu o mesura realment la interrelació entre característiques dels individus originals (problema de la fal·làcia ecològica); b) quin valor podien tenir les anàlisis fetes amb dades agregades; i c) si les unitats zonals són realment objectes d'estudi amb característiques pròpies o simplement un atribut descriptiu de la localització dels individus reals (p.e., persones o famílies en el cas de l'estudi de Gehlke i Biehl).

Yule i Kendall (1950) presentaren resultats similars i demostraren que el coeficient de correlació augmenta amb l'escala pel simple fet que el nombre de casos es menor i la variabilitat disminueix. Sense fer referència al problema de la fal·làcia ecològica, ni al de la correcta conceptualització dels objectes d'estudi, Yule i Kendall qüestionaven igualment la validesa de les anàlisis i apuntaven la conclusió important que els resultats d'anàlisis fetes amb dades agregades per a una determinada unitat espacial són únicament vàlids per a la unitat espacial escollida. Els resultats obtinguts per a una determinada unitat espacial no tenen validesa universal però tanmateix poden tenir un valor descriptiu i històric si la unitat espacial utilitzada té algun significat específic (p.e., els comtats anglesos l'any 1936, en el cas de l'estudi de Yule i Kendall).

Altres treballs, simultanis o posteriors, aportaren evidències addicionals en relació als problemes de fal·làcia ecològica i de dependència d'escala. Robinson (1950) féu la comparació dels coeficients de correlació entre variables analitzades a nivell d'individus (persones, en aquest cas) i amb dades agregades en unitats territorials, amb resultats que demostraven com l'existència de correlació era un producte de l'agregació ja que no es donava a nivell dels individus originals. Blalock (1964), d'altra banda, féu la comparació dels coeficients de correlació obtinguts amb dades agregades agrupant aleatòriament unitats espacials o bé agrupant-les aleatòriament però respectant la contigüitat entre les unitats espacials originals, amb el resultat ja observat per Gehlke i Biehl que els coeficient de correlació calculats per a les agrupacions completament aleatòries, tot i donar valors diferents per a cada agrupació diferent, no presentaven el biaix sistemàtic creixent que mostraven les agrupacions d'àrees contigües per efecte de l'autocorrelació espacial, ja que la semblança entre àrees properes es mantenia en agrupar àrees contigües.

La formulació explícita del problema de la unitat espacial modificable apareixeria més tard, a finals de la dècada de 1970, arran dels treballs d'Openshaw (1977) i Openshaw i Taylor (1979, 1981), en els quals es planteja com l'efecte d'obtenir patrons artificials o incerts com a resultat d'imposar unitats espacials (àrees) arbitràries i modificables per a donar compte i analitzar de forma agregada dades sobre fenòmens geogràfics continus.

Després de la formulació inicial i exploració d'algunes vies de solució (Openshaw, 1978; 1984), el problema de la unitat espacial modificable ha continuat rebent una certa atenció, tant en geografia (Fotheringham i Wong, 1991; Heywood, 1998; Openshaw i Alvandies, 1999), com en altres disciplines, entre les quals l'ecologia del paisatge (Jelinski i Wu, 1996), l'epidemiologia (Wong et al., 1999) o l'econometria (Arbia i Petrarca, 2011). Habitualment s'ha considerat que el problema de la unitat espacial modificable és un problema propi de l'anàlisi de dades socioeconòmiques i per tant de la geografia humana, però també s'ha plantejat en geografia física (Dark, 2007).

Definició

El problema de la unitat espacial modificable ha estat definit formalment (Openshaw, 1977; 1984; Heywood, 1998) com el problema que sorgeix de la imposició d'unitats espacials (àrees) arbitràries i modificables per a fer recomptes i analitzar de forma agregada fenòmens geogràfics continus, la qual cosa dóna lloc a resultats variables segons el nivell d'agregació de les dades, i per tant incerts, o condicionats per les unitats espacials emprades, i per tant suposadament artificials.

El problema de la unitat espacial modificable té, segons Openshaw (1977), dos components: l'efecte d'escala i l'efecte de zonificació.

L'efecte d'escala produeix variacions en els resultats de les anàlisis a causa de l'agrupament i reducció del nombre de casos utilitzats en l'anàlisi quan les dades s'agreguen en zones, ja sigui a partir dels individus originals o de zones més petites (per exemple, diferències en l'anàlisi del nivell mitjà de renda per municipis o per comarques).

L'efecte de zonificació (o, en la terminologia original d'Openshaw, efecte d'agregació) produeix variacions en els resultats de les anàlisis a causa de les diferents possibles maneres d'agrupar les dades d'individus o de zones petites en un nombre determinat de zones més grans, és a dir mantenint el nivell d'escala constant.

Problema de la unitat espacial modificable. a) efecte d'escala: diferència en el % d'atur deguda a l'agregació de 9 a 3 zones; b) efecte de zonificació: diferència en el % d'atur entre les diferents maneres de fer l'agregació de 9 a 3 zones.

Cal remarcar també que, l'efecte de zonificació pot ser força diferent si, tot i tenir en compte totes les possibles combinacions per a produir un cert nombre d'àrees agregades, es restringeix l'agregació únicament a les àrees contigües o bé si es poden agrupar àrees qualsevol encara que les àrees agregades resultants no siguin un sola zona contínua. En el cas de mantenir la restricció de contigüitat l'existència d'autocorrelació espacial entre les àrees veïnes produeix resultats més homogenis en les àrees agregades que reflecteixen un cert patró espacial. En canvi, quan s'agreguen àrees qualssevol, contigües o no, l'efecte de l'autocorrelació espacial desapareix i el resultat pot ser completament arbitrari, sense cap tendència sistemàtica, ni que sigui esbiaixada.

Segons Openshaw (1977, 1984) és l'efecte de zonificació, de caire combinatori, el que fa del problema de la unitat espacial modificable un problema específic, diferent del problema de dependència d'escala, per bé que aquest té una part molt destacada en el problema de la unitat espacial modificable i efectes importants en els resultats. També, segons Openshaw, és aquest efecte de zonificació el que pot ser aprofitat com una eina d'anàlisi i proporcionar una de les possibles solucions al problema de la unitat espacial modificable.

Recerca de solucions

Segons els termes en què es plantegi, el problema de la unitat espacial modificable pot ser un problema inexistent o bé un problema insoluble o, si més no, endèmic i difícil de tractar. El mateix autor que més s'ha destacat en el reconeixement i recerca del problema, Openshaw, fa referència continuadament a aquesta dicotomia (Openshaw, 1984).

Un problema inexistent

El problema de la unitat espacial modificable existeix perquè es desconeixen quines són les entitats espacials -en general, entitats o individus geogràfics- que constitueixen l'objecte d'estudi (Openshaw, 1984). En aquest sentit, una gran part del problema, o de situacions en què es planteja el problema, són degudes a una mala conceptualització dels objectes d'estudi.

L'objecte d'estudi: àrees o entitats?

Tal com posen de manifest els primers estudis de les dècades de 1930 i 1950, procedents del camp de l'estadística, molts dels casos aportats com a evidències són casos flagrants de fal·làcia ecològica, en el sentit que no plantegen l'anàlisi del fenomen estudiat a través dels individus reals i pertinents (per exemple, persones, famílies, empreses, etc.) sino a través d'agregacions (per exemple, totals per municipis o per províncies). Els mateixos Gehlke i Biehl (1934) es feien la pregunta de si les unitats espacials (zones) són entitats per si mateixes, amb característiques pròpies, que poden ser estudiades, o si simplement són un atribut descriptiu dels individus originals que n'expressa amb major o menor resolució la localització geogràfica. En molts casos és evident que es tracta d'aquest segon cas.

La significació dels resultats referits a àrees: utilitat limitada a les àrees emprades

Els resultats de les anàlisis amb dades agregades són dependents del criteri d'agregació imposat i per tant només vàlids o descriptius de les unitats espacials per a les quals han estat realitzades les anàlisis. Aquest advertiment, també força inicial (Yule i Kendall, 1950), juntament amb la remarca que, malgrat tot, els resultats per a unes determinades unitats espacials poden ser útils per a descriure aquelles unitats espacials i tenir un valor històric i geogràfic, dóna a entendre clarament que l'anàlisi de dades agregades pot ser vàlid amb finalitats descriptives d'un determinat conjunt d'àrees, en el ben entès que no es tracta d'analitzar el fenomen, sinó de descriure les àrees, sempre que aquestes tinguin un determinat interès o significació (per exemple, el valor històric de ser una determinada divisió administrativa, o la significació geogràfica de constituir l'àrea funcional d'un sistema urbà). En altres paraules, les àrees a estudiar han de tenir una certa significació per si mateixes i cal ser conscient que l'anàlisi de les dades agregades per a un determinat conjunt d'àrees només descriu aquelles àrees.

Openshaw (1984) es refereix a aquest tipus d'aproximació com la solució no geogràfica, quan les àrees tenen una definició independent del fenomen, o com la solució tradicional geogràfica, quan les àrees tenen una definició independent del fenomen que reflecteix l'estructura del territori o un determinat procés. Significativament l'autor remarca que aquest tipus de solució funciona bé quan hi ha un coneixement geogràfic suficient per a definir amb un alt nivell de precisió el tipus d'àrees que tenen més sentit per a un determinat propòsit. L'autor afegeix tot seguit que hi ha moltes àrees en geografia en què aquest coneixement no es té, la qual cosa és el corol·lari de la mala o insuficient conceptualització dels objectes d'estudi.

L'espai geogràfic, continu?

Una darrera font del problema és l'assumpció, molt comuna en les dècades de 1960 i de 1970, que l'espai geogràfic i tots els fenòmens geogràfics són, per definició, necessàriament continus. Aquest supòsit, lligat a la vocació subjacent de la geografia de diferenciar zonalment la superfície terrestre, permet entendre la visió imperant en la geografia quantitativa de la dècada de 1970, segons la qual es necessita alguna forma de discretització o de partició en àrees dels fenòmens continus per tal de poder descriure'ls en termes de diferenciació zonal de l'espai. D'altra banda, el fet que certament les dades agregades per mitjà d'unitats censals o administratives, sovint arbitràries, hagin estat durant dècades el tipus d'informació geogràfica més corrent o gairebé l'únic, permet entendre que l'anàlisi espacial sembli haver de fer-se necessàriament mitjançant dades agregades en unitats espacials zonals (àrees).

Alguns dels errors associats a aquest tipus de visió van des de l'afirmació que les entitats no espacials (persones, famílies, empreses, etc.) no tenen propietats espacials com localització per poder analitzar els fenòmens espacialment per mitjà dels individus originals, fins a l'afirmació que les dades socioeconòmiques, ecològiques o epidemiològiques no poden ser mesurades en localitzacions puntuals, sinó que han de ser sempre referides a àrees que les continguin.

Una millor conceptualització dels objectes d'estudi inclou també una millor conceptualització de la seva localització, la qual, salvant raons o pràctiques històriques de com es generen o publiquen les dades, sempre pot ser referida a una posició acurada. Després, la naturalesa del fenomen, segons que es tracti d'un fenomen de variació contínua o discreta a través de l'espai (Nunes, 1991), comportarà l'elecció d'una metodologia d'anàlisi o altra com a més adequada. En tot cas i per a aquells fenòmens veritablement continus, l'anàlisi per mitjà de dades agregades en unitats espacials (àrees) no sembla el més adequat en cap sentit. Les dades contínues es poden analitzar mitjançant nombrosos mètodes d'estadística espacial, d'interpolació o de geoestadística, que tracten efectivament de fenòmens de variació contínua en funció de la localització.

L'efecte d'escala

En relació a l'efecte d'escala nombrosos autors remarquen que l'ús d'unitats espacials (àrees) petites augmenta la variabilitat i tendeix a produir resultats massa divergents, mentre que l'ús d'àrees grans, tot i produir resultats més estables o homogenis, sovint homogeneïtza massa la variació i anul·la variacions significatives que tenen lloc amb unitats espacials d'escala més petita. L'elecció d'unitats espacials d'escala (grandària) adequada sembla precisament l'arrel del problema de la unitat espacial modificable quan s'assumeix o persegueix l'existència d'una escala (i d'una partició de l'espai) correcta. Quan s'assumeix que la variabilitat observable varia amb l'escala el problema sembla ser simplement el de descriure la variabilitat a diferents escales, cada una amb la seva significació específica.

La unitat espacial modificable: problema o error?

Quan el problema de la unitat espacial modificable es planteja assumint la correcta conceptualització dels objectes d'estudi, la significació limitada de la descripció d'unitats espacials mitjançant dades agregades i la no necessària continuïtat de molts dels fenòmens que tenen lloc sobre la superfície terrestre, el problema sembla més aviat una llista dels errors a evitar en el cas d'haver de treballar amb dades agregades en unitats espacials. En aquest sentit, les conclusions dels treballs inicials de la dècada de 1930 i 1950, procedents del camp de l'estadística, potser eren simplement l'alerta dels efectes i errors a evitar.

Un problema insoluble

El problema de la unitat espacial modificable, d'altra banda, pot o requereix ser tractat quan l'ús de dades agregades en unitats territorials és inevitable. El problema, plantejat en els seus propis termes, és, si no insoluble, díficil de tractar, ja que cada agregació produeix resultats diferents i, sense coneixement afegit, que permeti interpretar la variabilitat i atribuir significació específica a una o altra partició de l'espai, no hi ha criteri de decisió.

Aquesta dificultat ha estat abordada de diverses maneres. Openshaw (1978, 1984), tot advertint que no hi ha solucions miraculoses, proposà aprofitar el problema i convertir-lo en una eina d'anàlisi espacial. En aquest sentit, avançà i experimentà amb la idea que, si les unitats espacials d'anàlisi són modificables, hom pot tractar de generar aquelles unitats espacials que satisfacin o maximitzin un determinat objectiu (per exemple, maximitzar la correlació espacial entre dues variables). La finalitat en aquesta aproximació no és tant produir les unitats espacials "correctes" i per tant donar solució al problema, com veure la forma espacial que pren la materialització d'una hipòtesi. Els resultats obtinguts amb aquesta aproximació combinatòria són en general estranys pel que fa a forma i distribució de les unitats espacials generades i no concloents. Anecdòticament, cal remarcar, com assenyala el mateix autor, que aquesta manera de procedir ha estat, de fet, una pràctica amb aplicacions conegudes en l'administració pública per a la redefinició d'unitats territorials (redistricting) amb criteris com és ara assolir un determinat llindar d'habitants o d'altres, i també en política per l'establiment d'una divisió electoral fraudulenta (gerrymandering) mitjançant l'alteració dels límits de les circumscripcions electorals de forma deliberada per tal d'afavorir una determinada opció política.

El problema és lluny d'haver trobat una solució i ha continuat generant esforços de recerca, més enllà de l'aproximació combinatòria apuntada. Alguns dels treballs recents de recerca de solucions al problema de la unitat espacial modificable es basen en altres aproximacions, com és ara l'aplicació d'estadístics de teoria de la informació (Nakaya, 2000) o bé l'ús d'estadística bayesiana (Hui, 2009).

Temes relacionats

Referències

Arbia, G. and Petrarca, F. (2011) "Effects of MAUP on spatial econometric models", Letters in Spatial and Resource Sciences, 4, 3, 173-185.

Blalock, H. (1964) Causal inferences in nonexperimental research. Chapel Hill: University of North Carolina Press.

Dark, S.J. (2007) "The modifiable areal unit problem(MAUP) in physical geography", Progress in Physical Geography, 31, 5, 471-479.

Fotheringham, A.S. and Wong, D.W.S. (1991) "The modifiable areal unit problem in multivariate statistical analysis", Environment and Planning A, 23, 7, 1025-1044.

Gehlke, C. and Biehl, H. (1934) "Certain effects of grouping upon the size of the correlation coefficient in census tract material", Journal of the American Statistical Association Supplement, 29, 169–170.

Heywood, I. (1998) Introduction to Geographical Information Systems. New York: Addison Wesley.

Hui, C. (2009) "A bayesian solution to the modifiable areal unit problem" in Hassanien, A.E.; Abraham, A. and Herrera, F. (eds.) Foundations of Computational Intelligence, Volume 2. Berlin: Springer-Verlag.

Jelinski, D.E. and Wu, J. (1996) "The modifiable areal unit problem and implications for landscape ecology", Landscape Ecology, 11, 3, 129-140.

Nakaya, T (2000) "An information statistical approach to the modifiable areal unit problem in incidence rate maps", Environment and Planning A, 32, 1, 91-109.

Nunes, J. (1991) "Geographic Space as a Set of Concrete Geographical Entities" in Mark, D.M. and Frank, A.W. (eds.) Cognitive and Linguistic Aspects of Geographic Space. Dordrecht, Nederland: Kluwer Academic Publishers.

Openshaw, S. (1977) "A geographical solution to scale and aggregation problems in region-building, partitioning, and spatial modelling", Transactions of the Institute of British Geographers, New series, 2, 459-472.

Openshaw, S. (1978) "An optimal zoning approach to the study of spatially aggregated data" in Masser, I. and Brown, P.J.B. (eds.) Spatial representation and spatial interaction. Leiden: Martinus Nijhoff.

Openshaw, S. (1984). The Modifiable Areal Unit Problem. CATMOG (Concepts and Techniques in Modern Geography), 38, Norwich: GeoBooks.

Openshaw, S, and Alvandies, S. (1999) "Applying geocomputation to the analysis of spatial distributions" in Longley, P.; Goodchild, M.; Maguire, D. and Rhind, D. (eds) Geograhpic Information Systems: Principles and Technical Issues. New York: John Wiley and Sons.

Openshaw, S. and Taylor, P.J. (1979) "A million or so correlation coefficients: three experiments on the modifiable areal unit problem" in Wrigley, N. (ed.) Statistical methods in the spatial sciences. London: Pion.

Openshaw, S. and Taylor, P.J. (1981) "The modifiable areal unit problem" in Wrigley, N. and Bennett, R.J. (eds.) Quantitative geography: a British view, London: Routledge and Kegan Paul.

Robinson, A.H. (1950) "Ecological correlation and the behaviour of individuals", American Sociological Review, 15, 351-357.

Wong, D.W.S.; Lasus, H. and Falk, R.F. (1999) "Exploring the variability of segregation index D with scale and zonal systems: an analysis of thirty US cities", Environment and Planning A, 31, 3, 507-522.

Yule, G.U. and Kendall, M.G. (1950) An introduction to the theory of statistics. London: Griffin.

Lectures recomanades

Openshaw, S. (1984) The Modifiable Areal Unit Problem. CATMOG (Concepts and Techniques in Modern Geography), 38, Norwich: GeoBooks.