Semivariograma
Autor: Dr. Joan Nunes. Universitat Autònoma de Barcelona
Promotor: Institut Cartogràfic de Catalunya, 2013
Un semivariograma és un gràfic emprat en geoestadística per a representar la funció de semivariància que descriu el grau de dependència o de correlació espacial d'una variable aleatòria, o procés estocàstic, distribuïda de forma contínua a l'espai (variable de superfície). Concretament, el semivariograma és el gràfic que representa la semivariància de les diferències de valor de la variable de superfície entre parells de posicions com a funció de la distància entre posicions, anomenada separació. Per comoditat, s'anomena semivariograma tant la funció de semivariància de les diferències de valors entre posicions segons la distància, com el gràfic que la representa.
La semivariància de les diferències de valor entre posicions és una de les funcions més significatives per a analitzar la correlació espacial entre els valors d'una variable de superfície mesurada en un conjunt de punts de mostreig. El semivariograma elaborat a partir de les observacions (semivariograma experimental) és útil per a construir models matemàtics o probabilístics que descriguin la variació espacial de la variable d'interès entre punts de mostreig en forma de mesura de variació dels valors en funció de la distància. Aquest tipus de models s'anomenen models de semivariograma i, a més de descriure la variació espacial de la variable de superfície, serveixen per a fer estimacions o interpolació espacial de valors de la variable de superfície en posicions desconegudes, principalment en el mètode d'interpolació de krigatge.
El semivariograma és una de les eines bàsiques de la geoestadística i és utilitzat en totes les disciplines que analitzen la distribució espacial dels fenòmens, entre les quals la geologia, principalment per a la prospecció minera, la hidrologia i la hidrogeologia, l'oceanografia, la geoquímica, la meteorologia, la geografia, l'epidemiologia, les ciències ambientals, l'ecologia del paisatge, l'edafologia i l'agricultura de precisió.
Semivariograma: representació gràfica de la funció de semivariància de les diferències de valors entre parells de posicions, γ, respecte de la separació, h, entre parells de posicions.
SUMARI
- Origen
- Definició
- Models de semivariograma
- Limitacions
- Aplicacions
- Temes relacionats
- Referències
- Lectures recomanades
Origen
El concepte formal i el terme de semivariograma fou establert per l'enginyer de mines francès Georges Matheron (1962, 1963) a partir dels treballs desenvolupats pel geòleg sudafricà Daniel G. Krige aplicats a la predicció de la localització, contingut i qualitat dels dipòsits de minerals (Krige, 1951), que han donat lloc al mètode d'interpolació geoestadística que porta el seu nom, el krigatge.
El concepte sembla que s’hagi desenvolupat paral·lelament també en altres disciplines com la meteorologia, per mitjà dels treballs de L.S. Gandin (1963) a la unió soviètica, que introduí un mètode d'interpolació similar anomenat "interpolació estadística" o "interpolació òptima", el qual utilitza igualment funcions de covariància entre les observacions espacials. En el camp de l'estadística el concepte de semivariograma s'ha utilitzat també sota diferents noms com "funció d'estructura" en l'estudi de la probabilitat (Yaglom, 1962).
Definició
La funció de semivariància, y(h), es defineix com la meitat de la variància de les diferències dels valors de la variable aleatòria entre parells de posicions, var(z(xi + h) - z(xi)), separades per una determinada distància, h, anomenada separació (lag).
on
y és la semivariància de les diferències de valors de la variable aleatòria z entre dues posicions separades per una separació h
z(xi) és el valor de la variable aleatòria z en la posició xi
z(xi+h) és el valor de la variable aleatòria z en la posició ximés una separació h
Tenint en compte que la variància de les diferències dels valors de la variable aleatòria entre parells de posicions separades per una determinada separació, h, es defineix com la mitjana de les diferències de valors al quadrat:
on
2y(h) és la variància de les diferències de valors de la variable aleatòria z entre dues posicions separades per una separació h
z(xi) és el valor mesurat de la variable aleatòria z en la posició xi
z(xi+h) és el valor mesurat de la variable aleatòria z en la posició ximés una separació
n(h) és el nombre de parells de punts separats per una separació h
Aleshores la semivariància de les diferències dels valors de la variable aleatòria entre parells de posicions separades per una determinada separació, h, es defineix com
El terme 2y(h) és la funció teòrica de variància, també anomenada variograma, mentre que el terme y(h) és la funció de semivariància, anomenada també per comoditat semivariograma. D'acord amb la fórmula de càlcul de la funció de semivariograma, el variograma és el doble de la funció de semivariograma. En geoestadística, per simplicitat s'utilitza la funció (i el gràfic) de semivariograma. Aquest fet ha provocat que sovint s'utilitzi incorrectament variograma com a sinònim de semivariograma. Confusió que cal evitar (Bachmaier and Backes, 2008).
El semivariograma experimental és la funció que estima la semivariància de les diferències en funció de la separació i que pren la forma de gràfic que representa la semivariància empírica, calculada a partir de les observacions, en funció de la separació. La semivariància experimental, calculada a partir dels valors de la variable d'interès en els punts de mostreig, es defineix mitjançant l'expressió:
El semivariograma és un mètode exploratori que s'utilitza per a descriure la correlació espacial d'una variable espacial aleatòria. El semivariograma proporciona una descripció quantificada de la variació regionalitzada d'una variable espacial aleatòria, permet identificar els patrons de variabilitat espacial, optimitzar la separació i ajustar un model de semivariograma que serveix per a la interpolació espacial de la variable analitzada mitjançant el mètode de krigatge.
Observant la forma del semivariograma, segons un model de semivariograma ideal, es pot veure com la funció de semivariància de les diferències entre els valors de la variable augmenta en funció de la separació fins assolir una tendència assimptòtica que indica el punt en que la semivariància esdevé independent de la distància entre punts de mostreig (separació) i per tant els valors esdevenen independents els uns dels altres. El valor de semivariància en què la funció esdevé assimptòtica s'anomena sostre (sill) i el valor de separació corresponent s'anomena abast (range). Així, l'abast i el sostre permeten descriure i mesurar la variabilitat de la variable segons les observacions i ajustar-hi un model de funció per a realitzar la interpolació o estimació dels valors de la variable en posicions en què és desconegut.
Quan el semivariograma s'extrapola fins a distància 0, idealment el valor de la semivariància hauria de ser també 0. Tanmateix, factors com l'error de mesura, o error de mostreig, poden ocasionar que el valor de la semivariància a distància 0 sigui un valor no nul, anomenat residu (nugget).
Forma ideal de semivariograma, corresponent a l'anomenat model esfèric o model de Matheron.
Els semivariogrames es poden classificar segons les propietats d'isotropia, transitivitat i escala.
Un semivariograma isòtrop és un semivariograma que mostra un patró de variació espacial igual en totes direccions, mentre que un semivariogramaanisòtrop mostra un patró de variació espacial canviant segons la direcció.
Un semivariograma transitiu és aquell que posseeix un abast i un sostre dins del domini d'interès. Contràriament, en un semivariograma intransitiu el sostre no s'assoleix dins del domini d'interès.
Finalment, un semivariograma multiescala és un semivariograma que es pot descompondre en diversos components de variació espacial, segons un model lineal de variables regionalitzades covariants.
Models de semivariograma
Models bàsics de semivariograma
Un cop es disposa del semivariograma experimental construït a partir de les observacions dels punts de mostreig, l'anàlisi descriptiva de la variació espacial de la variable de superfície o la interpolació de valors en posicions desconegudes, requereix l'ajust d'una funció matemàtica als valors de semivariància i separació observats en el gràfic del semivariograma. La funció matemàtica ajustada als valors del semivariograma derivats dels punts de mostreig s'anomena model de semivariograma. Els models de semivariograma utilitzen diversos tipus de funcions o models, entre els quals el model lineal, el model esfèric, que correspon a l'ideal de variable regionalitzada, el model exponencial o el model gaussià, que correspon a la distribució de probabilitat normal. En alguns casos de variables de superfície amb una variació complexa s'utilitzen combinacions de diversos models. D'altra banda, a part de les diferents funcions de model de semivariograma, els mètodes que es fan servir per ajustar el model als punts del semivariograma també poden ser diferents.
Models bàsics de semivariograma: a) model esfèric; b) model lineal; c) model exponencial
La formulació de les funcions de semivariància, com a funció de la separació, corresponents als models bàsics de semivariograma és la següent:
model lineal: γ (h) = τ 2 + σ2h per a h >
model esfèric: γ (h) = τ 2 + σ2 per a h > = abast
y(h) = τ 2 + σ2 [ 1.5h / abast - 0.5 h3 / abast3] per a 0 < h < = abast
model exponencial: γ (h) = τ 2 + σ2 (1 - exp(-φh)) per a h > 0
model gaussià: γ (h) = τ 2 + σ2 (1 - exp(-φ2h2)) per a h > 0
essent en tots els casos γ (h) = 0 per a h =
El model esfèric de semivariograma es basa en una funció esfèrica per a ajustar una funció al semivariograma experimental que resulta de les dades observades. El model esfèric de semivariograma, anomenat també model de Matheron es considera el semivariograma de forma ideal perquè produeix un semivariograma en què l'abast i el sostre són clarament visibles.
El model exponencial de semivariograma ajusta una funció exponencial al semivariograma experimental. El model exponencial de semivariograma produeix un semivariograma en què el residu i el sostre són visibles i l'abast és gradual.
Semivariograma direccional
Els models bàsics de semivariograma només consideren la separació entre parells de punts de mostreig a l'hora de modelitzar la variació dels valors de la variable aleatòria, però no la direcció relativa entre cada parell de punts. És a dir, assumeixen que la variació de la variable aleatòria compleix la condició d'isotropia. Els semivariogrames que modelitzen la variació de la variable aleatòria en condicions d'anisotropia s'anomenen semivariogrames direccionals.
Per tal de considerar la direcció entre punts de mostreig en la construcció del semivariograma, l'espai cobert pels punts de mostreig es divideix en sectors basats en angles i s'elabora un semivariograma separat per a cada sector de direccions.
Els semivariogrames direccionals presenten dificultats d'interpretació dels resultats com és ara les variacions dels residus, sostres i abasts en cada semivariograma parcial en relació a la direcció. Altres alternatives utilitzades per a modelitzar condicions d'anisotropia són els diagrames de rosa dels vents i gràfics d'isolínies de semivariància experimental (semivariograma d'isolínies).
Ajust del model de semivariograma
L'ajust del model de semivariograma és essencialment un problema d'ajustar la millor funció possible al conjunt de valors de semivariància i separació calculats empíricament. És a dir, un problema d'ajust de corbes a un conjunt de punts.
Lògicament, havent-hi diferents models possibles, es tracta d'escollir el que resulti més adequat a les característiques de variació observades en el semivariograma. Un expert en el domini del fenomen estudiat pot arribar a seleccionar el model més apropiat comparant visualment la forma de la funció que descriuen els punts en el semivariograma experimental amb la forma i propietats de cada un dels diferents models teòrics. Encara que aquest mètode sovint és massa aventurat i requereix un coneixement a fons del domini, l'examen del semivariograma experimental continua sent un procediment exploratori necessari i el punt de partida obligat abans d'emprendre la selecció i ajust del model per mitjà de mètodes que ofereixen una mesura de control de la bondat d'ajust.
Els procediments d'ajust del model de semivariograma es poden dividir en mètodes no paramètrics i mètodes paramètrics.
Mètodes no paramètrics d'ajust del model de semivariograma
Ajust de mínims quadrats
El mètode d'ajust del model de semivariograma per ajust de mínims quadrats segueix la lògica clàssica d'ajust de corbes, efectua l'ajust de mínims quadrats per a cada un dels models teòrics de semivariograma i comprova la bondat d'ajust de cada un dels models per acabar seleccionant el que presenta una millor bondat d'ajust.
Mètodes paramètrics d'ajust del model de semivariograma
Màxima probabilitat
El mètode d'ajust de màxima probabilitat és un mètode d'ajust paramètric que assumeix que la distribució de probabilitat del model de funció que segueixen les dades és coneguda (per exemple, la distribució de probabilitat normal) i calcula els valors dels paràmetres que defineixen aquesta distribució de probabilitat per a les dades, de manera que els valors dels paràmetres del model siguin els més probables.
Màxima probabilitat restringida
El mètode d'ajust de màxima probabilitat és un mètode de càlcul molt intensiu. En aquest sentit, per tal de reduir les necessitats de càlcul, Cressie (1993) proposà el mètode de màxima probabilitat restringida.
Validació creuada
La validació creuada és un mètode que permet avaluar el model de semivariograma seleccionat. Abans d'ajustar el model, s'eliminen alguns punts de dades del semivariograma, s'ajusta el model sense usar aquests punts i després s'aplica el model ajustat per a estimar els valors en els punts eliminats. Com més baixa resulta la diferència entre els valors estimats i els valors originals d'aquests punts, millor és la bondat d'ajust del model.
Limitacions
La modelització per mitjà de semivariogrames és susceptible d'errors i no és necessàriament la millor modelització possible per a un determinat conjunt d'observacions d'una variable de superfície. El principal valor del semivariograma és la capacitat d'exploració de la variació espacial que proporciona per tal d'obtenir una visió de conjunt sobre les propietats de la variació espacial corresponent a unes dades de mostra.
Altres tècniques avançades, com és ara les basades en l'estadística bayesiana estan esdevenint cada cop més emprades en substitució de la modelització per mitjà de semivariogrames (Gandhi, 2008).
Aplicacions
La principal aplicació dels semivariogrames és la utilització en el mètode d'interpolació de krigatge, utilitzant els valors d'abast, sostre i residu per a determinar la funció que permet estimar els valors desconeguts en les posicions desitjades.
El semivariograma i la interpolació per krigatge s'utilitza en gairebé totes les disciplines que analitzen fenòmens de variació contínua a l'espai. Alguns dels exemples destacats d'aplicació provenen de camps com l'exploració minera, la metereologia, l'edafologia o l'epidemiologia. Els semivariogrames s'utilitzen també en aplicacions no lligades directament a la modelització de la variació de dades geoespacials, com és ara en l'anàlisi d'imatges o en l'anàlisi de sèries temporals.
Exploració minera
Sens dubte és l'aplicació més coneguda i satisfactòria de l'ús de semivariogrames i d'interpolació mitjançant krigatge, ja que és el camp que origina aquests mètodes. En aquest tipus d'aplicacions es construeix el semivariograma mitjançant punts de mostreig per tal de determinar la qualitat de les menes de minerals en posicions en què és desconeguda i poder predir així on es troben les menes de determinades qualitats.
Meteorologia
La modelització mitjançant semivariogrames és una tècnica estadística útil en meteorologia per a analitzar la distribució espacial de la pluviositat, o altres factors meteorològics, a partir de les dades de mostra de les estacions meteorològiques. De fet, part del mètode s'origina en el camp de la meteorologia paral·lelament al desenvolupament en geologia.
Edafologia
La modelització de la distribució espacial de les diverses característiques dels sòls, com granularitat, pH o concentració de diferents elements o compostos químics és un dels camps habituals d'aplicació de la modelització mitjançant semivariogrames i de la interpolació per krigatge.
Epidemiologia
La modelització mitjançant semivariogrames i de la interpolació per krigatge s'utilitzen en epidemiologia per estudiar la distribució espacial d'una determinada epidèmica i predir el curs d'evolució espacial probable de difusió de la malaltia.
Anàlisi d'imatges
Els semivariogrames s'utilitzen en la classificació d'imatges digitals per analitzar la variabilita de la textura de les imatges, la qual resumeix les variacions tonals a través de l'espai d'una imatge. Les variacions de textura són variacions de patrons espacials presents a la imatge que poden servir per a classificar-la i extreure'n determinades característiques o objectes presents a la imatge. Aquest tipus d'aplicació s'utilitza tant en processament d'imatges en general, com en l'anàlisi avançada d'imatges de teledetecció per a identificar els diferents tipus de coberta del sòl per mitjà de la textura en lloc de la classificació clàssica basada en la resposta espectral dels materials.
Anàlisi de sèries temporals
La modelització per mitjà de semivariogrames es pot aplicar igualment a l'anàlisi de sèries temporals amb la finalitat de realitzar prediccions dels valors d'una variable en determinats moments del temps, substituint la correlació espacial per correlació temporal. En concret, s'utilitza per a caracteritzar les propietats de dependència de segon ordre en sèries temporals univariades i per a la construcció de models estacionaris de sèries temporals.
Temes relacionats
Referències
Bachmaier, M. and Backes, M. (2008) "Variogram or Semivariogram. Explaining the Variances in a Variogram" in Precision Agriculture, 9, 3, 173-175.
Cressie, N. (1993) Statistics for Spatial Data. New York: Wiley.
Gandhi, V. (2008) "Semivariogram modeling" in Shekar, S. and Xiong, H. (eds.) Encyclopedia of GIS, New York: Springer.
Gandin, L.S. (1963) Objective Analysis of Meteorological Fields. Izd. Leningrad (en rus) (Traducció anglesa de Israel Program for Scientific Translations. Jerusalem, 1965).
Krige, D.G. (1951) A statistical approach to some mine valuations and allied problems at the Witwatersrand, Master's thesis of the University of Witwatersrand.
Matheron, G. (1962) Traité de géostatistique appliquée. Paris: Editions Technip.
Matheron, G. (1963) "Principles of geostatistics", Economic Geology, 58, 1246–1266.
Yaglom, A. M. (1962) An Introduction to the Theory of Stationary Random Functions. Dover Publications.
Lectures recomanades
Clark, I. (1979) Practical Geostatistics. London: Applied Science Publishers.
Gandhi, V. (2008) "Semivariogram modeling" in Shekar, S. and Xiong, H. (eds.) Encyclopedia of GIS, New York: Springer.