Mostreig espacial | icgc

Mostreig espacial

Autor: Dr. Joan Nunes. Universitat Autònoma de Barcelona
Promotor: Institut Cartogràfic de Catalunya, 2013

Els fenòmens que varien de forma contínua en l'espai, com per exemple pluviositat, temperatura, granularitat o pH dels sòls, i els que varien de forma discreta però cobreixen l'espai de forma contínua, com és ara els tipus de vegetació o els usos del sòl, són fenòmens que poden prendre valor en qualsevol posició de l'espai. Les dades corresponents als fenòmens que presenten continuïtat en l'espai s'han de mesurar necessàriament mitjançant un nombre finit d'observacions inferior al total d'observacions possibles, que constitueix la població d'on s'extreuen les observacions realitzades. El conjunt d'observacions realitzades constitueix per tant una mostra.

El mostreig espacial, és un tipus de mostreig estadístic, que té per finalitat seleccionar un subconjunt de casos del conjunt d'una població, però que en lloc de seleccionar individus  selecciona posicions, amb la finalitat de caracteritzar el conjunt de la població, que en el cas d'una mostra de posicions és el conjunt de posicions d'una determinada àrea d'estudi d'un fenomen que presenta continuïtat espacial. Hi ha diversos mètodes de mostreig espacial, entre els quals el mostreig espacial aleatori, el mostreig espacial sistemàtic, el mostreig espacial sistemàtic aleatori, el mostreig espacial estratificat i el mostreig espacial al llarg de transsectes o d'isolínies, entre els més importants. En qualsevol cas, les regles perquè un mostreig espacial sigui estadísticament vàlid són les mateixes que per a qualsevol mostreig estadístic.

SUMARI

Origen

No hi ha un origen definit per al mostreig estadístic, ja que la idea sembla ser força antiga. En tot cas, la formalització dels mètodes de mostreig és paral·lela a la formalització de l'estadística moderna a finals del segle XVIII, per part de Gauss, Laplace i d'altres. En aquest sentit un dels precedents documentats de mostreig estadístic és un assaig realitzat el 1786 per Laplace per a estimar la població de França.

El desenvolupament dels mètodes de mostreig espacial és paral·lel al de l'anàlisi espacial i al de l'estadística espacial (Yates, 1960; Stuart, 1962; Cochran, 1963) a partir de la dècada de 1950 i de 1960, en disciplines com la geologia, la biogeografia, l'econometria o la geografia.

Definició

Mostreig probabilístic

Un mostreig estadísticament vàlid ha de complir la definició de mostreig probabilístic, segons la qual cada cas seleccionat té una probabilitat coneguda de ser escollit. Un mostreig aleatori és un mostreig probabilístic en què tots els casos tenen igual probabilitat de ser escollits. No tots els mostreigs de probabilitat són necessàriament aleatoris en el sentit que tots els casos tenen la mateixa probabilitat, basta que sigui coneguda i que, si es tracta d'un mostreig ponderat es pugui multiplicar cada cas pel seu pes per obtenir estimacions no esbiaixades dels estadístics corresponents al conjunt de la població. Per exemple, en un mostreig estratificat, la mida de les subpoblacions de cada estrat és diferent i proporciona un pes diferent a cada cas segons l'estrat a què pertanyi, però la probabilitat d'elecció de cada cas és coneguda. Gràcies a conèixer sempre la probabilitat d'elecció de cada cas, en un mostreig probabilístic és possible sempre calcular l'error de mostreig, que permet per a un determinat interval de confiança establir els límits entre els quals es mou el valor d'un estadístic corresponent al conjunt de la població, com és ara la mitjana o un percentatge.

Un mostreig no probabilístic és qualsevol mostreig en què alguns casos no tenen cap probabilitat de ser escollits o la probabilitat d'alguns dels casos escollits no pot ser coneguda, com a conseqüència del mètode de selecció utilitzat. Un exemple, típic de mostreig no probabilístic és la selecció d'un cert nombre de casos considerats representatius a criteri de l'investigador. En un mostreig no probabilístic no és possible calcular l'error de mostreig.

L'aleatorietat, no obstant, és important per assegurar la independència entre els casos i, d'altra banda, assegura directament l'obtenció d'un mostreig probabilístic. Són tipus de mostreig probabilístic el mostreig aleatori simple, el mostreig sistemàtic i el mostreig estratificat, entre els més bàsics. Són tipus de mostreig no probabilístic el mostreig intencionat (amb un propòsit definit) o el mostreig per quotes.

El mostreig espacial, per tal de ser vàlid ha de complir la definició de mostreig probabilístic. De fet, els diferents mètodes de mostreig espacial són homòlegs dels mètodes bàsics de mostreig probabilístic no espacial.

Mida de la mostra

La mida d'una mostra espacial ha de complir, com tota mostra, amb el criteri de permetre obtenir un determinat error mostral per a un determinat interval de confiança. En el cas d'una variable quantitativa de raó, el límit de l'interval de confiança es calcula segons l'expressió:

Imatge

on
c   és el límit de l'interval de confiança desitjat
z   és la mesura d'unitat d'error estàndard per a l'interval de confiança desitjat (1,96 per al 95%, 2,58 per al 99%, d'acord amb els valors d'una distribució normal reduïda)
SE  és l'error estàndard de la mitjana
 

Coneixent que l'error mostral de la mitjana és:

Imatge

on   
s   és la desviació estàndard de la població
n   és el nombre de casos, la mida, de la mostra
 

S'obté la mida de la mostra:

Imatge

En el cas d'estimar un percentatge, freqüència relativa d'una variable categòrica, l'expressió anterior esdevé:

Imatge

on     p   és el percentatge de la categoria

En el cas d'estimar percentatges, el valor de p es pren igual al 50%, que és el cas de màxima variabilitat o indeterminació. En el cas d'estimar la mitjana d'una variable quantitativa, com que sovint es difícil conèixer per endavant la desviació estàndard de la variable per al conjunt de la població, se sol utilitzar la fórmula emprada en el cas d'estimar percentatges, considerant p la proporció de desviació estàndard respecte de la mitjana i c el límit de l'interval de confiança en percentatge respecte de la mitjana, la qual cosa dóna una certa subestimació de la mida de la mostra ja que no és infreqüent que la desviació estàndard sigui més gran que el 50% de la mitjana. Per a determinar la mida de la mostra amb la finalitat d'obtenir un determinat interval de confiança en tests de significació es fan servir altres mètodes que utilitzen taules precalculades.

Marc de mostreig

El marc de mostreig és la col·lecció organitzada dels casos d'una població, de manera que facilita la disponibilitat de tots els casos de la població i la selecció de casos, per procediments aleatoris o d'altre tipus. Una llista (o, més habitualment, una base de dades) de tots els casos ordenats i numerats és un exemple d'un bon marc de mostreig.

Les característiques desitjables d'un marc de mostreig correcte són:

  • tots els casos tenen un identificador numèric
  • tots els casos es poden trobar
  • el marc ha de tenir una organització lògica sistemàtica
  • la informació dels casos en el marc contempla informació addicional per poder aplicar criteris avançats de mostreig
  • el marc conté tots els casos de la població estudiada
  • cada element de la població només és present en el marc una sola vegada
  • el marc no conté elements no pertanyents a la població estudiada

La disponibilitat o no d'un marc de mostreig apropiat és un factor crític a l'hora de produir una mostra correcta. Si el marc de mostreig conté algun biaix o no conté tots els casos de la població a mostrejar, la mostra no serà vàlida en el sentit de mostra probabilística. El principal problema sol ser sovint que no es disposa de marc de mostreig i cal generar-lo prèviament a la tasca de mostreig en si. El cost de generar un marc de mostreig pot ser considerable, però l'efecte sobre la mostra és decisiu. Dit simplement, abans de realitzar un mostreig és necessita tenir l'inventari complet de casos de la població a mostrejar.

Per a realitzar mostreigs espacials se solen utilitzar quadrícules com a marc de mostreig, aprofitant generalment les quadrícules dels sistemes de coordenades planes emprats en la cartografia, com per exemple la quadrícula UTM o similars. En cas que l'àrea tingui forma irregular, la quadrícula ha de cobrir tota l'àrea d'estudi. Les coordenades de columna i fila de la quadrícula compleixen la mateixa funció que els identificadors numèrics en una llista.

Mètodes de mostreig espacial de punts

Deixant a part casos especials de mostreig espacial per a línies i àrees, el mostreig espacial típic és una selecció de punts o posicions en l'espai. Els diferents mètodes de mostreig espacial de punts (Hagget, 1965; Berry and Baker 1968) són, en general, homòlegs dels mètodes bàsics de mostreig probabilístic no espacial.

Mostreig espacial aleatori

El mostreig espacial aleatori és l'equivalent del mostreig aleatori simple de dades no espacials. Consisteix en una selecció aleatòria de punts en lloc d'individus. Sovint es realitza utilitzant una quadrícula com a marc de mostreig i generant números aleatoris per a obtenir les coordenades de columna i de fila de la cel·la de la quadrícula en la qual es selecciona el punt, típicament en el centre de la cel·la. Els punts seleccionats que cauen fora de l'àrea d'estudi es descarten.

És un tipus de mostreig adequat per a variables quantitatives contínues en l'espai, com és ara precipitacions, temperatura o característiques dels sòls. No és gaire adequat per a fenòmens com la vegetació o els usos del sòl (en general, per a variables categòriques), ja que si les diferents categories es distribueixen en proporcions diferents per l'àrea d'estudi, les que ocupen menys extensió resultaran subrepresentades. En aquest darrer cas pot ser més adequat un mostreig espacial sistemàtic o, com a mínim, una mida de mostra expressament gran per tal d'augmentar les possibilitats d'obtenir punts de mostreig en les categories menys presents a l'àrea d'estudi.

Imatge

Mostreig espacial aleatori (esquerra) i mostreig espacial sistemàtic (dreta). Els punts fora de l'àrea d'estudi (en vermell) es descarten.

 

Mostreig espacial sistemàtic

Gran part dels estudis amb informació distribuïda espacialment requereixen un recobriment complet de l'àrea d'estudi, la qual cosa s'aconsegueix mitjançant el mostreig espacial sistemàtic, que consisteix en un conjunt de punts distribuïts regularment a intervals de distància fixos en les dues direccions. El mostreig espacial sistemàtic típicament pren la forma d'una malla de punts que són els centres de la corresponent quadrícula, com en el cas de les dades de tipus ràster, quan els valors són referits als centres de cel·la.

El mostreig espacial sistemàtic té l'inconvenient o el risc, com el mostreig sistemàtic a partir de llistes, que la distància o interval de mostreig entre punts coincideixi amb alguna periodicitat present a les dades, com poden ser certes formes geomorfològiques en la topografia del terreny en el cas de mostrejar elevacions (Zarkovich, 1966).

En general, l'interval de mostreig condiciona decisivament la capacitat de reconèixer objectes o les variacions de la variable objecte de mostreig, tant en el cas del mostreig espacial sistemàtic, per efecte de la periodicitat, com en el cas del mostreig espacial aleatori, perquè la distància mínima entre punts és indicativa de la major o menor densitat de punts de mostreig, que pot ser insuficient per a reconèixer variacions significatives.

El mostreig espacial sistemàtic també té l'inconvenient de poca aleatorietat i de recollir un nombre excessiu de punts en zones d'escassa variabilitat.

Mostreig espacial sistemàtic aleatori

El mostreig espacial sistemàtic aleatori combina, com en el cas no espacial, mètodes aleatoris i sistemàtics. La forma més senzilla de realitzar un mostreig espacial sistemàtic aleatori és escollir aleatòriament el punt dins de cada cel·la de la quadrícula usada com a marc de mostreig, la qual cosa dóna lloc al mètode de mostreig anomenat mostreig espacial sistemàtic amb aleatorietat local. Un altre tipus de mostreig espacial sistemàtic aleatori és el mostreig espacial sistemàtic a intervals aleatoris, que consisteix a definir aleatòriament l'interval de distància entre punts de mostreig en cada una de les dues dimensions. Ambdós mètodes donen resultats semblants, si bé el mètode de mostreig espacial sistemàtic a intervals aleatoris produeix una distribució més irregular dels punts i menys alineada.

El mostreig espacial sistemàtic aleatori té la característica fonamental del mostreig espacial sistemàtic de proporcionar un recobriment complet de l'àrea d'estudi i, a més, dos avantatges addicionals. D'una banda evita l'alineació i distribució regular dels punts que podria coincidir amb alguna periodicitat present a les dades; i d'altra banda, igual que el mètode no espacial corresponent, introdueix un major grau d'aleatorietat en la selecció dels casos, que sempre és beneficiós per a la representativitat e la mostra.

Mostreig espacial estratificat sistemàtic no alineat

El mètode de mostreig espacial estratificat sistemàtic no alineat Berry and Baker (1968) utilitza les cel·les de la quadrícula com a estrats i defineix un sistema de coordenades dins de cada cel·la de la quadrícula, que utilitza per a definir aleatòriament la posició del punt a seleccionar dins de la cel·la. La novetat del mètode és el fet de mantenir la coordenada x per a seleccionar els punts de totes les cel·les d'una mateixa fila i la coordenada y per a seleccionar els punts de totes les cel·les d'una mateixa columna, mentre que la coordenada que falta en cada cas es genera aleatòriament. El resultat no és gaire diferent que el del mostreig espacial sistemàtic amb aleatorietat local, si bé el manteniment d'una coordenada al llarg de cada fila o columna proporciona una certa estratificació espacial.

Mostreig espacial estratificat sistemàtic aleatori

El mètode de mostreig espacial estratificat sistemàtic aleatori consisteix a dividir l'àrea d'estudi en diferents zones, que actuen com a estrats, i realitzar un mostreig espacial sistemàtic amb aleatorietat local de diferent densitat de punts dins de cada zona. És un mètode apropiat per a cobrir completament una àrea i al mateix temps adaptar-se a la diferent variabilitat de la variable estudiada en diferents zones de l'àrea d'estudi o quan es tracta de comparar zones que tenen significació per si mateixa i són molt desiguals en superfície, de manera que un mostreig regular no proporcionaria suficients punts per a les zones més petites.

Mètodes de mostreig espacial per a línies i àrees

Transsectes

Un transsecte és una línia recta sobre el terreny o sobre un mapa al llarg de la qual es realitzen observacions. L'ús de transsectes és molt habitual en geologia, biologia o ecologia.

Els transsectes es poden utilitzar simplement per a mesurar la longitud de característiques sobre el terreny o el mapa al llarg del trassecte a mesura que aquest creua les àrees de les diferents característiques. De forma més acurada es poden utilitzar també per a ubicar punts de mostreig aleatòriament sobre el transsecte en els quals realitzar les observacions.

Els transsectes es poden definir aleatòriament mitjançant parells de coordenades aleatòries que defineixin l'inici o final del transsecte o sistemàticament mitjançant línies paral·leles a un cert interval de distància que cobreixin completament l'àrea d'estudi. Un cas especial de transsecte són els transsectes intencionats, escollits en funció de característiques particulars del terreny. En aquest cas, malgrat que el transsecte no constitueix un mostreig probabilístic, el mostreig de punts, de forma aleatòria o sistemàtica al llarg del transsecte sí que pot ser-ho, de manera que el transsecte actua només com a marc de mostreig.

Isolínies

El mostreig al llarg d'isolínies és una altra forma de mostreig espacial que utilitza elements lineals, en aquest cas de valor constant de l'atribut mesurat. El mostreig al llarg d'isolínies es pot fer servir per a escollir punts que representin adequadament la isolínia en lloc d'utilitzar la isolínia. En aquest cas es tracta essencialment d'una transformació de dades per a obtenir una representació espacial diferent.

Les isolínies també es poden fer servir com els transsectes per a mesurar característiques al llarg de la isolínia. Cas en què es comporten també com a marc de mostreig.

Parcel·les experimentals

La parcel·la experimental és una unitat de superfície utilitzada sobretot en biogeografia per a realitzar-hi mesuraments a l'interior. Deixant a part efectes d'escala derivats de la mida de la parcel·la experimental, el mostreig en aquest cas consisteix a escollir els punts on ubicar la parcel·la experimental, cosa que es pot realitzar per qualsevol dels mètodes de mostreig espacial de punts.

Factors condicionants

El mostreig espacial presenta diversos condicionants i dificultats a tenir en compte. Algunes de caire metodològic en el moment de definir el mostreig espacial i d'altres de caire pràctic a l'hora d'aplicar-lo i efectuar les observacions.

Entre les dificultats de caire metodològic hi ha l'error bastant freqüent d'aplicar un mostreig espacial a fenòmens que no varien de forma contínua a través de l'espai i que cal conceptualitzar correctament com a entitats, de les quals el mostreig consisteix a escollir individus, com per exemple en el cas de voler fer un mostreig de masies, establiments industrials o botigues. En tots aquests casos, cal fer una llista o cens dels casos i aplicar un mostreig no espacial, independentment del fet que els individus posseeixin localització que es pot recollir com una característica de cara a anàlisis posteriors.

Una segona dificultat de caire metodològic es produeix quan es combina el mostreig d'observacions a través de l'espai i al llarg del temps. En aquest cas, els període de temps (franges del dia, dies de la setmana, mesos, estacions de l'any, etc.) actuen com a marc de mostreig. Si a més el mostreig s'estratifica per àrees, es produeix aleshores un efecte de mostreig agrupat no desitjable, ja que incompleix els principis de mostreig probabilístic. Una manera de pal·liar aquest efecte és utilitzar períodes de temps i zones espacials el més petites possible en la mesura que sigui factible.

En el terreny pràctic, per últim, la principal dificultat per aplicar un determinat mostreig és l'accessibilitat a tots els punts seleccionats. Alguns d'aquests poden ser simplement inaccessibles per condicions del terreny o pel fet que el fenomen a mostrejar es troba sota la superfície del medi construït.

Temes relacionats

Referències

Berry, B. and Baker, A. (1968) "Geographic sampling" in Berry, B. and Marble, D. (eds.) Spatial analysis. New Jersey: Prentice-Hall.

Cochran, W. (1963) Sampling techniques. New York: Wiley.

Haggett, P. (1965) Locational analysis in human geography. London: Edward Arnold.

Stuart, A. (1962) Basic ideas of scientific sampling. London: Griffin.

Yates, F. (1960) Sampling methods for censuses and surveys. London: Griffin.

Zarkovich, S. (1966) Quality of statistical data. Rome: Food and Agriculture Organisation of the United Nations.

Lectures recomanades

Berry, B. and Baker, A. (1968) "Geographic sampling" in Berry, B. and Marble, D. (eds.) Spatial analysis. New Jersey: Prentice-Hall.

Dixon, C. and Leach, B. (1977) Sampling methods for geographical research. CATMOG (Concepts and Techniques in Modern Geography), 17, Norwich: GeoBooks.