Gli Algoritmi EM Stocastici e le Verosimiglianze Simulate nei Modelli Geostatistici Fattoriali
In ambito geostatistico l'analisi di dati paziali multivariati viene tradizionalmente condotta facendo ricorso al modello lineare di coregionalizzazione (Wackernagel, 1995; Chiles e Delfiner, 1999) e alla "factorial kriging analysis" (Matheron, 1982).
Sebbene queste analisi, e le previsioni che ne conseguono basate sul cokriging fattoriale, tralascino ogni considerazione sulla legge
distributiva dei dati e si basino solamente sulla dipendenza spaziale misurata da variogrammi e cross-variogrammi, esse sono perfettamente
adeguate, nel senso di fornire previsioni non distorte con errore quadratico medio minimo, nel caso in cui i dati possono assumersi
avere distribuzione (multivariata) gaussiana.
D'altro canto, nel caso di dati di conteggio, di dati asimmetrici, o comunque di dati non gaussiani, come in molte applicazioni
ambientali, queste analisi possono dar luogo a previsioni dei fattori latenti altamente inefficienti.
Sull'orma delle piu' interessanti proposte apparse in letteratura per la modellazione di dati spaziali univariati non gaussiani (Diggle,
Moyeed e Tawn, 1998), qui si propone, per dati spaziali multivariati, un modello fattoriale gerarchico ("generalized linear mixed
models") costruito su di una variante del classico modello lineare di coregionalizzazione.
Per la stima dei parametri di questo modello si possono adattare alcune delle tradizionali tecniche geostatistiche come, ad esempio,
l'algoritmo di Goulard e Voltz (1992), mentre mappe dei fattori spaziali latenti (non osservabili) possono essere ottenute
utilizzando algoritmi "Markov chain Monte Carlo". Metodi di stima dei parametri piu' efficienti basati sulla verosimiglianza si
possono ottenere utilizzando gli algoritmi EM stocastici (Fort e Moulines, 2003) e le verosimiglianze simulate (Geyer, 1994;
Christensen, 2004).
Bibliografia
Chiles, J.P. and Delfiner, P. (1999).
Geostatistics: Modeling Spatial Uncertainty.
Wiley, New York.
Christensen, O.F. (2004).
Monte Carlo maximum likelihood in model-based geostatistics.
Journal of Computational and Graphical Statistics, 13, 702-718.
Diggle, P.J., Moyeed, R.A. and Tawn, J.A. (1998).
Model-based geostatistics.
Applied Statistics, 47, 299-350.
Fort, G. and Moulines, E. (2003).
Convergence of the Monte Carlo expectation maximization for curved
exponential families.
The Annals of Statistics, 31, 1220-1259.
Geyer, C.J. (1994).
On the convergence of Monte Carlo maximum likelihood calculations.
Journal of the Royal Statistical Society, Series B, 56, 261-274.
Goulard, M. and Voltz, M. (1992).
Linear coregionalization model: tools for estimation and choice of
cross-variogram matrix.
Mathematical Geology, 24, 269-286.
Matheron, G. (1982).
Pour une analyse krigeante des donnees regionalisees.
Publication N-732, Centre de Geostatistique, Fontainebleau, France.
Wackernagel, H. (1995).
Multivariate Geostatistics.
Springer, Berlin.