Next: Importanza dei ``geni'' in Up: No Title Previous: Il metodo scientifico in

Subsections

Metodi per trovare i fattori principali che influenzano un processo

Come si effettua una ricerca ecologica

1.: Reperire la letteratura scientifica
2.: Predisposizione ed effettuazione del campionamento
3.: Osservazione dei pattern in natura
4.: Formazione della prima ipotesi
5.: Verifica dell'ipotesi in laboratorio o tramite esperimento sul campo
6.: Ridefinizione dell'ipotesi e definizione di un modello

Metodi per trovare i fattori principali che influenzano un processo

Spesso in ecologia ci si trova di fronte al problema di cercare di capire quale sia il fattore più importante che influenza un processo (es: capire il fattore più importante che limita la crescita di una popolazione: predatori, disponibilità di cibo, disponibilità di particolare habitat, caratteristiche intrinseche alla popolazione stessa, ecc.).

Molte volte i fattori che influenzano il processo in modo rilevante sono più di uno e spesso sono interconnessi uno con l'altro. L'ecologo quindi può ideare un esperimento che separi i fattori in modo da capire quale è più rilevante e quale meno.

Esempio di un esperimento tratto da Ecology dell'Ottobre 1999

In un numero recente di Ecology c'è un articolo (Galen, C. & Stanton, M.L. 1999. Seedling establishment in alpine buttercup under experimental manipulation of growing-season length. Ecology 80(6):2033-2044) dove gli autori riescono a separare due fattori tramite un esperimento semplice ma brillante.

Da esperimenti precedenti sanno che la specie Ranuculus adoneus, un fiore della famiglia delle Ranucolacee, cresce in alta montagna e fiorisce non appena il manto nevoso si assotiglia a pochi centimetri. A oltre 3700 m s.l.m. sulla Pennsylvania Mountain (Colorado, USA), in alcune zone la neve si scoglie molto prima che in altre. La pianta quindi può germinare prima con un anticipo anche di 30 giorni e alla fine delle stagione cresce e si riproduce di più rispetto ad altri versanti dove la neve si scioglie dopo. Quindi il periodo di scomparsa della neve sembra essere un fattore ``determinante'' nella ``fitness'' di questa pianta.

A complicare la questione però c'è il fatto che nel suolo dove la pianta cresce di più, cioè dove la neve si scioglie prima, c'è più sostanza organica e più nutrienti (probabilmente dovuto ad un apporto, negli anni passati, di sostanza organica dalla decomposizione della maggior biomassa delle piante stesse). Quindi anche la fertilità del suolo può essere un fattore determinante.

Quindi gli autori formulano le seguenti ipotesi: il maggiore reclutamento (numero di semi che riescono a germinare e crescere) in alcune zone della montagna è dovuta:

1.: alla minore quantità di neve, che sciogliendosi prima allunga l'estate?
2.: al suolo più fertile?
3.: all'interazione dei due fattori precenti? (cioè l'effetto della neve, associato a quello della fertilità, sono maggiori [o minori] della somma dei due singoli effetti separati )

Ora tocca a voi.

-: Quale sarà l'ipotesi nulla?
-: Provate a ipotizzare un esperimento per separare questi due fattori.
-: Quali altri fattori sarebbe opportuno considerare?

$\epsfig{file=snow.eps,width=\linewidth}$

Analisi della Varianza come modello generale per lo studio dei processi ecologici

Siete invitati a riguardarvi sul libro di statistica i capitoli riguardanti l'analisi della varianza. In particolare siete tenuti a conoscere le assunzioni dell'analisi della varianza.

Gli autori usano l'analisi della varianza per analizzare i dati. In ecologia come, in tante altre scienze, l'analisi della varianza è la metodologia di elezione per analizzare dati. In effetti l'analisi della varianza è più di un test: è un modello per interpretare i processi ecologici. Quando si effettua un analisi della varianza, implicitamente o esplicitamente, si ipotizza un modello lineare additivo.

Links ai dati simulati

Uno dei modelli più semplici è:

$\begin{displaymath}Y_{ij} = \mu_i + e_{ij} \end{displaymath}$

(3.1)

dove Y_ij è la j-esima misurazione nel trattamento i-esimo e $\mu_i$ è la media delle misurazioni del trattamento i-esimo ed e_ij è l'errore casuale ovvero la differenza dell'osservazione j-esima dalla media del trattamento i.

Riscritto in altri termini:

$\begin{displaymath} Y_{ij} = \mu + A_i + e_{ij} \end{displaymath}$

(3.2)

dove il termine A_i è l'effetto del trattamento i-esimo rispetto alla media generale $\mu$ cioè $A_i = \mu_i - \mu$ . Nel nostro esempio si ipotizza che il reclutamento nell'unità sperimentale ij sia il risultato della somma della media generale del reclutamento da parte di R. adoneus sulla Pennsylvania Mountain ( $\mu$ ), + l'effetto A_i che nel nostro caso potremmo indentificare con il trattamento che allunga (o accorcia) la lunghezza della stagione vegetativa, + l'errore casuale (differenza fra il reclutamento nel plot j-esimo del trattamento i e la media di tutti i plot che hanno subito il trattamento i).

Come è noto l'analisi della varianza assume che:

$\begin{displaymath}e_{ij} \sim \quad\textrm{ i.i.d.}\quad N(0,\sigma^2) \end{displaymath}$

che significa che l'errore è indipendente e identicamente distribuito e che è distribuito secondo una distribuzione normale con media 0 e varianza $\sigma^2$ .

Quale sarà, in termini dell'equazione 3.2 l'ipotesi nulla?

Effetti Fissi / Effetti casuali

Il modello di analisi della varianza che abbiamo fino ad ora analizzato è un modello a effetti fissi (detta anche ANOVA Modello I). Esiste però una categoria di fattori, detti fattori casuali o random, (ANOVA Modello II) che sono sostanzialmente differenti dai primi nella ``filosofia'' dell'esperimento, in particolare sono diversi nello schema di campionamento e nei parametri di interesse allo sperimentatore.

: Un fattore è detto fisso se i livelli del fattore sono scelti non casualmente dallo sperimentatore o se consistono in tutti i possibili livelli presenti nella popolazione.
: Un fattore è detto casuale (o random) quando i livelli che lo compongono sono un campione casuale di tutti i possibili livelli presenti nella popolazione.

Attenzione a non confondere la scelta delle unità sperimentali, che deve essere sempre casuale anche in un disegno a effetti fissi. In un disegno ad effetti casuale è la scelta dei fattori (es: i tipi di trattamento, il tipo di gruppi) che è scelta casualemente.

Esempi di fattori casuali:

La scelta di un campione casuale di piante in una popolazione di cui analizzare i semi;
Le repliche di un esperimento di analisi chimica quantitativa, quando su ciascuna replica effettuo la stessa determinazione analitica più volte.

Obiettivi diversi

Modello random

Normalmente in un'analisi con fattori random non sono interessato all'effetto di uno specifico livello ma sono interessato a misurare la variabilità generale legata a quel fattore (Es: sono interessato a stimare la variabilità fra famiglie (fra piante madri) del peso del seme; oppure a vedere quanta variabilità esiste nella determinazione del contenuto di azoto di foglie di faggio scelte a caso su una o più piante). In un modello random tipicamente si stimano le componenti di varianza (es: % di varianza tra e % di varianza entro.

Modello effetti fissi

Al contrario in un analisi a fattori fissi sono interessato a misurare l'effetto dello specifico livello che ho sperimentato. (Es: mi interessa vedere se i semi della famiglia (pianta madre) Apesano di più di quelli della famiglia B; oppure se le foglie ``da luce'' contengono più azoto delle foglie ``da ombra'').

Quindi tutto dipende da come ho scelto i livelli su cui effettuo l'esperimento.

Il fattore ``lunghezza'' della stagione GSTYPE nell'esperimento della lezione precedente di che tipo è?
Il fattore ``fertilità del suolo'' LOC nell'esperimento della lezione precedente di che tipo è?

Modello misto

Se in un esperimento in cui entrambi i tipi di fattori (fissi e casuali) sono presenti allora si dice che il modello di ANOVA è misto.

La distinzione però non è soltanto ``filosofica'' ma ha dei risvolti importanti per la stima dei parametri dei modelli e viene usata in molti esperimenti di genetica quantitativa (es: nella stima dell'ereditabilità di un tratto fenotipico).

Innanzitutto nei modelli random lo sperimentatore se vuole aumentare la potenza del test ha interesse a aumentare, oltre al numero delle osservazioni, anche il numero di livelli nell'esperimento per avere una stima migliore della variabilità legata al fattore in oggetto. Mentre in un modello fisso il numero di fattori è ``fisso'' e lo sperimentatore può aggiungere solo altre osservazioni (non livelli).

In una tipica tabella dell'analisi della varianza le differenze appaiono più evidenti:

Sorg. di Variazione	Quadrati Medi
Effetti fissi:
Fra Trattamenti	$\displaystyle \sigma^2_e + \frac{n \displaystyle\sum^{a}_{i=1} (A_i - \overline{A})}{(a -1)}$
Effetti casuali:
Fra Trattamenti	$\displaystyle \sigma^2_e + n \sigma^2_A$
Entrambi:
Entro Trattamenti	$\sigma^2_e$

dove n è la dimensione del campione in ciascun livello-trattamento (il numero di osservazioni totale sarà na), a è il numero di livelli (trattamenti), $\sigma^2_e$ è la stima della varianza entro (errore) e $\sigma^2_A$ è la stima della varianza ``extra'' dovuta ai trattamenti.

Modelli gerarchici (Nested)

Nei disegni sperimentali che coinvolgono modelli gerarchici (o nested) ovviamente ci devono essere più di due fattori, ma uno deve essere ``innestato'' nell'altro oppure potremo dire che uno ``comprende'' l'altro, cioè sono su due scale gerarchiche diverse (esempi di fattori nested: stato, regione, provincia, comune).

Vi sono cioè almeno due tipi di unità sperimentali di gerarchia diversa (superiore e inferiore) o dimensioni diverse: una più grande e una più piccola (innestata in quella più grande).

In un modello nested si possono avere sia effetti fissi sia casuali (dipende ovviamente da come scelgo o considero le mie unità sperimentali), tipicamente però il modello di livello inferiore nella gerarchia è di tipo casuale (cioè viene scelto casualmente fra una lista di possibili livelli).
In un modello nested non ci sono interazioni fra livelli gerarchici diversi, semplicemente perchè un livello inferiore non può appartenere a più di un livello superiore (es: un comune non può appartenere contemporaneamente a due province). La seguente figura dovrebbe chiarire quest'ultimo concetto.

$\epsfig{file=nested.eps,width=\linewidth}$

In un modello nested il modello additivo che andrò a testare è:

$\begin{displaymath}Y_{ijk} = \mu + A_i + B_{j(i)} + e_{ijk} \end{displaymath}$

dove B_j(i) è l'effetto del j-esimo fattore ``innestato'' (entro) il fattore i-esimo gerarchicamente superiore.

Nei modelli nested in cui il fattore gerarchicamente inferiore B(A) è random, il test F per la significatività del fattore superiore Aviene calcolato diversamente dal solito:

$\begin{displaymath}F = \frac{{\textstyle QM di } A}{{\textstyle QM di } B(A)} \end{displaymath}$

mentre il fattore inferiore B(A) viene testato normalmente contro l'errore come al solito.

Comunque nei modelli misti la scelta di come condurre il test F, in particolare di cosa mettere al denominatore, è sempre molto complicata e conviene riferirsi ad un testo specialistico

Next: Importanza dei ``geni'' in Up: No Title Previous: Il metodo scientifico in

Stefano Leonardi
2000-08-28