Proprietà fondamentali delle stime statistiche dei parametri di distribuzione. Valutazione statistica

campione di distribuzione della stima statistica

Una stima è un'approssimazione dei valori della quantità desiderata, ottenuta in base ai risultati dell'osservazione del campione. Le stime sono variabili casuali. Forniscono l’opportunità di formulare giudizi informati su parametri sconosciuti della popolazione. Un esempio di stima della media generale è la media campionaria della varianza generale - varianza campionaria, ecc.

Per valutare quanto “bene” la valutazione soddisfi le corrispondenti caratteristiche generali, sono stati sviluppati 4 criteri: coerenza, imparzialità, efficienza e sufficienza. Questo approccio si basa sul fatto che la qualità di una stima è determinata non dai suoi valori individuali, ma dalle caratteristiche della sua distribuzione come variabile casuale.

Sulla base dei principi della teoria della probabilità, si può dimostrare che di caratteristiche del campione come la media aritmetica, la moda e la mediana, solo la media aritmetica rappresenta una stima coerente, imparziale, efficace e sufficiente della media generale. Ciò determina la preferenza data alla media aritmetica tra le altre caratteristiche del campione.

Imparziale la valutazione si manifesta nel fatto che la sua aspettativa matematica per qualsiasi dimensione del campione è pari al valore del parametro stimato nella popolazione generale. Se questo requisito non è soddisfatto, la valutazione lo è spostato.

La condizione di stima imparziale mira a eliminare gli errori sistematici di stima.

Quando risolvono i problemi di stima, usano anche stime asintoticamente imparziali, per cui, al crescere della dimensione del campione, l'aspettativa matematica tende al parametro stimato della popolazione generale.

Ricchezza stime statistiche si manifesta nel fatto che con l'aumentare della dimensione del campione, la stima si avvicina sempre di più al valore reale del parametro stimato, o, come si suol dire, la stima converge in probabilità al parametro desiderato, o tende alla sua aspettativa matematica . Solo le valutazioni coerenti hanno un significato pratico.

Questa è la stima del parametro imparziale che presenta la varianza minima per una data dimensione del campione. In pratica, la varianza della stima viene solitamente identificata con l’errore di stima.

COME misure di efficacia della valutazione prendere il rapporto tra la minima varianza possibile e la varianza di un'altra stima.

Viene chiamata una stima che garantisce l'utilizzo completo di tutte le informazioni contenute nel campione su una caratteristica sconosciuta della popolazione sufficiente(esauriente).

Il rispetto delle proprietà delle stime statistiche sopra discusse consente di considerare le caratteristiche del campione per la stima dei parametri della popolazione generale come le migliori possibili.

Il compito più importante della statistica matematica è ottenere le stime statistiche più razionali e “veritiere” dei parametri desiderati della popolazione generale utilizzando dati campione. Esistono due tipi di inferenza statistica: stima statistica; testare ipotesi statistiche.

Il compito principale di ottenere stime statistiche è selezionare e giustificare le migliori stime che forniscono la possibilità di una valutazione significativa di parametri sconosciuti della popolazione.

Il problema della stima dei parametri sconosciuti può essere risolto in due modi:

  • 1. il parametro sconosciuto è caratterizzato da un numero (punto) - viene utilizzato il metodo di stima puntuale;
  • 2. stima intervallare, ovvero viene determinato un intervallo in cui, con una certa probabilità, può trovarsi il parametro desiderato.

Stima puntuale Il parametro sconosciuto è che un valore numerico specifico della stima del campione viene preso come la migliore approssimazione al parametro reale della popolazione, ovvero il parametro sconosciuto della popolazione è stimato da un singolo numero (punto) determinato dal campione. Con questo approccio c'è sempre il rischio di commettere un errore, quindi la stima puntuale deve essere integrata con un indicatore possibile errore ad un certo livello di probabilità.

La sua deviazione standard viene presa come errore medio di stima.

Quindi la stima puntuale della media generale può essere rappresentata come un intervallo

dove è la media aritmetica campionaria.

Quando si effettua una stima puntuale, vengono utilizzati diversi metodi per ottenere stime dai dati campione:

  • 1. metodo dei momenti, in cui i momenti della popolazione generale sono sostituiti da momenti della popolazione campione;
  • 2. metodo dei minimi quadrati;
  • 3. metodo della massima verosimiglianza.

In molti problemi è necessario non solo trovare una stima numerica di un parametro della popolazione, ma anche valutarne l'accuratezza e l'affidabilità. Ciò è particolarmente importante per campioni relativamente piccoli. Una generalizzazione della stima puntuale di un parametro statistico è la sua stima dell'intervallo- trovare un intervallo numerico contenente il parametro stimato con una certa probabilità.

Dato che quando si determinano le caratteristiche generali dai dati campione c'è sempre qualche errore, è più pratico determinare l'intervallo centrato sulla stima del punto trovato, all'interno del quale si trova il vero valore desiderato del parametro stimato della caratteristica generale con una certa probabilità specificata. Questo intervallo è chiamato intervallo di confidenza.

Intervallo di confidenzaè un intervallo numerico che, con una data probabilità r, copre il parametro stimato della popolazione. Questa probabilità si chiama fiducia. Probabilità di fiducia r è la probabilità che può essere considerata sufficiente nell'ambito del problema da risolvere per giudicare l'affidabilità delle caratteristiche ottenute sulla base delle osservazioni del campione. Misurare

si chiama la probabilità di commettere un errore livello di significatività.

Per un campione (punto) stimare il parametro AND * (theta) AND della popolazione generale con accuratezza ( errore estremo) D e probabilità di confidenza r, l'intervallo di confidenza è determinato dall'uguaglianza:

La probabilità di confidenza r permette di stabilire limiti di confidenza fluttuazione casuale del parametro studiato AND per un dato campione.

I seguenti valori e i loro valori corrispondenti sono spesso presi come probabilità di confidenza: livelli di significatività

Tabella 1. - Probabilità di confidenza e livelli di significatività più comunemente utilizzati

Ad esempio, un livello di significatività del 5% significa quanto segue: in 5 casi su 100 c'è il rischio di commettere un errore nell'identificazione delle caratteristiche della popolazione dai dati campione. Ovvero, in 95 casi su 100, la caratteristica generale individuata sulla base del campione si troverà all'interno dell'intervallo di confidenza.

La distribuzione di una variabile casuale (distribuzione della popolazione) è solitamente caratterizzata da una serie di caratteristiche numeriche:

  • per una distribuzione normale N(a, σ) è l'aspettativa matematica a e la deviazione standard σ;
  • per una distribuzione uniforme, R(a,b) sono i confini dell'intervallo in cui si osservano i valori di questa variabile casuale.
Tali caratteristiche numeriche, solitamente sconosciute, vengono chiamate parametri della popolazione . Stima dei parametri - la corrispondente caratteristica numerica calcolata dal campione. Le stime dei parametri della popolazione rientrano in due classi: punto E intervallo.

Quando un punteggio è determinato da un singolo numero, viene chiamato stima puntuale. La stima puntuale, in funzione del campione, è una variabile casuale e varia da campione a campione con esperimenti ripetuti.
Le stime puntuali hanno requisiti che devono soddisfare per essere “benigne” in ogni senso. Questo non spostato, efficienza E ricchezza.

Stime di intervallo sono determinati da due numeri: le estremità dell'intervallo che copre il parametro stimato. A differenza delle stime puntuali, che non danno un’idea di quanto possa discostarsi il parametro stimato da esse, le stime intervallari permettono di stabilire l’accuratezza e l’affidabilità delle stime.

Come stime puntuali dell'aspettativa matematica, della dispersione e della deviazione standard, vengono utilizzate le caratteristiche del campione, rispettivamente la media campionaria, la dispersione del campione e la deviazione standard del campione.

Proprietà di stima imparziale.
Un requisito auspicabile per la valutazione è l’assenza di errori sistematici, vale a dire quando si utilizza ripetutamente al posto del parametro θ la sua stima, il valore medio dell'errore di approssimazione è zero - questo è proprietà della stima imparziale.

Definizione. Una stima è detta imparziale se la sua aspettativa matematica è uguale al valore reale del parametro stimato:

La media aritmetica campionaria è una stima imparziale dell'aspettativa matematica e della varianza campionaria - stima distorta della varianza generale D. Una stima imparziale della varianza generale è la stima

Proprietà di consistenza della valutazione.
Il secondo requisito di una stima – la sua coerenza – significa che la stima migliora con l’aumentare della dimensione del campione.

Definizione. Grado si dice consistente se converge in probabilità al parametro stimato θ come n→∞.


La convergenza della probabilità significa che con un campione di grandi dimensioni, la probabilità di grandi deviazioni della stima dal valore reale è piccola.

Proprietà di stima effettiva.
Il terzo requisito consente di selezionare la migliore stima tra più stime dello stesso parametro.

Definizione. Uno stimatore imparziale è efficiente se ha la varianza più piccola tra tutti gli stimatori imparziali.

Ciò significa che la stima effettiva ha una dispersione minima rispetto al valore reale del parametro. Si noti che non sempre esiste una stima efficace, ma tra due stime è solitamente possibile scegliere quella più efficace, ovvero con meno varianza. Ad esempio, per un parametro sconosciuto a di una popolazione normale N(a,σ), sia la media aritmetica campionaria che la mediana campionaria possono essere considerate come una stima imparziale. Ma la varianza della mediana campionaria è circa 1,6 volte maggiore della varianza della media aritmetica. Pertanto, una stima più efficace è la media aritmetica campionaria.

Esempio n. 1. Trova una stima imparziale della varianza delle misurazioni di alcune variabili casuali utilizzando un dispositivo (senza errori sistematici), i cui risultati di misurazione (in mm): 13,15,17.
Soluzione. Tabella per il calcolo degli indicatori.

X|x - x av |(x - x medio) 2
13 2 4
15 0 0
17 2 4
45 4 8

Media aritmetica semplice(stima imparziale dell'aspettativa matematica)


Dispersione- caratterizza la misura della dispersione attorno al suo valore medio (una misura di dispersione, cioè deviazione dalla media - stima distorta).


Stimatore imparziale della varianza- stima coerente della varianza (varianza corretta).

Esempio n.2. Trova una stima imparziale dell'aspettativa matematica delle misurazioni di una determinata variabile casuale da parte di un dispositivo (senza errori sistematici), i cui risultati di misurazione (in mm): 4,5,8,9,11.
Soluzione. m = (4+5+8+9+11)/5 = 7,4

Esempio n.3. Trovare la varianza corretta S2 per una dimensione campionaria di n=10 se la varianza campionaria è D = 180.
Soluzione. S2 = n*D/(n-1) = 10*180/(10-1) = 200

Le distribuzioni nelle statistiche matematiche sono caratterizzate da molti parametri statistici. La stima dei parametri di distribuzione sconosciuti sulla base di vari dati campione consente di costruire distribuzioni di una variabile casuale.

Trova una stima statistica di un parametro di distribuzione sconosciuto: trova una funzione di variabili casuali osservate che fornirà un valore approssimativo del parametro stimato.

Le stime statistiche possono essere classificate come imparziali, distorte, efficienti e coerenti.

Definizione 1

Stima imparziale-- stima statistica $Q^*$, che, per qualsiasi valore della dimensione campionaria, ha un'aspettativa matematica pari al parametro stimato, ovvero

Definizione 2

Stima parziale-- stima statistica $Q^*$, che, per qualsiasi valore della dimensione campionaria, ha un'aspettativa matematica diversa dal parametro stimato, ovvero

Definizione 4

Valutazione coerente-- una valutazione statistica in cui, con una dimensione campionaria tendente all'infinito, la probabilità tende al parametro stimato $Q.$

Definizione 5

Valutazione coerente-- una stima statistica in cui, poiché la dimensione del campione tende all'infinito, la varianza della stima imparziale tende a zero.

Medie generali e campionarie

Definizione 6

Media generale-- media aritmetica dei valori della variante della popolazione generale.

Definizione 7

Media campionaria-- media aritmetica dei valori della popolazione campione.

I valori della media generale e campionaria possono essere trovati utilizzando le seguenti formule:

  1. Se i valori dell'opzione $x_1,\ x_2,\dots ,x_k$ hanno rispettivamente frequenze $n_1,\ n_2,\dots ,n_k$, allora
  1. Se i valori dell'opzione $x_1,\ x_2,\dots,x_k$ sono diversi, allora

Associato a questo concetto è il concetto di deviazione dalla media. Questo valore si trova utilizzando la seguente formula:

La deviazione media ha le seguenti proprietà:

    $\sum(n_i\left(x_i-\overline(x)\right)=0)$

    La deviazione media è zero.

Varianze generali, campionarie e corrette

Un altro dei parametri principali è il concetto di varianza generale e campionaria:

Varianza generale:

Varianza del campione:

Anche le deviazioni standard generali e campionarie sono associate a questi concetti:

Per stimare la varianza generale si introduce il concetto di varianza corretta:

Viene inoltre introdotto il concetto di deviazione standard corretta:

Esempio di soluzione del problema

Esempio 1

La popolazione è definita dalla seguente tabella di distribuzione:

Figura 1.

Troviamo la media generale, la varianza generale, la deviazione standard generale, la varianza corretta e la deviazione standard corretta.

Per risolvere questo problema, creiamo innanzitutto una tabella di calcolo:

Figura 2.

Il valore $\overline(x_â)$ (media campionaria) si trova con la formula:

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(87)(30)=2.9\]

Troviamo la varianza generale utilizzando la formula:

Deviazione standard generale:

\[(\sigma )_â=\sqrt(D_â)\circa 1,42\]

Varianza corretta:

\[(S^2=\frac(n)(n-1)D)_â=\frac(30)(29)\cdot 2.023\circa 2.09\]

Deviazione standard corretta.

Supponiamo di voler studiare, ad esempio, una caratteristica quantitativa di una popolazione generale. Supponiamo che, da considerazioni teoriche, siamo riusciti a stabilire esattamente quale distribuzione ha la caratteristica. Naturalmente si pone il problema di stimare i parametri che determinano tale distribuzione. Ad esempio, se si sa in anticipo che la caratteristica studiata è distribuita normalmente nella popolazione, allora è necessario stimare (trovare approssimativamente) l'aspettativa matematica a e la deviazione standard s, poiché questi due parametri determinano completamente la distribuzione normale .

Di solito, il ricercatore ha a sua disposizione solo dati campione, ad esempio i valori della caratteristica quantitativa x 1, x 2, ..., x n, ottenuti come risultato di n osservazioni. Attraverso questi dati viene espresso il parametro stimato.

Sia q * una stima statistica del parametro sconosciuto q della distribuzione teorica. Distinguere imparziale E spostato valutazioni.

Imparziale chiamare una stima statistica q *, la cui aspettativa matematica è uguale al parametro stimato q per qualsiasi dimensione del campione, cioè

Altrimenti, cioè se M(q *) ¹ q, si chiama stima spostato.

Il requisito imparziale significa che non dovrebbe esserci alcuna deviazione sistematica nella stessa direzione dei valori osservati da q.

C'è anche l'obbligo di una valutazione statistica efficienza, che implica (per una data dimensione del campione) la varianza più piccola possibile e, nel caso di un campione di grandi dimensioni, il requisito solvibilità, cioè la coincidenza pratica dei valori osservati della variabile casuale con il parametro stimato.

Se il materiale statistico viene presentato sotto forma di serie di variazioni, la sua successiva analisi viene effettuata, di regola, con l'aiuto di alcuni valori costanti che riflettono abbastanza pienamente i modelli inerenti alla popolazione studiata.

Queste costanti includono valori medi, tra i quali il più significativo è media aritmetica- è più semplice di altri nel significato, nelle proprietà e nel metodo di produzione.

Poiché nello studio della popolazione generale viene prelevato un campione, viene chiamato il valore costante che caratterizza il campione media campionaria ed è designato .

Si può dimostrare che esiste stima imparziale valore medio aritmetico delle caratteristiche della popolazione generale, cioè

Lascia che un insieme sia diviso in parti - gruppi, non necessariamente lo stesso in volume. Quindi vengono chiamate le distribuzioni medie aritmetiche dei membri del gruppo medie di gruppo, e la media aritmetica della distribuzione per la stessa caratteristica dell'intera popolazione - media generale. I gruppi vengono chiamati disarticolare, se ciascun membro della popolazione appartiene a un solo gruppo.

La media complessiva è uguale alla media aritmetica delle medie di gruppo di tutti i gruppi disgiunti.

Esempio. Calcolare lo stipendio medio dei lavoratori aziendali in base ai dati della tabella

Soluzione. Per definizione, la media complessiva lo è

. (*)

n1 = 40, n2 = 50, n3 = 60

Lo stipendio medio dei lavoratori dell'officina n. 1. Per trovarlo, abbiamo compilato lo stipendio medio aritmetico dell'intera officina: 75, 85, 95 e 105 (cu). Per comodità, questi valori possono essere ridotti di cinque volte (questo è il loro massimo comun divisore): 15, 17, 19, 21. Il resto è chiaro dalla formula.

Dopo aver eseguito operazioni simili, troviamo , .

Sostituendo i valori ottenuti in (*), otteniamo

Le medie sono valori costanti che caratterizzano in un certo modo le distribuzioni. Alcune distribuzioni sono giudicate solo in base ai mezzi. Ad esempio, per confrontare i livelli salari in diversi settori, è sufficiente confrontare i salari medi al loro interno. Tuttavia, le medie non possono essere utilizzate per giudicare né le differenze tra i livelli salariali dei lavoratori più pagati e quelli meno pagati, né quali deviazioni si verificano rispetto ai salari medi.

In statistica, l’interesse maggiore è la diffusione dei valori degli attributi attorno alla loro media aritmetica. Nella pratica e negli studi teorici, la dispersione di una caratteristica è più spesso caratterizzata da dispersione e deviazione standard.

Varianza del campione D B è la media aritmetica dei quadrati della deviazione dei valori osservati di una caratteristica dal loro valore medio.

Se tutti i valori x 1, x 2, ... x n della caratteristica di un campione di volume n sono diversi, allora

. (3)

Se i valori dell'attributo x 1, x 2, ... x k hanno frequenze n 1, n 2, ... n k, rispettivamente, e n 1 + n 2 + ... + n k = n, allora

. (4)

Se è necessario che l'indicatore di dispersione sia espresso nelle stesse unità dei valori degli attributi, è possibile utilizzare la caratteristica riassuntiva - deviazione standard

Per calcolare la varianza, solitamente viene utilizzata la formula

Se la popolazione è divisa in gruppi non sovrapposti, allora per caratterizzarli possiamo introdurre i concetti di gruppo, intragruppo, intergruppo e dispersione totale.

Gruppo la dispersione è la dispersione della distribuzione dei membri del j-esimo gruppo rispetto alla loro media - media del gruppo, cioè

dove n i è la frequenza del valore x i, è il volume del gruppo j.

Infragruppo la dispersione è la media aritmetica delle dispersioni dei gruppi

dove N j (j = 1, 2, …, m) sono i volumi dei gruppi disgiunti.

Intergruppo la dispersione è la media aritmetica delle deviazioni al quadrato delle medie di gruppo di tutti i gruppi disgiunti dalla media complessiva, ovvero

.

Generale la dispersione è la dispersione dei valori di una caratteristica dell'intera popolazione rispetto alla media complessiva

,

dove n i è la frequenza del valore x i; - media complessiva; n è il volume dell'intera popolazione.

Si può dimostrare che la varianza totale di D è uguale alla somma, cioè

Esempio. Trova la varianza totale di una popolazione composta dai seguenti due gruppi

Primo gruppo Secondo gruppo
x io no io x io no io

Soluzione. Troviamo le medie del gruppo

Troviamo le varianze di gruppo

Troviamo la media generale

Varianza totale richiesta

I preventivi considerati sopra vengono solitamente chiamati punto, poiché queste stime sono determinate un numero. Nel caso piccolo volume campioni, viene utilizzata una stima intervallare, determinata due numeri, chiamati estremi dell'intervallo.

Le stime intervallari ci permettono di stabilire precisione e affidabilità valutazioni. Spieghiamo il significato di questi concetti. Supponiamo che la caratteristica statistica q * trovata dai dati del campione serva come stima del parametro sconosciuto q. È chiaro che q * quanto più accuratamente verrà determinato il parametro q, tanto minore sarà il valore assoluto . In altre parole, se d > 0 e , quanto più piccolo è d, tanto più accurata sarà la stima.

Pertanto, il numero d > 0 caratterizza precisione valutazioni. Ma d’altra parte, i metodi statistici non ci consentono di affermare categoricamente che la stima q * soddisfi la disuguaglianza. Qui possiamo solo parlare probabilità g, con cui si realizza questa disuguaglianza. Questa probabilità è chiamata g affidabilità (probabilità di fiducia) stima q per q * .

Pertanto da quanto detto risulta che

La relazione (*) va intesa come segue: la probabilità che l'intervallo (q * - d, q * + d) contenga (copra) il parametro sconosciuto q è uguale a g. L'intervallo (q * - d, q * + d) che copre il parametro sconosciuto con una data affidabilità g è chiamato confidenza.

Esempio. La variabile casuale X ha una distribuzione normale con una deviazione standard nota s = 3. Trovare gli intervalli di confidenza per stimare l'aspettativa matematica sconosciuta a utilizzando le medie campionarie, se la dimensione del campione è n = 36 e l'affidabilità della stima è data g = 0,95 .

Soluzione. Si noti che se la variabile casuale X è distribuita normalmente, anche la media campionaria , trovata da osservazioni indipendenti, è distribuita normalmente e i parametri di distribuzione sono i seguenti: , (vedere pagina 54).

Chiediamo che la relazione sia soddisfatta

.

Usando la formula (**) (vedi pagina 43), sostituendo X con e s con , otteniamo

Dopo aver studiato questo capitolo, lo studente lo farà Sapere, che un campione può essere considerato come un analogo empirico di una popolazione generale, che con l'aiuto di dati campione si possono giudicare le proprietà di una popolazione generale e valutarne le caratteristiche, le leggi fondamentali della distribuzione delle stime statistiche, essere in grado di produrre stime puntuali e intervallari dei parametri della popolazione utilizzando il metodo dei momenti e della massima verosimiglianza, Proprio modi per determinare l’accuratezza e l’affidabilità delle stime ottenute.

Tipi di stime statistiche

Ciò che sappiamo dei parametri della popolazione generale è che esistono oggettivamente, ma è impossibile determinarli direttamente perché la popolazione generale è infinita o eccessivamente grande. Pertanto, la domanda potrebbe riguardare solo la valutazione di queste caratteristiche.

È stato precedentemente stabilito che per un campione estratto da una popolazione generale, soggetto a condizioni di rappresentatività, è possibile determinare caratteristiche analoghe a quelle della popolazione generale.

cjp Definizione 8.1. I valori approssimativi dei parametri di distribuzione trovati nel campione sono chiamati stime dei parametri.

Indichiamo con 0 il parametro stimato della variabile casuale (popolazione generale) e con 0 la sua stima ottenuta utilizzando il campione.

Un punteggio pari a 0 è una variabile casuale perché qualsiasi campione è casuale. Le stime ottenute per campioni diversi differiranno l'una dall'altra. Considereremo quindi 0 una funzione dipendente dal campione: 0 = 0(X in).

ShchR Definizione 8.2. La valutazione statistica si chiama ricco, se tende in probabilità al parametro stimato:

Questa uguaglianza significa che l'evento 0=0 diventa affidabile man mano che la dimensione del campione aumenta indefinitamente.

Un esempio potrebbe essere la frequenza relativa di alcuni eventi UN, che è una stima coerente della probabilità di questo evento secondo il teorema di Poisson (vedi formula (6.1), parte 1).

Definizione 8.3. Una stima statistica si dice efficiente se ha la minima varianza per le stesse dimensioni del campione.

Considera la valutazione Mx aspettativa matematica Mx variabile casuale X. Come tale stima scegliamo X. Troviamo l'aspettativa matematica di una variabile casuale X.

Facciamo prima un'affermazione importante: dato che tutte le variabili casuali X, provengono dalla stessa popolazione X, il che significa che hanno la stessa distribuzione di X, si può scrivere:

Ora troviamo M(X dentro):


Pertanto, la media campionaria è una stima statistica dell'aspettativa matematica di una variabile casuale. Questa stima è coerente perché, in accordo con il corollario del teorema di Chebyshev, converge in probabilità all’aspettativa matematica (6.3).

Abbiamo stabilito che nel caso in esame, l'aspettativa matematica della stima da noi scelta (variabile casuale) è uguale al parametro stimato stesso. Le stime con questa proprietà occupano un posto speciale nella statistica matematica e sono chiamate imparziali.

Definizione 8.4. La stima statistica © è detta imparziale se la sua aspettativa matematica è uguale al parametro stimato

Se questo requisito non viene soddisfatto, la stima viene definita distorta.

Pertanto, la media campionaria è una stima imparziale del valore atteso.

Analizziamo la distorsione della varianza campionaria D, se viene scelto come stima della varianza generale Dx. Per fare ciò, controlliamo se la condizione (8.2) è soddisfatta per?):


Trasformiamo ciascuno dei due termini risultanti:

Qui è stata utilizzata l'uguaglianza M(X.) = M(X2), giusto per la stessa ragione di (8.1).

Consideriamo il secondo termine. Utilizzando la formula della somma quadrata N termini che otteniamo


Tenendo conto nuovamente dell'uguaglianza (8.1), nonché del fatto che X e X sono variabili casuali indipendenti, scriviamo

e infine otteniamo:

Sostituiamo i risultati ottenuti nella (8.3)

Dopo la trasformazione otteniamo

Possiamo quindi concludere che la varianza campionaria è spostato stima della varianza generale.

Tenendo conto del risultato ottenuto, ci siamo posti il ​​compito di costruire una stima della varianza generale che soddisfi la condizione imparziale (8.2). Per fare ciò, considera la variabile casuale

È facile vedere che per questa quantità la condizione (8.2) è soddisfatta:

Si noti che le differenze tra la varianza campionaria e la varianza campionaria corretta diventano insignificanti in caso di campioni di dimensioni maggiori.

Quando si scelgono le stime delle caratteristiche delle variabili casuali, è importante conoscerne l'accuratezza. In alcuni casi è necessaria un'elevata precisione e talvolta è sufficiente una stima approssimativa. Ad esempio, quando pianifichiamo un volo con trasferimento, è importante per noi conoscere nel modo più accurato possibile l'orario di arrivo previsto al punto di coincidenza. In un'altra situazione, ad esempio, quando siamo a casa e aspettiamo un corriere con la merce che abbiamo ordinato, per noi non è importante l'elevata precisione dell'orario di arrivo. In entrambi i casi la variabile casuale è l'orario di arrivo, e la caratteristica della variabile casuale che ci interessa è il tempo medio di viaggio.

Esistono due tipi di valutazioni. Nel primo caso, il compito è ottenere un valore numerico specifico del parametro. In un altro caso, viene determinato un intervallo in cui il parametro di nostro interesse rientra con una determinata probabilità.