Proprietățile de bază ale estimărilor statistice ale parametrilor de distribuție. Evaluare statistică

eşantion de distribuţie estimare statistică

O estimare este o aproximare a valorilor cantității dorite, obținute pe baza rezultatelor observării eșantionului. Estimările sunt variabile aleatorii. Ele oferă posibilitatea de a forma judecăți informate cu privire la parametrii necunoscuți ai populației. Un exemplu de estimare a mediei generale este media eșantionului a varianței generale - varianța eșantionului etc.

Pentru a evalua cât de „bine” îndeplinește evaluarea caracteristicilor generale corespunzătoare, au fost elaborate 4 criterii: consistență, imparțialitate, eficiență și suficiență. Această abordare se bazează pe faptul că calitatea unei estimări este determinată nu de valorile sale individuale, ci de caracteristicile distribuției sale ca variabilă aleatorie.

Pe baza principiilor teoriei probabilităților, se poate dovedi că dintre caracteristicile eșantionului precum media aritmetică, modul și mediana, numai media aritmetică reprezintă o estimare consistentă, imparțială, eficientă și suficientă a mediei generale. Aceasta determină preferința acordată mediei aritmetice printre alte caracteristici ale eșantionului.

Nedeplasat evaluarea se manifestă prin faptul că ea așteptări matematice pentru orice dimensiune a eșantionului este egală cu valoarea parametrului estimat în populația generală. Dacă această cerință nu este îndeplinită, atunci evaluarea este deplasat.

Condiția estimării nepărtinitoare are ca scop eliminarea erorilor sistematice de estimare.

Atunci când rezolvă probleme de estimare, se folosesc și estimări asimptotic imparțial, pentru care, pe măsură ce dimensiunea eșantionului crește, așteptarea matematică tinde spre parametrul estimat al populației generale.

Avere estimările statistice se manifestă prin faptul că, odată cu creșterea mărimii eșantionului, estimarea se apropie din ce în ce mai mult de valoarea reală a parametrului estimat sau, după cum se spune, estimarea converge în probabilitate către parametrul dorit, sau tinde spre așteptarea sa matematică. . Numai evaluările consistente au semnificație practică.

Aceasta este estimarea parametrului imparțial care are cea mai mică variație pentru o anumită dimensiune a eșantionului. În practică, varianța de estimare este de obicei identificată cu eroarea de estimare.

Ca măsuri de evaluare a eficacității luați raportul dintre variația minimă posibilă și varianța unei alte estimări.

O estimare care asigură utilizarea completă a tuturor informațiilor conținute în eșantion despre o caracteristică necunoscută a populației se numește suficient(exhaustiv).

Respectarea proprietăților estimărilor statistice discutate mai sus face posibilă considerarea caracteristicilor eșantionului pentru estimarea parametrilor populației generale ca fiind cele mai bune posibile.

Cea mai importantă sarcină a statisticii matematice este de a obține cele mai raționale, „adevărate” estimări statistice ale parametrilor doriti ai populației generale folosind date eșantionului. Există două tipuri de inferență statistică: estimarea statistică; testarea ipotezelor statistice.

Sarcina principală a obținerii estimărilor statistice este de a selecta și justifica cele mai bune estimări care oferă posibilitatea evaluării semnificative a parametrilor necunoscuți ai populației.

Problema estimării parametrilor necunoscuți poate fi rezolvată în două moduri:

  • 1. parametrul necunoscut este caracterizat printr-un număr (punct) - se utilizează metoda de estimare punctuală;
  • 2. estimarea intervalului, adică se determină un interval în care, cu o oarecare probabilitate, poate fi localizat parametrul dorit.

Estimarea punctuala parametrul necunoscut este că o valoare numerică specifică a estimării eșantionului este luată ca cea mai bună aproximare a parametrului populației adevărate, adică parametrul populației necunoscut este estimat printr-un singur număr (punct) determinat din eșantion. Cu această abordare există întotdeauna riscul de a face o eroare, astfel încât estimarea punctuală trebuie completată cu un indicator posibilă eroare la un anumit nivel de probabilitate.

Abaterea sa standard este considerată eroare medie de estimare.

Apoi, estimarea punctuală a mediei generale poate fi reprezentată ca un interval

unde este media aritmetică eșantionului.

Când se face o estimare punctuală, se folosesc mai multe metode pentru a obține estimări din datele eșantionului:

  • 1. metoda momentelor, în care momente ale populației generale sunt înlocuite cu momente ale populației eșantionului;
  • 2. metoda celor mai mici pătrate;
  • 3. metoda maximului de probabilitate.

În multe probleme, este necesar să se găsească nu numai o estimare numerică a unui parametru de populație, ci și să se evalueze acuratețea și fiabilitatea acestuia. Acest lucru este deosebit de important pentru mostrele relativ mici. O generalizare a estimării punctuale a unui parametru statistic este aceasta estimarea intervalului- găsirea unui interval numeric care să conţină parametrul estimat cu o anumită probabilitate.

Datorită faptului că la determinarea caracteristicilor generale din datele eșantionului există întotdeauna o anumită eroare, este mai practic să se determine intervalul centrat pe estimarea punctuală găsită, în cadrul căruia se află adevărata valoare dorită a parametrului estimat al caracteristicii generale cu o anumită probabilitate specificată. Acest interval se numește interval de încredere.

Interval de încredere este un interval numeric care, cu o probabilitate dată r, acoperă parametrul estimat al populației. Această probabilitate se numește încredere. Probabilitatea de încredere r este probabilitatea care poate fi considerată suficientă în cadrul problemei care se rezolvă pentru a aprecia fiabilitatea caracteristicilor obţinute pe baza observaţiilor eşantionului. Dimensiune

se numește probabilitatea de a greși nivelul de semnificație.

Pentru un eșantion (punctual) estimare ȘI * (theta) parametru ȘI al populației generale cu acuratețe ( eroare extremă) D și probabilitatea de încredere r, intervalul de încredere este determinat de egalitatea:

Probabilitatea de încredere r face posibilă stabilirea limitele de încredere fluctuația aleatorie a parametrului studiat ȘI pentru un eșantion dat.

Următoarele valori și valorile lor corespunzătoare sunt adesea luate ca probabilitate de încredere: niveluri de semnificație

Tabelul 1. - Probabilitățile de încredere și nivelurile de semnificație cel mai frecvent utilizate

De exemplu, un nivel de semnificație de 5 procente înseamnă următoarele: în 5 cazuri din 100, există riscul de a face o eroare la identificarea caracteristicilor populației din datele eșantionului. Sau, cu alte cuvinte, în 95 de cazuri din 100, caracteristica generală identificată pe baza eșantionului se va situa în intervalul de încredere.

Distribuția unei variabile aleatoare (distribuția populației) este de obicei caracterizată printr-un număr de caracteristici numerice:

  • pentru o distribuție normală N(a, σ) este așteptarea matematică a și abaterea standard σ;
  • pentru o distribuție uniformă, R(a,b) este limitele intervalului în care se observă valorile acestei variabile aleatoare.
Se numesc astfel de caracteristici numerice, de obicei necunoscute parametrii populației . Estimarea parametrilor - caracteristica numerică corespunzătoare calculată din probă. Estimările parametrilor populației se împart în două clase: punctŞi interval.

Când un scor este determinat de un singur număr, acesta este numit estimare punctuala. Estimarea punctuală, în funcție de eșantion, este o variabilă aleatorie și variază de la probă la probă cu experimente repetate.
Estimările punctuale au cerințe pe care trebuie să le îndeplinească pentru a fi „benigne” în orice sens. Acest nedeplasate, eficienţăŞi avere.

Estimări de interval sunt determinate de două numere - capetele intervalului care acoperă parametrul estimat. Spre deosebire de estimările punctuale, care nu dau o idee despre cât de departe poate fi parametrul estimat de acestea, estimările pe intervale ne permit să stabilim acuratețea și fiabilitatea estimărilor.

Ca estimări punctuale ale așteptărilor matematice, varianței și abaterii standard, sunt utilizate caracteristicile eșantionului, respectiv media eșantionului, varianța eșantionului și abaterea standard a eșantionului.

Proprietatea estimării nepărtinitoare.
O cerință de dorit pentru evaluare este absența erorii sistematice, de ex. atunci când se utilizează în mod repetat în locul parametrului θ estimarea acestuia, valoarea medie a erorii de aproximare este zero - aceasta este proprietatea estimării nepărtinitoare.

Definiţie. O estimare se numește nepărtinitoare dacă așteptarea sa matematică este egală cu valoarea adevărată a parametrului estimat:

Media aritmetică a eșantionului este o estimare imparțială a așteptărilor matematice și a varianței eșantionului - estimarea părtinitoare a varianței generale D. O estimare imparțială a varianței generale este estimarea

Proprietatea consistenței evaluării.
A doua cerință pentru o estimare - consistența acesteia - înseamnă că estimarea se îmbunătățește odată cu creșterea dimensiunii eșantionului.

Definiţie. Nota se numește consistent dacă converge în probabilitate către parametrul estimat θ ca n→∞.


Convergența probabilității înseamnă că, cu o dimensiune mare a eșantionului, probabilitatea unor abateri mari ale estimării față de valoarea adevărată este mică.

Proprietate de estimare efectivă.
A treia cerință vă permite să selectați cea mai bună estimare dintre mai multe estimări ale aceluiași parametru.

Definiţie. Un estimator imparțial este eficient dacă are cea mai mică varianță dintre toți estimatorii nepărținați.

Aceasta înseamnă că estimarea efectivă are o dispersie minimă în raport cu valoarea reală a parametrului. Rețineți că o estimare eficientă nu există întotdeauna, dar dintre două estimări este de obicei posibil să o alegeți pe cea mai eficientă, adică. cu mai puțină variație. De exemplu, pentru un parametru necunoscut a al unei populații normale N(a,σ), atât media aritmetică a eșantionului, cât și mediana eșantionului pot fi luate ca o estimare imparțială. Dar varianța mediei eșantionului este de aproximativ 1,6 ori mai mare decât varianța mediei aritmetice. Prin urmare, o estimare mai eficientă este media aritmetică a eșantionului.

Exemplul nr. 1. Găsiți o estimare nepărtinitoare a varianței măsurătorilor unei variabile aleatorii folosind un singur dispozitiv (fără erori sistematice), ale cărui rezultate ale măsurătorilor (în mm): 13,15,17.
Soluţie. Tabel pentru calcularea indicatorilor.

x|x - x av |(x - x medie) 2
13 2 4
15 0 0
17 2 4
45 4 8

Media aritmetică simplă(estimare imparțială a așteptărilor matematice)


Dispersia- caracterizează măsura dispersiei în jurul valorii sale medii (o măsură a dispersiei, adică abaterea de la medie - estimare părtinitoare).


Estimator de varianță imparțial- estimarea consistentă a varianței (varianță corectată).

Exemplul nr. 2. Găsiți o estimare imparțială a așteptărilor matematice ale măsurătorilor unei anumite variabile aleatoare de către un dispozitiv (fără erori sistematice), ale cărei rezultate de măsurare (în mm): 4,5,8,9,11.
Soluţie. m = (4+5+8+9+11)/5 = 7,4

Exemplul nr. 3. Găsiți varianța corectată S2 pentru o dimensiune a eșantionului de n=10 dacă varianța eșantionului este D = 180.
Soluţie. S 2 = n*D/(n-1) = 10*180/(10-1) = 200

Distribuțiile în statistica matematică sunt caracterizate de mulți parametri statistici. Estimarea parametrilor de distribuție necunoscuți pe baza diferitelor date de eșantion vă permite să construiți distribuții ale unei variabile aleatorii.

Găsiți o estimare statistică a unui parametru de distribuție necunoscut - găsiți o funcție a variabilelor aleatoare observate care va da o valoare aproximativă a parametrului estimat.

Estimările statistice pot fi clasificate ca nepărtinitoare, părtinitoare, eficiente și consecvente.

Definiția 1

Estimare imparțială-- estimarea statistică $Q^*$, care, pentru orice valoare a mărimii eșantionului, are o așteptare matematică egală cu parametrul estimat, adică

Definiția 2

Estimare părtinitoare-- estimarea statistică $Q^*$, care, pentru orice valoare a mărimii eșantionului, are o așteptare matematică care nu este egală cu parametrul estimat, adică

Definiția 4

Evaluare consistentă-- o evaluare statistică în care, cu o dimensiune a eșantionului care tinde spre infinit, probabilitatea tinde către parametrul estimat $Q.$

Definiția 5

Evaluare consistentă-- o estimare statistică în care, pe măsură ce dimensiunea eșantionului tinde spre infinit, varianța estimării nepărtinitoare tinde spre zero.

Medii generale și eșantionare

Definiția 6

Media generală-- media aritmetică a valorilor variantei populației generale.

Definiția 7

Eșantion mediu-- media aritmetică a valorilor populației eșantionului.

Valorile mediei generale și ale eșantionului pot fi găsite folosind următoarele formule:

  1. Dacă valorile opțiunii $x_1,\ x_2,\dots ,x_k$ au, respectiv, frecvențe $n_1,\n_2,\dots ,n_k$, atunci
  1. Dacă valorile opțiunii $x_1,\ x_2,\dots ,x_k$ sunt diferite, atunci

Asociat acestui concept este conceptul de abatere de la medie. Această valoare se găsește folosind următoarea formulă:

Abaterea medie are următoarele proprietăți:

    $\sum(n_i\left(x_i-\overline(x)\right)=0)$

    Abaterea medie este zero.

Variante generale, eșantion și corectate

Un alt dintre parametrii principali este conceptul de varianță generală și de eșantion:

Varianta generala:

Varianta eșantionului:

Abaterile standard generale și de eșantion sunt, de asemenea, asociate cu aceste concepte:

Pentru estimarea varianței generale se introduce conceptul de varianță corectată:

Se introduce și conceptul de abatere standard corectată:

Exemplu de rezolvare a problemei

Exemplul 1

Populația este definită de următorul tabel de distribuție:

Figura 1.

Să găsim pentru aceasta media generală, varianța generală, abaterea standard generală, varianța corectată și abaterea standard corectată.

Pentru a rezolva această problemă, facem mai întâi un tabel de calcul:

Figura 2.

Valoarea $\overline(x_в)$ (media eșantionului) se găsește prin formula:

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(87)(30)=2,9\]

Să găsim varianța generală folosind formula:

Abaterea standard generala:

\[(\sigma )_в=\sqrt(D_в)\aproximativ 1,42\]

Varianta corectata:

\[(S^2=\frac(n)(n-1)D)_в=\frac(30)(29)\cdot 2,023\aproximativ 2,09\]

Abaterea standard corectată.

Să presupunem că doriți să studiați, de exemplu, o caracteristică cantitativă a unei populații generale. Să presupunem că, din considerente teoretice, a fost posibil să se stabilească ce fel de distribuție are caracteristica. Desigur, se pune problema estimării parametrilor care determină această distribuție. De exemplu, dacă se știe dinainte că caracteristica studiată este distribuită normal în populație, atunci este necesar să se estimeze (aflați aproximativ) așteptarea matematică a și abaterea standard s, deoarece acești doi parametri determină complet distribuția normală. .

De obicei, cercetătorul are la dispoziție doar date eșantion, de exemplu, valorile caracteristicii cantitative x 1, x 2, ..., x n, obținute ca urmare a n observații. Parametrul estimat este exprimat prin aceste date.

Fie q * o estimare statistică a parametrului necunoscut q al distribuției teoretice. Distinge imparțialŞi deplasat evaluări.

imparțial numiți o estimare statistică q *, a cărei așteptare matematică este egală cu parametrul estimat q pentru orice dimensiune a eșantionului, adică

Altfel, adică dacă M(q *) ¹ q, estimarea este numită deplasat.

Cerința imparțială înseamnă că nu ar trebui să existe o abatere sistematică în aceeași direcție a valorilor observate de la q.

Există, de asemenea, o cerință pentru evaluarea statistică eficienţă, ceea ce implică (pentru o anumită dimensiune a eșantionului) cea mai mică variație posibilă, iar în cazul unei dimensiuni mari a eșantionului, cerința solvabilitate, adică coincidența practică a valorilor observate ale variabilei aleatoare cu parametrul estimat.

Dacă materialul statistic este prezentat sub forma unei serii de variații, atunci analiza sa ulterioară se efectuează, de regulă, folosind niște valori constante care reflectă destul de pe deplin modelele inerente ale populației studiate.

Aceste constante includ valori medii, printre care cea mai semnificativă este medie aritmetică- este mai simplu decât alții ca semnificație, proprietăți și metodă de producție.

Întrucât în ​​studiul populației generale se prelevează un eșantion, se numește valoarea constantă care caracterizează eșantionul eșantion mediu si este desemnat .

Se poate demonstra că există estimare imparțială valoarea medie aritmetică a caracteristicii populaţiei generale, adică

Lasă un set să fie împărțit în părți - grupuri, nu neapărat la fel ca volum. Apoi se numesc distribuțiile medii aritmetice ale membrilor grupului medii de grup, și media aritmetică a distribuției pentru aceeași caracteristică a întregii populații - media generală. Grupurile sunt chemate disjuns, dacă fiecare membru al populației aparține unui singur grup.

Media generală este egală cu media aritmetică a mediilor de grup a tuturor grupurilor disjunctive.

Exemplu. Calculați salariul mediu al lucrătorilor întreprinderii conform datelor din tabel

Soluţie. Prin definiție, media generală este

. (*)

n 1 = 40, n 2 = 50, n 3 = 60

Salariul mediu al lucrătorilor din atelierul nr. 1. Pentru a-l găsi, am compilat salariul mediu aritmetic pentru întregul atelier: 75, 85, 95 și 105 (cu), aceste valori pot fi reduse de cinci ori (acesta este cel mai mare divizor comun al lor): 15, 17, 19, 21. Restul este clar din formulă.

După ce am efectuat operații similare, găsim , .

Înlocuind valorile obținute în (*), obținem

Mediile sunt valori constante care caracterizează distribuțiile într-un anumit fel. Unele distribuții sunt judecate numai prin mijloace. De exemplu, pentru a compara nivelurile salariileîn diferite industrii, este suficient să comparăm salariile medii din acestea. Cu toate acestea, mediile nu pot fi folosite pentru a judeca nici diferențele dintre nivelurile salariale ale lucrătorilor cel mai înalt și cel mai prost plătiți, nici ce abateri de la salariile medii apar.

În statistică, cel mai mare interes este răspândirea valorilor atributelor în jurul mediei lor aritmetice.În practică și în studiile teoretice, dispersia unei caracteristici este caracterizată mai des prin dispersie și abatere standard.

Varianta eșantionului D B este media aritmetică a pătratelor abaterii valorilor observate ale unei caracteristici de la valoarea lor medie.

Dacă toate valorile x 1, x 2, ... x n ale caracteristicii unui eșantion de volum n sunt diferite, atunci

. (3)

Dacă valorile atributului x 1, x 2, ... x k au frecvențe n 1, n 2, ... n k, respectiv, și n 1 + n 2 + ... + n k = n, atunci

. (4)

Dacă este nevoie ca indicatorul de dispersie să fie exprimat în aceleași unități ca și valorile atributelor, atunci puteți utiliza caracteristica rezumată - abaterea standard

Pentru a calcula varianța, se utilizează de obicei formula

Dacă populația este împărțită în grupuri care nu se suprapun, atunci pentru a le caracteriza putem introduce conceptele de grup, intragrup, intergrup și dispersie totală.

Grup dispersia este dispersia distribuției membrilor grupului j-a în raport cu media lor - media grupului, adică

unde n i este frecvența valorii x i, este volumul grupului j.

Intragrup dispersia este media aritmetică a dispersiilor de grup

unde N j (j = 1, 2, …, m) sunt volumele grupurilor disjunse.

Intergrup dispersia este media aritmetică a abaterilor pătrate ale mediilor de grup ale tuturor grupurilor disjunse de la media generală, adică

.

General dispersia este dispersia valorilor unei caracteristici a întregii populații în raport cu media generală

,

unde n i este frecvența valorii x i; - media generală; n este volumul întregii populații.

Se poate demonstra că varianța totală a lui D este egală cu suma, adică

Exemplu. Aflați varianța totală a unei populații formată din următoarele două grupuri

Primul grup A doua grupă
x i n i x i n i

Soluţie. Să găsim mediile de grup

Să găsim variațiile de grup

Să găsim media generală

Varianta totală necesară

Estimările considerate mai sus sunt de obicei numite punct, deoarece aceste estimări sunt determinate un număr. În cazul în care volum mic eșantion, se utilizează o estimare de interval, determinată doua numere, numite capetele intervalului.

Estimările de intervale ne permit să stabilim acuratețe și fiabilitate evaluări. Să explicăm sensul acestor concepte. Fie caracteristica statistică q * găsită din datele eșantionului să servească drept estimare a parametrului necunoscut q. Este clar că q * cu cât parametrul q va fi determinat mai precis, cu atât valoarea absolută este mai mică. Cu alte cuvinte, dacă d > 0 și , atunci cu cât d este mai mic, cu atât estimarea este mai precisă.

Astfel, numărul d > 0 caracterizează precizie evaluări. Dar, pe de altă parte, metodele statistice nu ne permit să afirmăm categoric că estimarea q * satisface inegalitatea. Aici putem vorbi doar despre probabilitate g, cu care se realizează această inegalitate. Această probabilitate g se numește fiabilitate (probabilitate de încredere) estimări ale lui q prin q * .

Astfel, din cele spuse rezultă că

Relația (*) trebuie înțeleasă astfel: probabilitatea ca intervalul (q * - d, q * + d) să conțină (acoperă) parametrul necunoscut q este egală cu g. Intervalul (q * - d, q * + d) care acoperă parametrul necunoscut cu o fiabilitate dată g se numește încredere.

Exemplu. Variabila aleatoare X are o distribuție normală cu o abatere standard cunoscută s = 3. Găsiți intervale de încredere pentru estimarea așteptării matematice necunoscute a folosind mediile eșantionului, dacă dimensiunea eșantionului este n = 36 și fiabilitatea estimării este dată de g = 0,95 .

Soluţie. Rețineți că dacă variabila aleatoare X este distribuită normal, atunci media eșantionului , găsită din observații independente, este de asemenea distribuită normal, iar parametrii de distribuție sunt după cum urmează: , (vezi pagina 54).

Solicităm ca relația să fie îndeplinită

.

Folosind formula (**) (vezi pagina 43), înlocuind X cu și s cu , obținem

După studierea acestui capitol, studentul va stiu, că un eșantion poate fi considerat ca un analog empiric al unei populații generale, că cu ajutorul datelor eșantionului se pot judeca proprietățile unei populații generale și se pot evalua caracteristicile acesteia, legile de bază ale distribuției estimărilor statistice, a putea produce estimări punctuale și pe intervale ale parametrilor populației folosind metoda momentelor și probabilității maxime; proprii modalităţi de a determina acurateţea şi fiabilitatea estimărilor obţinute.

Tipuri de estimări statistice

Ceea ce știm despre parametrii populației generale este că aceștia există în mod obiectiv, dar este imposibil să-i determine direct din cauza faptului că populația generală este fie infinită, fie excesiv de mare. Prin urmare, întrebarea poate fi doar despre evaluarea acestor caracteristici.

S-a stabilit anterior că pentru un eșantion extras dintr-o populație generală, sub rezerva condițiilor de reprezentativitate, se pot determina caracteristici care sunt analoge cu caracteristicile populației generale.

cjp Definiție 8.1. Valorile aproximative ale parametrilor de distribuție găsiți din eșantion se numesc estimări ale parametrilor.

Să notăm parametrul estimat al variabilei aleatoare (populația generală) ca 0, iar estimarea acestuia obținută folosind eșantionul ca 0.

Un scor de 0 este o variabilă aleatorie deoarece orice eșantion este aleatoriu. Estimările obținute pentru diferite eșantioane vor diferi unele de altele. Prin urmare, vom considera 0 o funcție în funcție de eșantion: 0 = 0(X in).

ShchR Definiţie 8.2. Evaluarea statistică se numește bogat, dacă tinde probabil către parametrul estimat:

Această egalitate înseamnă că evenimentul 0=0 devine fiabil pe măsură ce dimensiunea eșantionului crește la nesfârșit.

Un exemplu ar fi frecvența relativă a unui eveniment O, care este o estimare consistentă a probabilității acestui eveniment în conformitate cu teorema lui Poisson (vezi formula (6.1), partea 1).

Definiție 8.3. Se spune că o estimare statistică este eficientă dacă are cea mai mică varianță pentru aceleași dimensiuni ale eșantionului.

Luați în considerare evaluarea M x așteptări matematice M x variabilă aleatoare X. Ca atare estimare alegem X. Să găsim așteptările matematice ale unei variabile aleatorii X.

Să facem mai întâi o afirmație importantă: dat fiind că toate variabilele aleatoare X, sunt extrași din aceeași populație X, ceea ce înseamnă că au aceeași distribuție ca și X, se poate scrie:

Acum să găsim M(X in):


Astfel, media eșantionului este o estimare statistică a așteptării matematice a unei variabile aleatoare. Această estimare este consecventă deoarece, în conformitate cu corolarul teoremei lui Cebișev, ea converge în probabilitate către așteptarea matematică (6.3).

Am stabilit că, în cazul în cauză, așteptarea matematică a estimării alese de noi (variabila aleatoare) este egală cu parametrul estimat în sine. Estimările cu această proprietate ocupă un loc special în statisticile matematice sunt numite imparțial.

Definiție 8.4. Estimarea statistică © se numește imparțial dacă așteptarea sa matematică este egală cu parametrul estimat

Dacă această cerință nu este îndeplinită, atunci estimarea se numește părtinitoare.

Astfel, media eșantionului este o estimare imparțială a valorii așteptate.

Să analizăm părtinirea varianței eșantionului D, dacă se alege ca estimare a varianței generale Dx. Pentru a face acest lucru, să verificăm dacă condiția (8.2) este îndeplinită pentru?):


Să transformăm fiecare dintre cei doi termeni rezultați:

Aici a fost folosită egalitatea M(X.) = M(X 2), echitabil din același motiv ca (8.1).

Să ne uităm la al doilea termen. Folosind formula sumei pătrate n termenii pe care îi primim


Ținând cont din nou de egalitatea (8.1), precum și de faptul că X și X sunt variabile aleatoare independente, scriem

si in final obtinem:

Să substituim rezultatele obținute în (8.3)

După transformare obținem

Astfel, putem concluziona că varianța eșantionului este deplasat estimarea varianţei generale.

Ținând cont de rezultatul obținut, am stabilit sarcina de a construi o estimare a varianței generale care să satisfacă condiția de nepărțire (8.2). Pentru a face acest lucru, luați în considerare variabila aleatoare

Este ușor de observat că pentru această cantitate este îndeplinită condiția (8.2):

Rețineți că diferențele dintre varianța eșantionului și varianța eșantionului corectată devin nesemnificative la dimensiuni mai mari ale eșantionului.

Atunci când alegeți estimări ale caracteristicilor variabilelor aleatoare, este important să cunoașteți acuratețea acestora. În unele cazuri, este necesară o precizie ridicată și uneori este suficientă o estimare aproximativă. De exemplu, atunci când planificăm un zbor de legătură, este important pentru noi să cunoaștem cât mai exact cu putință ora planificată a sosirii la punctul de legătură. Într-o altă situație, de exemplu, fiind acasă și așteptând un curier cu marfa pe care am comandat-o, precizia ridicată a orei sosirii nu este importantă pentru noi. În ambele cazuri, variabila aleatoare este timpul de sosire, iar caracteristica variabilei aleatoare care ne interesează este timpul mediu de călătorie.

Există două tipuri de evaluări. În primul caz, sarcina este de a obține o valoare numerică specifică a parametrului. Într-un alt caz, se determină un interval în care parametrul de interes pentru noi scade cu o probabilitate dată.