Un test T este o modalitate de a decide dacă există diferențe semnificative statistic între seturile de date, folosind o distribuție t a Studentului. Testul T în Excel este un test T cu două eșantioane care compară mediile a două eșantioane. Acest articol explică ce înseamnă semnificația statistică și arată cum să faci un T-Test în Excel.
Instrucțiunile din acest articol se aplică pentru Excel 2019, 2016, 2013, 2010, 2007; Excel pentru Microsoft 365 și Excel Online.
Ce este semnificația statistică?
Imaginați-vă că doriți să știți care dintre cele două zaruri va da un scor mai bun. Lansați primul zar și obțineți un 2; arunci al doilea zar și obții un 6. Vă spune asta că al doilea zar dă de obicei scoruri mai mari? Dacă ați răspuns „Desigur că nu”, atunci aveți deja o anumită înțelegere a semnificației statistice. Înțelegi că diferența s-a datorat modificării aleatorii a scorului, de fiecare dată când este aruncat un zar. Deoarece eșantionul era foarte mic (doar o rolă), nu a arătat nimic semnificativ.
Acum imaginați-vă că aruncați fiecare zar de 6 ori:
- Primul zar aruncă 3, 6, 6, 4, 3, 3; Medie=4,17
- Al doilea zar aruncă 5, 6, 2, 5, 2, 4; Medie=4,00
Acest lucru dovedește acum că primul zar dă scoruri mai mari decât al doilea? Probabil ca nu. Un eșantion mic cu o diferență relativ mică între medii face probabil ca diferența să se datoreze încă variațiilor aleatorii. Pe măsură ce creștem numărul de aruncări de zaruri, devine dificil să oferim un răspuns de bun simț la întrebarea - diferența dintre scoruri este rezultatul unei variații aleatorii sau este de fapt mai probabil ca unul să dea scoruri mai mari decât celăl alt?
Semnificația este probabilitatea ca o diferență observată între eșantioane să se datoreze variațiilor aleatorii. Semnificația este adesea numită nivelul alfa sau pur și simplu „α”. Nivelul de încredere, sau pur și simplu „c”, este probabilitatea ca diferența dintre eșantioane să nu se datoreze variației aleatoare; cu alte cuvinte, că există o diferență între populațiile de bază. Prin urmare: c=1 – α
Putem seta „α” la orice nivel dorim, pentru a fi încrezători că am dovedit importanța. Foarte des se folosește α=5% (încredere de 95%), dar dacă vrem să fim cu adevărat siguri că orice diferență nu este cauzată de variații aleatorii, am putea aplica un nivel de încredere mai mare, folosind α=1% sau chiar α=0,1 %.
Se folosesc diverse teste statistice pentru a calcula semnificația în diferite situații. Testele T sunt folosite pentru a determina dacă mediile a două populații sunt diferite, iar testele F sunt folosite pentru a determina dacă variațiile sunt diferite.
De ce testați semnificația statistică?
Când comparăm diferite lucruri, trebuie să folosim teste de semnificație pentru a determina dacă unul este mai bun decât celăl alt. Acest lucru se aplică multor câmpuri, de exemplu:
- În afaceri, oamenii trebuie să compare diferite produse și metode de marketing.
- În sport, oamenii trebuie să compare diferite echipamente, tehnici și concurenți.
- În inginerie, oamenii trebuie să compare diferite modele și setări ale parametrilor.
Dacă doriți să testați dacă ceva funcționează mai bine decât altceva, în orice domeniu, trebuie să testați semnificația statistică.
Ce este distribuția T a unui student?
Distribuția t a lui Student este similară cu o distribuție normală (sau gaussiană). Acestea sunt ambele distribuții în formă de clopot, cu cele mai multe rezultate apropiate de medie, dar unele evenimente rare sunt destul de departe de medie în ambele direcții, denumite cozile distribuției.
Forma exactă a distribuției t a Studentului depinde de dimensiunea eșantionului. Pentru eșantioanele mai mari de 30, este foarte similar cu distribuția normală. Pe măsură ce dimensiunea eșantionului este redusă, cozile devin mai mari, reprezentând incertitudinea crescută care rezultă din efectuarea de inferențe bazate pe un eșantion mic.
Cum se face un test T în Excel
Înainte de a putea aplica un test T pentru a determina dacă există o diferență semnificativă statistic între mediile a două eșantioane, trebuie mai întâi să efectuați un test F. Acest lucru se datorează faptului că pentru testul T sunt efectuate calcule diferite, în funcție de dacă există o diferență semnificativă între variații.
Veți avea nevoie de suplimentul Analysis Toolpak activat pentru a efectua această analiză.
Verificarea și încărcarea programului de completare Analysis Toolpack
Pentru a verifica și activa pachetul de instrumente de analiză, urmați acești pași:
- Selectați fila FILE >selectați Opțiuni.
- În caseta de dialog Opțiuni, selectați Suplimente din filele din partea stângă.
-
În partea de jos a ferestrei, selectați meniul derulant Gestionați, apoi selectați Suplimente Excel. Selectați Go.
- Asigurați-vă că caseta de selectare de lângă Pachet de instrumente de analiză este bifată, apoi selectați OK.
- Pachetul de instrumente de analiză este acum activ și sunteți gata să aplicați testele F și testele T.
Efectuarea unui test F și a unui test T în Excel
-
Introduceți două seturi de date într-o foaie de calcul. În acest caz, luăm în considerare vânzările a două produse pe parcursul unei săptămâni. Se calculează și valoarea medie zilnică a vânzărilor pentru fiecare produs, împreună cu abaterea standard a acestuia.
-
Selectați fila Date > Analiza datelor
-
Selectați F-Test Two-Sample pentru variații din listă, apoi selectați OK.
Testul F este foarte sensibil la non-normalitate. Prin urmare, poate fi mai sigur să folosiți un test Welch, dar acest lucru este mai dificil în Excel.
-
Selectați intervalul variabilei 1 și intervalul variabilei 2; setați Alpha (0,05 oferă 95% încredere); selectați o celulă pentru colțul din stânga sus al rezultatului, având în vedere că aceasta va umple 3 coloane și 10 rânduri. Selectați OK.
Pentru intervalul pentru variabila 1, trebuie selectat eșantionul cu cea mai mare abatere standard (sau varianță).
-
Vizualizați rezultatele testului F pentru a determina dacă există o diferență semnificativă între variații. Rezultatele dau trei valori importante:
- F: raportul dintre variații.
- P(F<=f) one-tail: probabilitatea ca variabila 1 să nu aibă de fapt o varianță mai mare decât variabila 2. Dacă aceasta este mai mare decât alfa, care este în general 0,05, atunci nu există nicio diferență semnificativă între variații.
- F Critical one-tail: valoarea lui F care ar fi necesară pentru a da P(F<=f)=α. Dacă această valoare este mai mare decât F, aceasta indică, de asemenea, că nu există o diferență semnificativă între variații.
P(F<=f) poate fi calculat și folosind funcția FDIST cu F și gradele de libertate pentru fiecare eșantion ca intrări. Gradele de libertate reprezintă pur și simplu numărul de observații dintr-un eșantion minus unu.
-
Acum că știți dacă există o diferență între variații, puteți selecta testul T potrivit. Selectați fila Date > Analiza datelor, apoi selectați fie Test t-T: două mostre presupunând variații egalesau test t: două eșantioane presupunând variații inegale
-
Indiferent de opțiunea pe care ați ales-o la pasul anterior, vi se va prezenta aceeași casetă de dialog pentru a introduce detaliile analizei. Pentru a începe, selectați intervalele care conțin eșantioanele pentru Intervalul variabilei 1 și Intervalul variabilei 2.
- Presumând că doriți să testați pentru nicio diferență între medii, setați Diferența medie ipotezată la zero.
- Setați nivelul de semnificație Alpha (0,05 oferă 95% încredere) și selectați o celulă pentru colțul din stânga sus al rezultatului, având în vedere că aceasta va umple 3 coloane și 14 rânduri. Selectați OK.
-
Examinați rezultatele pentru a decide dacă există o diferență semnificativă între medii.
La fel ca în cazul testului F, dacă valoarea p, în acest caz P(T<=t), este mai mare decât alfa, atunci nu există nicio diferență semnificativă. Cu toate acestea, în acest caz, sunt date două valori p, una pentru un test cu o coadă și ceal altă pentru un test cu două cozi. În acest caz, utilizați valoarea cu două cozi, deoarece oricare dintre variabile având o medie mai mare ar fi o diferență semnificativă.