Cum se rulează regresia în Excel

Cuprins:

Cum se rulează regresia în Excel
Cum se rulează regresia în Excel
Anonim

Regresia în Excel este o modalitate de a automatiza procesul statistic de comparare a mai multor seturi de informații pentru a vedea modul în care modificările variabilelor independente afectează modificările variabilelor dependente. Dacă ați dorit vreodată să găsiți o corelație între două lucruri, utilizarea analizei de regresie în Excel este una dintre cele mai bune modalități de a face asta.

Instrucțiunile din acest articol se aplică pentru Excel 2019, Excel 2016, Excel 2013, Excel 2010.

Care este sensul regresiei?

Regresia este o abordare de modelare statistică pe care analiștii o folosesc pentru a determina relațiile dintre mai multe variabile.

Analiza de regresie începe cu o singură variabilă pe care încercați să o analizați și cu variabile independente pe care le testați pentru a vedea dacă afectează acea variabilă unică. Analiza analizează modificările variabilelor independente și încearcă să coreleze aceste modificări cu modificările rezultate ale variabilei unice (dependente).

Aceasta poate suna ca o statistică avansată, dar Excel pune această analiză complexă la dispoziția oricui.

Efectuarea regresiei liniare în Excel

Cea mai simplă formă de analiză a regresiei este regresia liniară. Regresia liniară simplă analizează relația dintre doar două variabile.

De exemplu, următoarea foaie de calcul arată date care conțin numărul de calorii pe care o persoană le-a consumat în fiecare zi și greutatea acesteia în ziua respectivă.

Image
Image

Deoarece această foaie de calcul conține două coloane de date și o variabilă ar putea avea un efect asupra celeil alte, puteți efectua o analiză de regresie a acestor date folosind Excel.

Activarea suplimentului pentru pachetul de instrumente de analiză

Înainte de a putea folosi funcția de analiză a regresiei din Excel, trebuie să activați suplimentul Analysis ToolPak în ecranul Opțiuni Excel.

  1. În Excel, selectați meniul Fișier și alegeți Opțiuni.

    Image
    Image
  2. Selectați Suplimente din meniul de navigare din stânga. Apoi, asigurați-vă că Suplimente Excel este selectat în câmpul Gestionați.

    Image
    Image
  3. În sfârșit, selectați butonul Go.

    Image
    Image
  4. În fereastra pop-up Add-in. Activați Analysis ToolPack dând clic pe caseta din fața acestuia pentru a adăuga o bifă și selectați OK.

    Image
    Image

Acum, că instrumentele de analiză sunt activate, sunteți gata să începeți să faceți analize de regresie în Excel.

Cum se efectuează regresia liniară simplă în Excel

Folosind foaia de calcul cu greutatea și caloriile ca exemplu, puteți efectua o analiză de regresie liniară în Excel, după cum urmează.

  1. Selectați meniul Date. Apoi, în grupul Analiză, selectați Analiza datelor.

    Image
    Image
  2. În fereastra Analiza datelor, selectați Regresie din listă și faceți clic pe OK.

    Image
    Image
  3. Intervalul Y de intrare este intervalul de celule care conține variabila dependentă. În acest exemplu, aceasta este greutatea. Intervalul Input X Range este intervalul de celule care conține variabila independentă. În acest exemplu, aceasta este coloana de calorii.

    Image
    Image
  4. Selectați Etichete pentru celulele antetului, apoi selectați Foaie de lucru nouă pentru a trimite rezultatele la o nouă foaie de lucru. Selectați OK pentru ca Excel să ruleze analiza și să trimită rezultatele într-o foaie nouă.

    Image
    Image
  5. Examinați noua foaie de lucru. Rezultatul analizei are un număr de valori pe care trebuie să le înțelegeți pentru a interpreta rezultatele.

    Image
    Image

    Fiecare dintre aceste numere are următoarele semnificații:

    • Multiple R: Coeficientul de corelație. 1 indică o corelație puternică între cele două variabile, în timp ce -1 înseamnă că există o relație negativă puternică. 0 înseamnă că nu există nicio corelație.
    • R Square: Coeficientul de determinare, care arată câte puncte dintre cele două variabile se încadrează pe linia de regresie. Statistic, aceasta este suma abaterilor pătrate de la medie.
    • Pătrat R ajustat: o valoare statistică numită pătrat R, care este ajustată pentru numărul de variabile independente pe care le-ați ales.
    • Eroare standard: Cât de precise sunt rezultatele analizei de regresie. Dacă această eroare este mică, atunci rezultatele dvs. de regresie sunt mai precise.
    • Observații: numărul de observații din modelul dvs. de regresie.

    Valorile rămase din rezultatul regresiei vă oferă detalii despre componentele mai mici din analiza de regresie.

    • df: valoare statistică cunoscută sub numele de grade de libertate legate de sursele de varianță.
    • SS: Suma pătratelor. Raportul dintre suma reziduală a pătratelor față de SS total ar trebui să fie mai mic dacă majoritatea datelor dvs. se potrivesc liniei de regresie.
    • MS: pătratul mediu al datelor de regresie.
    • F: statistica F (testul F) pentru ipoteza nulă. Aceasta oferă semnificația modelului de regresie.
    • Semnificație F: valoare statistică cunoscută sub numele de valoarea P a lui F.

    Dacă nu înțelegeți statisticile și calcularea modelelor de regresie, valorile din partea de jos a rezumatului nu vor avea prea multă semnificație. Cu toate acestea, pătratul multiplu R și R sunt cele mai importante.

După cum puteți vedea, în acest exemplu, caloriile au o corelație puternică cu greutatea totală.

Analiza de regresie liniară multiplă în Excel

Pentru a efectua aceeași regresie liniară, dar cu mai multe variabile independente, selectați întregul interval (mai multe coloane și rânduri) pentru Interval X de intrare.

Image
Image

Când selectați mai multe variabile independente, este mai puțin probabil să găsiți o corelație la fel de puternică, deoarece există atât de multe variabile.

Cu toate acestea, o analiză de regresie în Excel vă poate ajuta să găsiți corelații cu una sau mai multe dintre acele variabile despre care este posibil să nu realizați că există doar examinând datele manual.

Recomandat: