Slik gjør du grunnleggende dataanalyse i Excel
Mesteparten av tiden når du kjører statistikk, vil du bruke statistisk programvare. Disse verktøyene er bygget for å gjøre beregninger som t-tester, chi-square tester, korrelasjoner, og så videre. Excel er ikke ment for dataanalyse. Men det betyr ikke at du ikke kan gjøre det.
Dessverre er Excels statistiske funksjoner ikke alltid intuitive. Og de gir deg vanligvis esoteriske resultater. Så i stedet for å bruke statistikkfunksjoner, skal vi bruke Go-to Excel-statistikk-tillegget: Data Analysis Toolpak.
Toolpak, til tross for sin ganske uheldig stavemåte, inneholder et bredt spekter av nyttig statistikkfunksjonalitet. La oss se hva vi kan gjøre med Excel-statistikk.
Legge til Excel Data Analysis Toolpak
Mens du kan gjør statistikk uten dataanalyseverktøyet, det er mye lettere med det. For å installere Toolpak i Excel 2016, gå til Fil> Valg> Add-ins.
Klikk Gå ved siden av “Administrer: Excel-tillegg.”
I det resulterende vinduet merker du av i boksen ved siden av Analyse Toolpak og klikk deretter OK.
Hvis du har lagt til Data Analysis Toolpak til Excel, vil du se en Dataanalyse knappen i Data fanen, gruppert i Analyse seksjon:
Hvis du vil ha enda mer strøm, må du huske å sjekke ut Excels andre tilleggsprogrammer, Power Up Excel med 10 tilleggsprogrammer for å behandle, analysere og visualisere data som en Pro Power Up Excel med 10 tillegg for å behandle, analysere og visualisere data Som en Pro Vanilla Excel er fantastisk, men du kan gjøre det enda sterkere med tillegg. Uansett hvilke data du trenger å behandle, er det sjansene for at noen opprettet en Excel-app for den. Her er et utvalg. Les mer .
Beskrivende statistikk i Excel
Uansett hvilken statistisk test du kjører, vil du sannsynligvis få Excels beskrivende statistikk først. Dette vil gi deg informasjon om middel, medianer, varians, standardavvik og feil, kurtosis, skewness og en rekke andre figurer.
Kjører beskrivende statistikk i Excel er enkelt. Klikk Dataanalyse På fanen Data velger du Beskrivende statistikk, og velg innspillingsområdet. Klikk pilen ved siden av feltet for inngangsområde, klikk og dra for å velge dataene dine, og klikk Tast inn (eller klikk på den tilsvarende nedpilen), som i GIF nedenfor.
Deretter må du huske å fortelle Excel om dataene dine har etiketter, hvis du vil ha utdataene i et nytt ark eller på samme, og hvis du vil ha oversiktstatistikk og andre alternativer.
Etter det, slo OK, og du får din beskrivende statistikk:
Studentens t-Test i Excel
De t-test er en av de mest grunnleggende statistiske tester, og det er lett å beregne i Excel med Toolpak. Klikk på Dataanalyse knappen og rul ned til du ser t-testalternativer.
Du har tre valg:
- t-Test: Paret To Eksempel på Midler bør brukes når målingene eller observasjonene dine var parret. Bruk dette når du tok to målinger av de samme fagene, for eksempel måling av blodtrykk før og etter et inngrep.
- t-Test: To-Sample Assuming Equal Variances bør brukes når målingene dine er uavhengige (som vanligvis betyr at de ble gjort på to forskjellige faggrupper). Vi diskuterer “like avvik” del i et øyeblikk.
- t-Test: To-Sample Assuming Ulike Variasjoner er også for uavhengige målinger, men brukes når avvikene dine er ulige.
For å teste om avvikene mellom de to prøvene er like, må du kjøre en F-test. Finne F-test to-prøve for avvik I listen Analyseverktøy velger du den og klikker på OK.
Skriv inn dine to datasett i innstillingsfeltene. La alfa verdien på 0,05 med mindre du har grunn til å endre det - hvis du ikke vet hva det betyr, bare gå. Til slutt klikker du OK.
Excel vil gi deg resultatene i et nytt ark (med mindre du har valgt Utgangsområde og en celle i ditt nåværende ark):
Du ser på P-verdien her. Hvis det er mindre enn 0,05, har du ulige avvik. Så å kjøre t-test, bør du bruke alternativet ulik varians.
Å kjøre a t-test, velg riktig test fra vinduet Analyseværktøy og velg begge settene dine data på samme måte som du gjorde for F-testen. Legg alfa verdien på 0,05, og klikk OK.
Resultatene inkluderer alt du trenger for å rapportere for en t-test: midlene, grader av frihet (df), t statistikk og P-verdiene for både en- og to-tailed tester. Hvis P-verdien er mindre enn 0,05, er de to prøvene vesentlig forskjellige.
Hvis du ikke er sikker på om du skal bruke en- eller to-tailed t-test, sjekk ut denne explainer fra UCLA.
ANOVA i Excel
Excel Data Analysis Toolpak tilbyr tre typer analyser av varians (ANOVA). Dessverre gir det deg ikke muligheten til å kjøre de nødvendige oppfølgingsprøver som Tukey eller Bonferroni. Men du kan se om det er et forhold mellom noen få forskjellige variabler.
Her er de tre ANOVA-tester i Excel:
- ANOVA: Enkeltfaktor analyserer variansen med en avhengig variabel og en uavhengig variabel. Det er å foretrekke å bruke flere t-tester når du har mer enn to grupper.
- ANOVA: To-faktor med replikasjon ligner på de sammenkoblede t-test; Det innebærer flere målinger på enkeltfag. De “to-faktor” En del av denne testen indikerer at det er to uavhengige variabler.
- ANOVA: To-faktor uten replikasjon innebærer to uavhengige variabler, men ingen replikering i måling.
Vi skal gå over enkeltfaktoranalysen her. I vårt eksempel ser vi på tre sett med tall, merket “Intervensjon 1,” “Intervensjon 2,” og “Intervensjon 3.” For å kjøre en ANOVA, klikk Dataanalyse, velg deretter ANOVA: Enkeltfaktor.
Velg inntastingsområdet og sørg for å fortelle Excel om gruppene dine er i kolonner eller rader. Jeg har også valgt “Etiketter i første rad” her slik at gruppens navn vises i resultatene.
Etter å ha slappet OK, vi får følgende resultater:
Vær oppmerksom på at P-verdien er mindre enn 0,05, så vi har et betydelig resultat. Det betyr at det er en signifikant forskjell mellom minst to av gruppene i testen. Men fordi Excel ikke gir tester for å bestemme hvilken grupper er forskjellige, det beste du kan gjøre er å se på gjennomsnittene som vises i sammendraget. I vårt eksempel ser Intervention 3 ut som det er sannsynligvis den som adskiller seg.
Dette er ikke statistisk lyd. Men hvis du bare vil se om det er en forskjell, og se hvilken gruppe som sannsynligvis forårsaker det, vil det fungere.
To-faktor ANOVA er mer komplisert. Hvis du vil lære mer om når du skal bruke tofaktormetoden, kan du se denne videoen fra Sophia.org og “uten replikering” og “med replikering” eksempler fra reell statistikk.
Korrelasjon i Excel
Beregning av korrelasjon i Excel er mye enklere enn t-test eller en ANOVA. Bruke Dataanalyse knappen for å åpne vinduet Analyseværktøy og velg Sammenheng.
Velg inntastingsområdet, identifiser gruppene dine som kolonner eller rader, og fortell Excel om du har etiketter. Etter det, slo OK.
Du vil ikke få noen viktige tiltak, men du kan se hvordan hver gruppe er korrelert med de andre. En verdi av en er en absolutt korrelasjon, noe som indikerer at verdiene er nøyaktig de samme. Jo nærmere en korrelasjonsverdien, jo sterkere korrelasjonen.
Regresjon i Excel
Regresjon er en av de mest brukte statistiske tester i industrien, og Excel pakker en overraskende mengde strøm til denne beregningen. Vi kjører en rask, flere regresjon i Excel her. Hvis du ikke er kjent med regresjon, sjekk ut HBRs veiledning for å bruke regresjon for virksomheten.
La oss si at vår avhengige variabel er blodtrykk, og våre to uavhengige variabler er vekt og saltinntak. Vi ønsker å se hvilken som er en bedre prediktor for blodtrykk (eller hvis de er begge gode).
Klikk Dataanalyse og velg regresjon. Du må være forsiktig når du fyller ut innstillingsbokser denne gangen. De Input Y Range esken skal inneholde den enkelte avhengige variabelen. De Input X Range boksen kan inneholde flere uavhengige variabler. For en enkel regresjon, ikke bekymre deg for resten (men husk å fortelle Excel hvis du valgte etiketter).
Slik ser vår beregning ut:
Etter å ha slappet OK, Du får en stor liste over resultater. Jeg har fremhevet P-verdien her for både vekt og saltinntak:
Som du kan se, er P-verdien for vekt større enn 0,05, så det er ingen signifikant forhold der. P-verdien for salt er imidlertid under 0,05, noe som indikerer at det er en god forutsetning for blodtrykk.
Hvis du planlegger å presentere regresjonsdataene dine, husk at du kan legge til en regresjonslinje til en scatterplot i Excel. Det er et flott visuelt hjelpemiddel Slik visualiserer du dataanalysen med Excels verktøymaskiner Slik visualiserer du dataanalysen med Excels verktøy Verktøy Excel dreper det med sine avanserte datahåndteringsfunksjoner. Når du har brukt et av de nye verktøyene, vil du ønske dem alle. Bli en mester i dataanalysen din med verktøy! Les mer for denne analysen.
Excel Statistikk: Overraskende Capable
Mens Excel ikke er kjent for sin statistiske kraft, pakker det faktisk noen veldig nyttige funksjoner. Spesielt når du laster ned Data Analysis Toolpak statistikk add-in. Jeg håper du har lært hvordan du bruker Toolpak, og at du nå kan spille rundt på egen hånd for å finne ut hvordan du bruker flere av funksjonene.
Med dette nå under beltet, tar du Excel-ferdighetene til neste nivå med artiklene våre om bruk av Excels målsøkingsfunksjon for mer datatrykk, mastering av IF-setninger i Excel, og legge til dropdownlister som celler i Excel.
Jeg har også koblet til andre nettsteder som har gode statistikkopplæringer der vi måtte hoppe over forvirrende konsepter. Sørg for å sjekke ut vår guide til gratis statistikkressurser. Lær statistikk gratis med disse 6 ressursene. Lær statistikk gratis med disse 6 ressursene. Statistikk har et rykte om et emne som er vanskelig å forstå. Men lære av riktig ressurs hjelper deg med å forstå undersøkelsesresultater, valgrapporter og statistikkoppgaver på kort tid. Les mer også.
Utforsk mer om: Microsoft Excel, regneark.