Name: Podstawowe metody i pojęcia statystyczne
Brand: Superprof
SKU: SP-CB-00004031
Rating: 4 (3 reviews)

Spójrzmy prawdzie w oczy, podczas gdy nauka o danych została nazwana „najseksowniejszą pracą XXI wieku”, większość ludzi wciąż drży nawet na wzmiankę o statystykach. Źródłem tego, że dyscyplina ta była tak wyobcowana w całej jej historii, można znaleźć jej bliski związek z matematyką.

Niezależnie od tego, czy uważasz, że nie możesz nauczyć się analizy statystycznej, czy po prostu chcesz dowiedzieć się więcej na ten temat, ten przewodnik pomoże ci zacząć od przedstawienia podstawowych pojęć wprowadzających.

Sercem statystyki jest pięć podstawowych pojęć statystyki, które stanowią podstawę analizy danych. Pierwszymi czterema można się zająć bez wchodzenia w szczegóły dotyczące ich równań:

Średnia: wartość średnia, obliczona jako suma wszystkich obserwacji w stosunku do liczby obserwacji
Mediana: punkt środkowy zestawu danych, obliczany przez uporządkowanie wszystkich obserwacji od najmniejszej do największej i przyjęcie wartości bezpośrednio w środku
Wariancja: ogólny rozkład danych, obliczony jako średnia kwadratowych różnic średniej
Odchylenie standardowe: także miara rozprzestrzeniania się, obliczana na podstawie pierwiastka kwadratowego wariancji

obliczanie danych statystycznych — Obliczaj dane statystyczne z łatwością. (Źródło: Unsplash)

Podobnie jak świadkowie powieści kryminalnej, te cztery pojęcia zaczynają opowiadać historię określonego zestawu danych, ponieważ są to statystyki opisowe. Na przykład, jeśli rozejrzysz się po ludziach w każdej restauracji, w której się znajdujesz, zbudowanie narracji lub interpretacji na temat tłumu, w którym jesteś, może być bardzo trudne.

Powiedzmy jednak, że otrzymujesz informacje o ich wieku, miesięcznych dochodach, poziomie wykształcenia, płci i smaku muzyki. Dwie pierwsze koncepcje, średnia i mediana, są miernikami centralnej tendencji, która może powiedzieć, czy twój tłum składa się głównie z dwudziestu osób, które są na studiach lub ludzi zamożnych, starszych osób, którzy inwestują w fundusze hedgingowe.

Różnica między korzystaniem z tych pojęć zależy od rozkładu mierzonej zmiennej lub w tym przykładzie, od stopnia zmienności w tłumie. Im większe podobieństwo tłumu, tym dokładniejszy będzie sposób opowiedzenia swojej historii; im większa jest różnica między ludźmi, tym dokładniejszy będzie rysowany obraz, biorąc pod uwagę średnią.

Zarówno wariancja, jak i odchylenie standardowe są miarami zmienności i mogą powiedzieć, jak różne są poszczególne obserwacje w danych od średniej w odniesieniu do konkretnej zmiennej.

Jeśli chcesz zobaczyć, jak podobny jest tłum pod względem wieku, zacznij obliczenia od obliczenia średniego wieku i odejmując od niego wiek każdej osoby, znajdź liczbę, która pokazuje, jak daleko ludzie się dzielą od średniej. Z drugiej strony odchylenie standardowe pokazuje, jak daleko lub blisko dane są grupowane wokół średniej w oparciu o rozkład normalny.

Odchylenie standardowe jest dokładnie podobne do wariancji pod względem tego, co mówi o rozprzestrzenianiu się twoich danych - w rzeczywistości odchylenie standardowe jest obliczane na podstawie pierwiastka kwadratowego wariancji. Różnica polega na tym, że odchylenie standardowe jest miarą opisową, która jest najłatwiejsza do zgłoszenia, ponieważ jest w tych samych jednostkach co oryginalne dane, podczas gdy wariancja nie.

Możesz sprawdzić, czego się nauczyłeś na swoim kursie statystycznym, próbując rozwiązać problemy z ćwiczeniami statystycznymi online!

Dostępni najlepsi nauczyciele statystyka

Typ testu	Typ zmiennych	Przykład
Korelacja liniowa Pearsona	Dwie zmienne ciągłe	Jeśli rozmiar buta ma związek z wysokością
Współczynnik korelacji rang Spearmana	Dwie zmienne porządkowe	Jak silny jest związek między szczęściem a statusem ekonomicznym
Test zgodności chi-kwadrat	Dwie zmienne kategoryczne	Aby sprawdzić, czy płeć i ulubiony kolor mają jakiś związek

Typ testu	Typ zmiennych	Przykład
Dopasowany test statystyczny	Dwie powiązane zmienne	Różnica między wagą przed i po przyjęciu nowego suplementu
Niezależny test statystyczny	Dwie niezależne zmienne	Różnica w wydatkach na gaz między ludźmi z Los Angeles i Nowego Jorku
Jedno-czynnikowa analiza wariancji (ANOVA)	Jedna niezależna zmienna o różnych poziomach i jedna zmienna ciągła	Porównanie średnich wyników testów z trzech różnych poziomów edukacji
Dwu-czynnikowa analiza wariancji (ANOVA)	Dwie lub więcej zmiennych niezależnych o różnych poziomach i jedna zmienna ciągła	Porównanie średnich wyników testu z obu trzech poziomów edukacji i dwunastu różnych znaków zodiaku

Typ testu	Typ wariacji	Przykład
Prosta regresja liniowa	Jedna zmienna skali (zależna) z jedną lub dwiema zmiennymi skali (wzór wstępny)	Chcesz sprawdzić, czy i jak wiek i wzrost przewidują wagę
Wielokrotna regresja liniowa	Jedna zmienna skali (zależna) z dwiema lub więcej zmiennymi skali (wzór wstępny)	Chcesz sprawdzić, czy i jak wiek, wzrost i dochód przewidują wagę

Typ testu	Typ wariacji	Przykład
Test sumy rang Wilcoxona	Dwie niezależne zmienne	Pomiędzy dwoma różnymi lekami, z których jeden zapewnia najlepszą ulgę w dwóch losowych, odrębnych grupach populacji
Test rangowych znaków Wilcoxona	Dwie powiązane zmienne	Pomiędzy dwoma różnymi lekami, z których jeden oferuje najlepszą ulgę dla tej samej grupy pacjentów
Test rang Friedmana	Trzy zmienne metryczne lub porządkowe (muszą być albo metryczne, albo porządkowe)	Trzy różne oceny reklam podane przez osoby w tej samej populacji

Założenie	Opis
Niezależność	Grupy tworzące próbkę są od siebie niezależne
Normalność	Dane w zestawie są normalne, co oznacza, że następuje normalny rozkład.
Jednorodność wariancji	Jeśli w danych jest wiele grup związanych z twoją zmienną niezależną, mają one tę samą wariancję.

Dowiedz się wszystkiego, od prawdopodobieństwa po testy Wilcoxona

Co to jest prawdopodobieństwo?

Jak wybrać test statystyczny

Kiedy stosować testy asocjacji

Testy porównania między środkami

Testy predykcyjne z wykorzystaniem regresji liniowej

Testy na dane nieparametryczne

Jak przeprowadzać testy statystyczne

Anuluj pisanie odpowiedzi