Od zebrania idealnej wielkości próby po zapewnienie integralności interpretacji statystycznej – zrozumienie wszystkich elementów statystyki może być trudne.

W świecie, w którym wiedza i korzystanie ze statystyk staje się coraz bardziej istotne w polityce, ruchach społecznych i nie tylko, pomocne może być poznanie lub odświeżenie niektórych podstaw.

Oto wszystko, co musisz wiedzieć o statystyce!

Dostępni najlepsi nauczyciele statystyka
Samuel
5
5 (15 ocen(y))
Samuel
70 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Konrad
4,9
4,9 (14 ocen(y))
Konrad
80 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
August
5
5 (12 ocen(y))
August
120 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Iwona
5
5 (14 ocen(y))
Iwona
85 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Weronika sara
5
5 (10 ocen(y))
Weronika sara
60 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Bashirat
5
5 (6 ocen(y))
Bashirat
80 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Marcin
5
5 (11 ocen(y))
Marcin
100 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Wiesław
5
5 (4 ocen(y))
Wiesław
100 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Samuel
5
5 (15 ocen(y))
Samuel
70 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Konrad
4,9
4,9 (14 ocen(y))
Konrad
80 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
August
5
5 (12 ocen(y))
August
120 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Iwona
5
5 (14 ocen(y))
Iwona
85 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Weronika sara
5
5 (10 ocen(y))
Weronika sara
60 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Bashirat
5
5 (6 ocen(y))
Bashirat
80 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Marcin
5
5 (11 ocen(y))
Marcin
100 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Wiesław
5
5 (4 ocen(y))
Wiesław
100 zł
/zł/h
Gift icon
1-sza lekcja za darmo!
Zaczynajmy

Pochodzenie statystyki

Używanie analizy danych bitowych i metod statystycznych do zrozumienia otaczającego nas świata może wydawać się wynalazkiem XX wiek. Chociaż wnioskowanie statystyczne prowadzone obecnie przez statystyków jest znacznie skuteczniejsze w przypadku oprogramowania i programów statystycznych, praca statystyka to jeden z najstarszych zawodów na świecie.

Mimo, że zawiłości statystyki bayesowskiej lub zrozumienie danych kategorycznych zasługują na dłuższe wyjaśnienie w kontekście ewolucji danych i analiz statystycznych, podstawy można opanować, przyglądając się pochodzeniu statystyki.

Podczas gdy wnioskowanie statystyczne ociera się o mnóstwo innych współczesnych dyscyplin, takich jak biostatystyka czy analityka biznesowa, zaczęło się jako sposób porządkowania lub rejestrowania zjawisk zachodzących wieki temu.

Rejestrowanie i analizowanie ruchów rolniczych, astrologicznych i handlowych w celu poprawy warunków sanitarnych, żywnościowych i ekonomicznych to sposoby, w jakie nasi przodkowie wykorzystywali statystykę inferencyjną i opisową.

Rodzaje analizy statystycznej

Próba zdefiniowania dziedziny takiej jak statystyka matematyczna, której zastosowania są wszechobecne, może być jak szukanie igły w stosie siana – zwłaszcza jeśli okazuje się, że igła wywołuje ból głowy tak samo, jak teoria prawdopodobieństwa.

Aby złagodzić zamieszanie związane z prawdopodobieństwem i statystyką, pojawia się ktoś, kto początkowo nienawidził wszystkiego, co miało związek z analizą statystyczną. Trzeba przyznać, że żargon związany z teorią statystyczną bywa onieśmielający: dane porządkowe i kategoryczne, dane próbne, średnia populacji, percentyl, łańcuch Markowa.

Za złożoną terminologią kryją się jednak koncepcje, które w rzeczywistości są dość proste u podstaw. Jeśli studiujesz statystykę, prawdopodobnie nauczysz się statystyki bayesowskiej, która wykorzystuje rozkład prawdopodobieństwa w celu sprawdzenia hipotezy zerowej w porównaniu z hipotezą alternatywną.

Na chłopski rozum, statystyka bayesowska wysuwa założenia na podstawie surowych danych w celu skonstruowania hipotez, a następnie sprawdza, czy hipotezy te są prawdopodobne, czy nie dla danego zestawu danych.

Zanim zagłębisz się w analizę predykcyjną i popularne techniki statystyczne, pomocne może być rozpoczęcie od prostych sposobów wykorzystania wizualizacji danych do analizy danych jakościowych i ilościowych.

Statystyka, liczby, wartości.
Umiejętność dokładnej interpretacji danych jest podstawową kompetencją statystyczną. | źródło: Unsplash - Justin Morgan

Na czym polega statystyka opisowa

Każdy, kto musiał stworzyć histogram, wykres kołowy lub słupkowy na zajęcia, lub do pracy, brał udział w jednym z najpopularniejszych sposobów, w jaki badacze danych przeprowadzają analizy statystyczne.

Statystyki opisowe są miarami tendencji centralnej i wariancji, co przekłada się na pomiar danych według średniej i oddalenia wartości skrajnych. Miary tendencji centralnej mogą obejmować metryki takie jak:

  • Przykładowa średnia,
  • Mediana,
  • Dominanta.

Miary zmienności lub dyspersji, obejmują takie rzeczy jak:

  • Zmienna,
  • Kowariancja,
  • Odchylenie standardowe.

Chociaż może to brzmieć dość prosto, przeprowadzenie analizy eksploracyjnej ze statystykami opisowymi jest integralną częścią każdego projektu badania.

Zanim matematyk lub badacz danych zajmie się wielowymiarową regresją liniową, lub konstruowaniem przedziału ufności za pomocą estymatorów, musi wiedzieć, co zawierają dane. Analizę statystyczną danych można zakończyć za pomocą samych statystyk opisowych i ich wizualizacji.

Jeden z najpiękniejszych przykładów tego sięga lata 50. XIX wieku, kiedy Florence Nightingale stworzyła swój niesławny wykres kołowy zwany grzebieniem koguta (coxcomb)1, aby wydobyć istotne informacje na temat śmiertelności podczas wojny krymskiej. W czasach, gdy niewiele kobiet zajmowało się statystyką, Nightingale utorowała drogę innowacji i grupie niedostatecznie reprezentowanej w statystyce.

Innym ważnym aspektem generowania statystyk opisowych jest to, że wiele modeli statystycznych lub regresyjnych wymaga pewnych założeń, aby były one ważne. Chociaż założenia te różnią się w zależności od modelu, najczęstszym wymaganiem jest to, aby dane miały rozkład normalny.

Rozkład normalny to krzywa prawdopodobieństwa zgodna z centralnym twierdzeniem granicznym.

Większość danych zwykle nie ma rozkładu normalnego, dlatego wielu statystyków przekształca swoje zmienne zależne lub zmienną niezależną.

Korzystając z oprogramowania takiego jak SPSS, R lub Excel – każdy może łatwo wyodrębnić z danych metryki tendencji centralnej i rozproszenia. Jeśli dane mają rozkład normalny, metryki te stają się niezwykle potężne. Na przykład w finansach rozkład danych i percentyl, poniżej którego mieszczą się określone ceny lub akcje, wykorzystuje się w celu zrozumienia korzyści lub ryzyka potencjalnych transakcji handlowych.

Typowe problemy ze statystyką opisową

Kolorowa tabelka, nazwy państw, liczby.
Pozornie podobne statystyki mogą mieć zupełnie inny wpływ na politykę. | źródło: Unsplash - Christine Sandu

Jak już zapewne zauważyłeś, statystyki opisowe bardzo różnią się od drugiej głównej gałęzi statystyki: wnioskowania statystycznego.

Podczas gdy wnioskowanie statystyczne wykorzystują dane do przewidywania populacji za pomocą modeli statystycznych, statystyki opisowe jedynie opisują, co faktycznie znajduje się w danych.

Stosowanie statystyki opisowej do analizy danych kategorycznych i liczbowych, obserwacyjnych to typ metodologii statystycznej, z której ludzie korzystają, kiedy chcą, na przykład:

  • Określić jaki procent ich klientów stanowią młodzi dorośli,
  • Sprawdzić rozkład ocen na uniwersytecie,
  • Zrozumieć wielkość efektu pomiędzy dwiema grupami pacjentów w badaniu.

Ten typ analizy, w przeciwieństwie do analizy regresji lub ANOVA jest zwykle nazywana analizą jednoczynnikową, ponieważ zazwyczaj analizuje tylko jedną zmienną na raz.

Przykład statystyki opisowej

Chociaż aspekty statystyki, takie jak analiza chi-kwadrat, przedziały ufności lub współczynnik korelacji, mogą być bardzo trudne – czasami wystarczą statystyki opisowe.

Weź pod uwagę następujące liczby:

  • Średnia: 30
  • Odchylenie standardowe: 4

Załóżmy, że liczby te odnoszą się do zestawu danych dotyczących wyników testów Twojej klasy. Chcesz zrozumieć, jak wypadły zajęcia, ale nie wiesz, jak skonfigurować projekt eksperymentalny.

assessment
Zakładając, że dane znajdują się w rozkładzie normalnym, wiemy, że:

68% wyników znajduje się w zakresie jednego odchylenia standardowego średniej,
95% wyników znajduje się w zakresie dwóch odchyleń standardowych,
99% znajduje się w zakresie trzech.

Bez stosowania istotności statystycznej, randomizacji lub metody najmniejszych kwadratów możesz obliczyć, że 95% klasy uzyskało wynik pomiędzy 22 i 38 punktów, przy czym:

  • Dolna granica: 30 – (2 * 4)
  • Górna granica: 30 + (2 * 4)

Kolejnym gigantem statystycznym w dziedzinie analizy opisowej jest korelacja, czyli liczba opisująca związek między dwiema zmiennymi. Chociaż prawdopodobnie już to wiesz, upewnij się, że w pełni rozumiesz różnicę między korelacją i przyczynowością.

Korelacja to narzędzie matematyczne umożliwiające zrozumienie, w jaki sposób zmiany jednej zmiennej odnoszą się do zmian w innej, natomiast przyczynowość to pogląd, że zmiany jednej zmiennej powodują zmiany w innej.

Jeśli jesteś fanem żartów matematycznych, na pewno docenisz jeden z dowcipnych przykładów dla stwierdzenia „korelacja nie powoduje przyczynowości”.

Weźmy na przykład sprzedaż lodów i ataki rekinów2:

  • W czasie letnich miesięcy każdego roku ogromnie wzrasta sprzedaż lodów.
  • W tym samym przedziale odnotowuje się również więcej ataków rekinów.
  • Chociaż istnieje wyraźna korelacja lub związek między popularnością lodów i niefortunnymi pojedynkami z rekinem, istnieje małe prawdopodobieństwo, że obie metryki wiąże jakakolwiek przyczynowość.
  • Spożywanie lodów nie czyni z człowieka bardziej apetycznego kąska, korelacja między tymi dwoma zjawiskami ma więcej wspólnego ze wzrostem temperatury i rozpoczęciem okresu wakacyjnego.
    • Ludzie spędzają więcej czasu nad wodą, zażywając kąpieli, co wpływa na częstszy kontakt z mieszkańcami oceanów, te same wysokie temperatury skłaniają do chłodzenia się pysznym deserem lodowym na obszarach nawet odległych od wody.
Rodzice z dzieckiem przy stole, laptop, korepetycje, nauka w domu.
Rozkładów i prawdopodobieństwa można uczyć się już w młodym wieku. | źródło: Unsplash - sofatutor

Jak wygląda wnioskowanie statystyczne?

Przechodząc do innej głównej gałęzi statystyki, statystyka inferencyjna (wnioskowanie statystyczne) jest tym, o czym ludzie zwykle myślą, poruszając temat statystyki.

Opierające się na teorii prawdopodobieństwa przy tworzeniu modeli statystycznych dla wyciągnięcia wniosków, lub obliczenia estymatora jednej lub więcej zmiennych zależnych, wnioskowanie statystyczne może być trudne do zdefiniowania.

Jednak najważniejsze cechy wnioskowania statystycznego można sprowadzić do jednego zdania: branża wykorzystuje przykładowe dane dotyczące populacji do sporządzania prognoz poza tym zbiorem danych.

Wskazówki i porady dotyczące nauki statystyki stosowanej

Od rozkładów dwumianowych i wartości odstających po znalezienie idealnego testu parametrycznego — zrozumienie lub zapamiętanie wszystkich składników statystyki jest niemożliwym wyczynem.

Istnieje jednak wiele sposobów na naukę lub doskonalenie umiejętności statystycznych. Jeśli jesteś z Krakowa, warto sprawdzić także korepetycje statystyka Kraków.

Uzyskiwanie pomocy dotyczącej statystyk online

Skorzystaj z wielu stron internetowych poświęconych wyjaśnianiu pojęć statystycznych, jak zmienna losowa lub analiza wariancji.

Oto jedne z najlepszych witryn do nauki statystyki w Internecie:

  • StatSoft Polska - Internetowy Podręcznik Statystyki
  • Zintegrowana Platforma Edukacyjna Ministerstwa Edukacji i Nauki

Jak znaleźć korepetytora ze statystyki

Jeśli wolisz pomoc indywidualną, szczególnie jeśli jesteś z Warszawy, koniecznie sprawdź korepetycje statystyka Warszawa dostępne w społeczności nauczycieli na Superprof. Od prawdopodobieństwa do regresji często możesz wypróbować pierwszą lekcję za darmo!

Źródła

  1. B. Czapiewski, Róża Nightingale – Jeden wykres, który uratował tysiące ludzi i zmienił historię, https://skuteczneraporty.pl/blog/roza-nightingale-jeden-wykres-ktory-uratowal-tysiace-ludzi-i-zmienil-historie/, [Dostęp: 08.03.2024]
  2. D. Parol, Czy rekiny jedzą lody? – czyli korelacja a przyczynowość, https://www.damianparol.com/czy-rekiny-jedza-lody-czyli-korelacja-a-przyczynowosc/, [Dostęp: 08.03.2024]

Lubisz ten artykuł? Oceń nas!

4,00 (3 ocen(y))
Loading...

Marta Pniewska

Pozytywnie zakręcona idealistka. Straszna psiara i wielbicielka gier planszowych. Fascynatka lingwistyki, kreatywnego myślenia i samorozwoju.