Niezależnie od tego, czy chodzi o interpretację przesunięć percentylowych, rozkładów dwumianowych, estymatorów czy statystycznego znaczenia wartości odstających za pomocą analizy wariancji, statystyka to rozbudowana dziedzina, która staje się dziś coraz bardziej popularna.
Poznaj zarys statystyki: dowiesz się, jak zaczęto tworzyć statystyki i gdzie znaleźć najlepsze zasoby, aby rozwiązać problemy ze statystykami!
Co to jest statystyka stosowana?
Analiza danych to temat, który często obija się o uszy. Od poważnych naruszeń bezpieczeństwa danych, które regularnie mają miejsce na całym świecie, po małe pole wyboru wynikające z RODO, które należy zaznaczyć za każdym razem, gdy odwiedzasz witrynę internetową – analiza statystyczna jest niczym Wielki Brat naszych czasów.
Jeśli to wszystko brzmi jedynie jak żargon statystyków, a Wielki Brat przywołuje jedynie obrazy z niesławnego reality show Big Brother, odkryjmy znaczenie zrozumienia metod statystycznych, przyglądając się bliżej dziełu George'a Orwella: Rok 1984.
Nie zdradzając fabuły ani nie tworząc zbyt zawiłej definicji statystyk wnioskowanych i opisowych, narracja Roku 1984 przedstawia historię dwóch bohaterów walczących z ideałami dystopijnego, autorytarnego rządu.
Jeden z tych bohaterów pracuje dla „Ministerstwa Prawdy”, gdzie – jak na ironię – redaguje zapisy historyczne, dopasowując je do programu partii politycznej. Innymi słowy: redaguje i poprawia dane historyczne.

Dane statystyczne i ich historia nie poprawiły jedynie jakości naszego życia.
Statystyki bayesowskie i uczenie maszynowe dały początek oprogramowaniu statystycznemu, które może śledzić zagrożone gatunki.
Dziedzina biostatystyki umożliwiła statystykom przeprowadzanie testów, dzięki którym powstają leki farmaceutyczne, które ratują nam życie.
Nie ma wątpliwości, że techniki statystyczne są niezbędne w naszym codziennym życiu, jednakże korporacje i organy rządowe mogą wykorzystywać manipulację statystyką matematyczną do forsowania programów politycznych lub ucisku określonych grup społecznych – czego przykładem jest przełomowa powieść Orwella.
Dzięki takim pojęciom, jak dane kategoryczne, wielkość próby, odchylenie standardowe i rozkład prawdopodobieństwa, dziedzinę statystyki można zbyt często postrzegać i nauczać w sposób nie tylko niedostępny, ale być może uniemożliwiający części populacji dostęp do dyscypliny, która mogłaby ją wzmocnić najbardziej.
Choć teoria statystyczna i statystyka stosowana mogą wydawać się hipernowoczesnymi dziedzinami wypełnionymi bardzo złożonymi konstruktami, spojrzenie na historię statystyk przeczy temu przekonaniu.
Ludzie wykorzystują statystyki do rozwiązywania palących problemów społeczeństwa od zarania dziejów. Od gromadzenia surowych danych na temat zjawisk rolniczych, przez poprawę technik rolniczych, po rejestrację ruchów układów planetarnych w celu odkrycia tajemnic wszechświata – naukowcy od wieków korzystają z analizy danych statystycznych.
Na usta ciśnie się stwierdzenie, że w przeszłości mężczyźni dominowali w tej dziedzinie. Jednak kobiety takie jak Florence Nightingale1 nie tylko zrewolucjonizowały sposób, w jaki używamy i wizualizujemy prawdopodobieństwo i statystyki, ale również korzystają z analiz statystycznych, by ujawnić dyskryminację, z jaką spotykają się kobiety, nawet w branżach, które zawsze uważano za bastiony egalitaryzmu.
Nazwa dyscypliny jest oczywista, ale jest warta wyjaśniania: statystyka stosowana obejmuje gromadzenie danych, teorię prawdopodobieństwa i wizualizację danych w celu rozwiązania problemu lub przetestowania hipotez w takich obszarach, jak biznes, ubezpieczenia, rząd, edukacja i nie tylko.
Matematycznie statystyka odnosi się do stosowania teorii prawdopodobieństwa i tendencji centralnej do testowania hipotezy zerowej i alternatywnej za pomocą szeregu różnych modeli: regresji liniowej, regresji wielowymiarowej, ANOVA itp.
W przeszłości statystyka była dyscypliną związaną ze złożoną matematyką, obejmującą aspekty od hipotezy zerowej o normalności rozkładu do funkcji gęstości prawdopodobieństwa. Jednak w dzisiejszych czasach statystyki są powszechnie dostępne dla każdego, kto ma dostęp do Internetu.
Programy open source, takie jak R i samouczki online, w połączeniu z narzędziami, które nie wymagają żadnego wcześniejszego doświadczenia ze statystyką - takie jak Datawrapper -doprowadziły do nowej, bardziej zdemokratyzowanej ery statystyki i analizy danych.
Statystyka opisowa
Teraz gdy masz już pojęcie o ewolucji statystyki i analizy danych, pomocne może być poznanie składu samej dyscypliny.
Ogólnie rzecz biorąc, statystyk lub matematyk podzieli temat na dwie główne gałęzie:
- statystyka opisowa2,
- wnioskowanie statystyczne (statystka inferencyjna)3.
Zaczynając od pierwszej gałęzi, statystyka opisowa w mniejszym stopniu skupia się na zawiłościach określenia estymatora lub predyktora na podstawie przykładowych danych i tworzenia przedziału ufności na podstawie różnych modeli regresji.

Zamiast tego statystyka opisowa skupia się na zrozumieniu, jak wyglądają dane. Choć brzmi to dość prymitywnie, w rzeczywistości jest to coś, co większość populacji nie tylko najlepiej rozumie, ale także najczęściej konsumuje.
Na przykład w Polsce ludzie i rząd mogą być mniej zainteresowani przewidywaniem średniego dochodu rodziny, a bardziej zainteresowani, powiedzmy, średnim dochodem konkretnego miasta. Statystyki opisowe opisują dane jakościowe lub ilościowe, biorąc również pod uwagę zmienne statystyki lokalizacji.
Innymi słowy, używając histogramu lub rozkładu normalnego, statystyki opisowe mogą określić, jak wyglądają uśrednione dane i podać kontekst wartości skrajnych. Miary lokalizacji lub tendencji centralnej obejmują średnią z próbki, medianę i dominantę (modę).
Z drugiej strony miarami zmienności są takie rzeczy, jak wariancje, kowariancja lub odchylenie standardowe zmiennych zależnych i niezależnych. Inne narzędzia pomiary, które można wykorzystać w statystykach opisowych, obejmują:
- Wielkość efektu,
- Współczynnik korelacji,
- Testy chi-kwadrat.
Wnioskowanie statystyczne
Druga gałąź statystyki dotyczy danych, które rzadziej zobaczysz w gazecie.
Na przykład, chociaż prawdopodobnie jesteś przyzwyczajony do oglądania i rozumienia danych liczbowych, takich jak rankingi najszczęśliwszych krajów, prawdopodobnie nie przeglądasz czasopism w poszukiwaniu najnowszych kwartalnych szacunków PKB.
Chociaż statystyki inferencyjne mogą być niezwykle potężnym narzędziem statystycznym, które kształtuje codzienność, wykonanie, interpretacja i zrozumienie ich bywa bardziej złożone. Statystyki bayesowskie są najpopularniejszą formą wnioskowania statystycznego.
Korzystając z teorii prawdopodobieństwa, analitycy danych i statystycy są w stanie wyjść ponad analizę eksploracyjną w celu stworzenia projektu badania, który próbuje dokonać prognoz poza danym zbiorem danych.
Chociaż wnioskowanie statystyczne zostało zaimplementowane dopiero w XIX wieku, jego metody i zastosowania gwałtownie wzrosły wraz z wynalezieniem komputerów i oprogramowania komputerowego nastawionego na statystyki, takiego jak SPSS, R, Stata i inne.
Najpopularniejsze metody i modele stosowane podczas wnioskowania statystycznego, to:
- Regresja liniowa,
- Ogólne modele liniowe,
- Testy nieparametryczne.
Testy nieparametryczne mogą być bardzo przydatne w niektórych sytuacjach, ponieważ nie wymagają, aby dane miały określony rozkład.
Jeśli chcesz dowiedzieć się więcej o statystykach inferencyjnych, zacznij od zapoznania się ze zbiorami założeń - takie jak te wynikające z twierdzenia Gaussa-Markowa4, które statystycy będą umieszczać w swoich zbiorach danych!
Najlepsze miejsca do nauki statystyki
Od zwykłych metod najmniejszych kwadratów po profesjonalną metodologię statystyczną – statystyka jako dziedzina jest tak ogromna, jak ekonomia czy literatura. Może to sprawić, że praca studentów i zawodowych statystyków jest jeszcze trudniejsza, jeśli chodzi o naukę nowych umiejętności lub doskonalenie starych. Dla mieszkańców stolicy dostępne są także statystyka korepetycje Warszawa.
Jeśli szukasz porady lub pomocy w projektach obejmujących modele statystyczne, lub po prostu utknąłeś, pisząc kod, najlepszym miejscem do odwiedzenia jest Internet. Nie jest to kompletny przewodnik po zasobach statystycznych, ale poniżej znajdziesz kilka witryn, które zdecydowanie warto odwiedzić.

Analiza wskaźników
Niezależnie od tego, czy jesteś zainteresowany stworzeniem systemu klasyfikacji zebranych danych liczbowych, czy też chcesz lepiej zrozumieć, w jaki sposób mierzone są określone wskaźniki, jedną z najlepszych stron, do których możesz zwrócić się o pomoc, jest strona zakładka Statistics Explained na stronie Eurostatu. Strona napisana jest w języku angielskim, ale udostępnia możliwość tłumaczenia maszynowego w wielu innych językach, w tym w języku polskim.
Wizualizacja danych
Wizualizacja, niezależnie od tego, czy robisz to dla danych kategorycznych, czy dla analizy ANOVA lub regresji, może być trudna. Czasami możesz po prostu nie wiedzieć takich rzeczy, jak szczegóły techniczne dotyczące wykresów przedziałów ufności lub jak najlepiej zaprezentować zmienną zależną. Jeśli interesują Cię szybkie i łatwe w utrzymaniu wizualizacje, koniecznie sprawdź witrynę Datawrapper.
Programowanie
Jeśli szukasz pomocy we wszystkim, co jest związane z kodem, zacznij od sprawdzenia Stack Overflow. Jedno z wielu forów internetowych poświęconych odpowiadaniu, zadawaniu lub przeglądaniu pytań i odpowiedzi zadawanych przez prawdziwych ludzi na temat rzeczywistych problemów związanych z kodem.
Znalezienie idealnego nauczyciela statystyki
Jeśli jesteś zainteresowany znalezieniem korepetytora od statystyki, możesz zacząć od odwiedzenia Superprof. Znajdziesz nauczycieli wielu przedmiotów na różnych poziomach, oferujących różnorodne formy korepetycji w atrakcyjnych stawkach. Mieszkańcy Krakowa mogą rozważyć stacjonarne korepetycje statystyka Kraków.
Źródła
- T. Pospieszny, Florence Nightingale, http://piekniejszastronanauki.pl/florence-nightingale/, [Dostęp: 07.03.2024]
- N. Szczepaniak, K. Rocławska, Statystyka opisowa, https://mfiles.pl/pl/index.php/Statystyka_opisowa, [Dostęp: 07.03.2024]
- A. Waleczek, Wnioskowanie statystyczne, https://mfiles.pl/pl/index.php/Wnioskowanie_statystyczne, [Dostęp: 07.03.2024]
- Twierdzenie Gaussa-Markowa - Co to jest, definicja i pojęcie, https://pl.economy-pedia.com/11032926-gauss-markov-theorem, [Dostęp: 07.03.2024]