Jak obliczyć probit?

Analiza probitowa: Praktyczny przewodnik

23/11/2024

Rating: 4.27 (3894 votes)

Analiza probitowa jest potężnym narzędziem statystycznym, szeroko stosowanym w różnych dziedzinach nauki, od toksykologii po farmakologię i analizy laboratoryjne. Pozwala na modelowanie relacji między dawką bodźca a binarną odpowiedzią, taką jak obecność lub brak efektu, pozytywny lub negatywny wynik testu. W kontekście laboratoryjnym, analiza probitowa jest szczególnie cenna przy określaniu granicy wykrywalności (LoD) testów jakościowych, gdzie wynik jest binarny.

Spis treści

Czym jest analiza probitowa?

Nazwa "probit" pochodzi od "probability unit" (jednostka prawdopodobieństwa). Analiza probitowa to rodzaj modelu regresji, który jest specjalnie zaprojektowany do analizy danych, w których zmienna zależna jest binarna (dychotomiczna). Zamiast modelować bezpośrednio prawdopodobieństwo zdarzenia, analiza probitowa modeluje probit prawdopodobieństwa. Probit jest funkcją odwrotną do skumulowanej dystrybuanty standardowego rozkładu normalnego. Mówiąc prościej, przekształca prawdopodobieństwo na skalę, która jest liniowo związana z predyktorami.

Kiedy powinienem stosować Probit?
Modele regresji probitowej, których nazwa nawiązuje do kontrakcji jednostki prawdopodobieństwa, można stosować jako alternatywę dla binarnych modeli regresji logistycznej w przypadkach, gdy krzywa prawdopodobieństwa dla określonych prawdopodobieństw zdarzeń dostosowuje się bardziej adekwatnie do skumulowanej funkcji gęstości standardowej ...

Metoda ta została po raz pierwszy opracowana w latach 30. XX wieku przez Blissa w kontekście entomologii, do badania skuteczności insektycydów. Finney rozwinął te koncepcje w swojej książce "Probit Analysis", stając się kluczową postacią w rozwoju i popularyzacji tej techniki.

Kiedy stosować analizę probitową?

Analiza probitowa jest szczególnie przydatna w sytuacjach, gdy:

  • Zmienna zależna jest binarna: Wynik jest dychotomiczny, np. "sukces/porażka", "pozytywny/negatywny", "obecny/nieobecny".
  • Relacja dawka-reakcja ma kształt sigmoidalny: Krzywa odpowiedzi na bodziec ma kształt litery S, co jest typowe dla wielu zjawisk biologicznych i chemicznych. Oznacza to, że przy niskich dawkach zmiana odpowiedzi jest niewielka, następnie staje się gwałtowna w pewnym zakresie dawek, a przy wysokich dawkach ponownie staje się niewielka.
  • Chcemy określić próg lub granicę: Na przykład, dawkę substancji, która powoduje efekt u 50% populacji (ED50), stężenie analitu, które jest wykrywalne z pewnym prawdopodobieństwem (LoD).
  • Dane pochodzą z eksperymentów biologicznych lub toksykologicznych: Analiza probitowa jest standardową metodą w toksykologii do oceny toksyczności substancji, a także w farmakologii do badania odpowiedzi na leki.
  • Walidacja metod ilościowych: Szczególnie w kontekście medycznym i diagnostycznym, analiza probitowa jest używana do określania LoD testów jakościowych, co jest kluczowe dla zapewnienia wiarygodności wyników badań.

Jak obliczyć probit?

Obliczenie analizy probitowej zazwyczaj wymaga oprogramowania statystycznego, ale zrozumienie podstawowych kroków jest kluczowe. Proces można ogólnie podzielić na następujące etapy:

  1. Zebranie danych: Przeprowadzenie eksperymentu, w którym różne dawki lub stężenia bodźca są stosowane, a dla każdej dawki rejestrowana jest liczba pozytywnych odpowiedzi na określoną liczbę prób. Na przykład, w teście LoD, można testować różne stężenia analitu w wielu replikacjach i rejestrować, ile razy wynik testu jest pozytywny.
  2. Obliczenie proporcji odpowiedzi: Dla każdej dawki oblicz proporcję pozytywnych odpowiedzi (liczba pozytywnych odpowiedzi podzielona przez całkowitą liczbę prób dla tej dawki). Jest to współczynnik trafień lub wskaźnik pozytywności.
  3. Transformacja proporcji na probity: Proporcje odpowiedzi są przekształcane na probity. Można to zrobić za pomocą tabel probitowych (dostępnych w literaturze statystycznej) lub funkcji w arkuszu kalkulacyjnym, np. w Excelu funkcja 5+NORMSINV(P), gdzie P to proporcja. Dodanie 5 jest konwencją, aby uniknąć wartości ujemnych probitów. Wartość probitu 5 odpowiada proporcji 0.5 (50%), 6.64 odpowiada 0.95 (95%), a 3.36 odpowiada 0.05 (5%).
  4. Regresja probitowa: Wykonuje się regresję liniową, gdzie zmienną zależną są probity, a zmienną niezależną jest dawka (często logarytm dawki, szczególnie w analizach LoD dla testów NAAT). Model regresji ma postać: Probit = α + β * X, gdzie X to dawka (lub logarytm dawki), α to punkt przecięcia z osią Y, a β to współczynnik kierunkowy.
  5. Określenie interesującego punktu: Na podstawie linii regresji probitowej, można przewidzieć dawkę odpowiadającą określonemu probitowi, a tym samym określonemu prawdopodobieństwu. Na przykład, aby określić C95 (stężenie, przy którym prawdopodobieństwo wykrycia wynosi 95%), używa się probitu 6.64. Wstawiając probit 6.64 do równania regresji i rozwiązując względem X, otrzymuje się szacowaną wartość C95, która w kontekście LoD jest szacowaną granicą wykrywalności.

Przykład obliczenia LoD za pomocą analizy probitowej (rekonstrukcja przykładu EP17-A2):

Załóżmy, że przeprowadzono eksperyment z testem NAAT, używając serii stężeń analitu i wykonując 100 replikacji dla każdego stężenia. Wyniki przedstawia tabela:

StężenieLiczba pozytywnych (Npos)Proporcja pozytywnych (P)Probit
1010.012.33
1550.053.36
20200.204.16
25450.454.89
30700.705.52
35850.856.04
40950.956.64
45990.997.33
501001.00∞ (pomijamy, praktycznie 7-8)
551001.00∞ (pomijamy, praktycznie 7-8)

Wykonując regresję probitową (np. w Excelu lub oprogramowaniu statystycznym), można uzyskać równanie linii regresji. Załóżmy, że regresja dała równanie: Probit = 3.353 + 2.062 * log10(Stężenie).

Aby obliczyć C95 (LoD), ustawiamy Probit = 6.64 i rozwiązujemy równanie:

6.64 = 3.353 + 2.062 * log10(C95)

log10(C95) = (6.64 - 3.353) / 2.062 = 1.594

C95 = 10^1.594 ≈ 39.2

Zatem, szacowana granica wykrywalności (LoD) wynosi około 39.2 jednostek stężenia.

Jak obliczyć probit?
Probit obliczono za pomocą funkcji programu Excel [5+NORMSINV(P)], gdzie P to numer komórki w kolumnie proporcji . Regresja dała nachylenie 2,062 i odcinek y 3,353. Aby obliczyć C95, użyto wartości probit 6,64 (1,64 dla limitu 95%, +5 dla skali probit), co dało szacunek 39,2 dla LoD.

Probit a regresja logitowa

Regresja probitowa i regresja logitowa są dwiema najczęściej stosowanymi metodami modelowania binarnych zmiennych zależnych. Obie są modelami liniowymi uogólnionymi, ale różnią się funkcją łączenia, która łączy liniowy predyktor z oczekiwaną wartością zmiennej zależnej.

  • Regresja probitowa: Używa funkcji probitowej (odwrotnej skumulowanej dystrybuanty standardowego rozkładu normalnego) jako funkcji łączenia. Zakłada się, że prawdopodobieństwo zdarzenia jest związane z predyktorami poprzez skumulowany rozkład normalny.
  • Regresja logitowa: Używa funkcji logitowej (logarytmu szans) jako funkcji łączenia. Zakłada się, że logarytm szans zdarzenia jest liniowo związany z predyktorami. Funkcja logitowa opiera się na rozkładzie logistycznym.

Podobieństwa:

  • Obie metody są odpowiednie dla binarnych zmiennych zależnych.
  • Obie modelują prawdopodobieństwo zdarzenia jako funkcję predyktorów.
  • Krzywe przewidywanych prawdopodobieństw uzyskane za pomocą obu metod są zazwyczaj bardzo podobne, szczególnie w środkowym zakresie prawdopodobieństw (od 0.2 do 0.8).

Różnice:

  • Funkcja łączenia: Probit używa funkcji probitowej, logit używa funkcji logitowej.
  • Interpretacja współczynników: Współczynniki w regresji logitowej są interpretowane jako zmiany w logarytmie szans, podczas gdy w regresji probitowej interpretacja jest mniej intuicyjna i związana z Z-score rozkładu normalnego.
  • Rozkład błędu: Regresja probitowa zakłada, że błędy mają rozkład normalny, podczas gdy regresja logitowa zakłada rozkład logistyczny.
  • Ogonki rozkładu: Rozkład normalny (probit) ma cieńsze ogonki niż rozkład logistyczny (logit). Oznacza to, że regresja probitowa może przewidywać nieco bardziej ekstremalne prawdopodobieństwa (bliżej 0 i 1) niż regresja logitowa, szczególnie przy ekstremalnych wartościach predyktorów.

Kiedy wybrać probit czy logit?

W praktyce, wybór między analizą probitową a logitową często nie ma dużego znaczenia, ponieważ wyniki są zazwyczaj bardzo podobne. Często wybór jest kwestią preferencji lub tradycji w danej dziedzinie. Jednak istnieją pewne sytuacje, w których jeden model może być bardziej odpowiedni:

  • Teoretyczne podstawy: Jeśli istnieje teoretyczne uzasadnienie, aby przypuszczać, że rozkład błędów jest normalny, wówczas regresja probitowa może być bardziej uzasadniona. Na przykład, w niektórych modelach progowych, gdzie odpowiedź binarna jest postrzegana jako wynik przekroczenia progu przez zmienną ukrytą o rozkładzie normalnym, probit jest naturalnym wyborem.
  • Ekstremalne prawdopodobieństwa: Jeśli ważne jest dokładne modelowanie prawdopodobieństw bliskich 0 i 1, regresja probitowa, z cieńszymi ogonkami rozkładu normalnego, może być nieco lepsza.
  • Porównanie z wcześniejszymi badaniami: Jeśli wcześniejsze badania w danej dziedzinie stosowały analizę probitową, dla porównywalności wyników, warto również zastosować probit.
  • Wygoda obliczeń: Historycznie, tablice rozkładu normalnego były szerzej dostępne niż funkcje logitowe, co czyniło probit bardziej praktycznym w czasach obliczeń ręcznych. W dzisiejszych czasach, z dostępnością oprogramowania statystycznego, ta różnica praktycznie zanika.

Praktyczne zastosowania analizy probitowej

Analiza probitowa znajduje szerokie zastosowanie w różnych dziedzinach, szczególnie tam, gdzie mamy do czynienia z binarnymi wynikami i relacjami dawka-reakcja:

  • Toksykologia: Określanie toksyczności substancji chemicznych, np. LD50 (dawka śmiertelna dla 50% populacji).
  • Farmakologia: Badanie odpowiedzi na leki, określanie ED50 (dawka efektywna dla 50% populacji).
  • Entomologia: Badanie skuteczności insektycydów.
  • Badania sensoryczne: Modelowanie prawdopodobieństwa percepcji bodźca sensorycznego przy różnym natężeniu.
  • Analiza przeżycia: W pewnych przypadkach, analiza probitowa może być stosowana w analizie przeżycia, szczególnie gdy punkt końcowy jest binarny (np. przeżycie lub śmierć w określonym czasie).
  • Walidacja metod diagnostycznych: Określanie granicy wykrywalności (LoD) testów jakościowych, takich jak testy molekularne (NAAT), testy immunologiczne (ELISA), testy punktowe (lateral flow tests). W tym kontekście, analiza probitowa pomaga ocenić, jak wiarygodny jest test w wykrywaniu niskich stężeń analitu.

Zalety i ograniczenia analizy probitowej

Zalety:

  • Odpowiednia dla danych binarnych: Jest specjalnie zaprojektowana do analizy danych dychotomicznych.
  • Modelowanie relacji sigmoidalnych: Dobrze opisuje relacje dawka-reakcja o kształcie S.
  • Ugruntowana metoda: Jest to dobrze ugruntowana i szeroko stosowana metoda statystyczna, z bogatą literaturą i oprogramowaniem.
  • Określanie progów i granic: Umożliwia określenie progów odpowiedzi, takich jak LoD, ED50, LD50.

Ograniczenia:

  • Założenie o rozkładzie normalnym: Zakłada, że błędy mają rozkład normalny, co może nie zawsze być spełnione w praktyce. Jednak w wielu przypadkach, model jest dość odporny na naruszenie tego założenia.
  • Interpretacja współczynników: Interpretacja współczynników nie jest tak intuicyjna jak w regresji logitowej.
  • Wymaga oprogramowania statystycznego: Obliczenia analizy probitowej zazwyczaj wymagają użycia oprogramowania statystycznego.

Najczęściej zadawane pytania (FAQ)

Czy analiza probitowa jest lepsza od regresji logitowej?
Nie ma jednoznacznej odpowiedzi. W wielu przypadkach wyniki obu metod są bardzo podobne. Wybór zależy od specyfiki problemu, teoretycznych założeń i preferencji badacza. Czasami, jeśli istnieją teoretyczne przesłanki za rozkładem normalnym błędów, probit może być bardziej uzasadniony. W praktyce, regresja logitowa jest często bardziej popularna ze względu na łatwiejszą interpretację współczynników.
Jak interpretować współczynniki w analizie probitowej?
Współczynniki w analizie probitowej reprezentują zmianę w probicie zmiennej zależnej na jednostkową zmianę zmiennej niezależnej. Interpretacja jest mniej intuicyjna niż w regresji logitowej. Można powiedzieć, że współczynnik pokazuje, o ile jednostek odchylenia standardowego przesuwa się rozkład normalny prawdopodobieństwa przy jednostkowej zmianie predyktora.
Jak określić granicę wykrywalności (LoD) za pomocą analizy probitowej?
LoD jest zazwyczaj definiowane jako stężenie, przy którym prawdopodobieństwo pozytywnego wyniku wynosi 95%. W analizie probitowej, po uzyskaniu równania regresji probitowej, ustawia się probit na 6.64 (co odpowiada 95% prawdopodobieństwu) i rozwiązuje równanie względem stężenia. Otrzymana wartość stężenia jest szacowaną granicą wykrywalności.
Jakie oprogramowanie można użyć do analizy probitowej?
Wiele pakietów statystycznych oferuje funkcje do analizy probitowej, np. R (funkcja glm() z family = binomial(link = "probit")), Python (pakiet statsmodels), SAS (PROC PROBIT), SPSS, Stata (komenda probit). Można również użyć arkuszy kalkulacyjnych, takich jak Excel, do wykonania podstawowych obliczeń, ale dla pełnej analizy statystycznej zaleca się specjalistyczne oprogramowanie.

Podsumowanie

Analiza probitowa jest cennym narzędziem statystycznym do analizy danych binarnych i modelowania relacji dawka-reakcja. Jest szczególnie przydatna w laboratoriach, w kontekście walidacji metod diagnostycznych i określania granic wykrywalności testów jakościowych. Choć podobna do regresji logitowej, analiza probitowa ma swoje specyficzne cechy i zastosowania, a jej zrozumienie jest kluczowe dla prawidłowego stosowania i interpretacji wyników w wielu dziedzinach nauki.

Jeśli chcesz poznać inne artykuły podobne do Analiza probitowa: Praktyczny przewodnik, możesz odwiedzić kategorię Rachunkowość.

Go up