Wyprowadzenie zmiany zmiennych funkcji gęstości prawdopodobieństwa?
On 9 lutego, 2021 by adminW książce rozpoznawanie wzorców i uczenie maszynowe (wzór 1.27) podaje
$$ p_y (y) = p_x (x) \ left | \ frac {d x} {d y} \ right | = p_x (g (y)) | g „(y) | $$ gdzie $ x = g (y) $, $ p_x (x) $ to plik pdf odpowiadający $ p_y (y) $ w odniesieniu do zmiany zmiennej.
Książki mówią, że to dlatego, że obserwacje mieszczące się w przedziale $ (x, x + \ delta x) $, dla małych wartości $ \ delta x $, zostaną przekształcone w przedział $ (y, y + \ delta y) $.
Jak to jest formalnie wyprowadzane?
Aktualizacja z Dilip Sarwate
Wynik jest zachowany tylko wtedy, gdy $ g $ jest ściśle monotoniczną funkcją rosnącą lub malejącą.
Niewielka zmiana w LV Odpowiedź Rao $$ \ begin {equation} P (Y \ le y) = P (g (X) \ le y) = \ begin {cases} P (X \ le g ^ {- 1} (y)) , & \ text {if} \ g \ text {rośnie monotonicznie} \\ P (X \ ge g ^ {- 1} (y)), & \ text {if} \ g \ text {maleje monotonicznie} \ end {cases} \ end {equation} $$ Dlatego jeśli $ g $ rośnie monotonicznie $$ F_ {Y} (y) = F_ {X} (g ^ {- 1} (y)) $$ $$ f_ {Y} (y) = f_ {X} (g ^ {- 1} (y)) \ cdot \ frac {d} {dy} g ^ {- 1} (y) $$ jeśli monotonicznie maleje $$ F_ {Y} (y) = 1-F_ {X} (g ^ {- 1} (y)) $$ $$ f_ { Y} (y) = – f_ {X} (g ^ {- 1} (y)) \ cdot \ frac {d} {dy} g ^ {- 1} (y) $$ $$ \ dlatego f_ {Y } (y) = f_ {X} (g ^ {- 1} (y)) \ cdot \ left | \ frac {d} {dy} g ^ {- 1} (y) \ right | $$
Komentarze
- Wynik jest zachowany tylko wtedy, gdy $ g $ jest ściśle monotoniczną funkcją rosnącą lub malejącą. Narysuj wykres $ g $ i rozwiąż go za pomocą podstawowa idea definicji pochodnej (nie formalnej definicji z epsilon i delta). Na tej stronie znajduje się również odpowiedź od @whuber, która wyjaśnia szczegóły ; to znaczy, że powinno być zamknięte jako duplikat.
- Wyjaśnienie dotyczące książki ' przypomina to, które przedstawiłem na stats.stackexchange.com/a/14490/919 . Opublikowałem też ogólną metodę algebraiczną na stats.stackexchange.com/a/101298/919 i wyjaśnienie geometryczne na stats.stackexchange.com/a/4223/919 .
- @DilipSarwate dzięki za wyjaśnienie, myślę, że rozumiem intuicję, ale ' bardziej interesuje mnie, w jaki sposób można to wyprowadzić przy użyciu istniejących reguł i twierdzeń 🙂
Odpowiedź
Załóżmy, że $ X $ jest ciągłą zmienną losową z pdf
f (x). Jeśli zdefiniujemy $ Y = g (X) $, gdzie g () jest funkcją monotoniczną, to pdf
z $ Y $ otrzymujemy w następujący sposób: \ begin {eqnarray *} P (Y \ le y) & = & P (g (X) \ le y) \\ & = & P (X \ le g ^ {- 1} (y)) \\ lub \; \; F_ {Y} (y) & = & F_ {X} (g ^ {- 1} (y)), \ quad \ mbox {zgodnie z definicją CDF} \\ \ end {eqnarray *} Poprzez zróżnicowanie CDF po obu stronach wrt $ y $, otrzymujemy plik pdf o wartości $ Y $. Funkcja g () może być monotonicznie rosnąca lub monotonicznie malejąca. Jeśli funkcja g () rośnie monotonicznie, to plik pdf $ Y $ jest określony przez \ begin {equation *} f_ {Y} (y) = f_ {X} (g ^ {- 1} (y)) \ cdot \ frac {d} {dy} g ^ {- 1} (y) \ end {equation *} i z drugiej strony, jeśli maleje monotonicznie, to plik pdf $ Y $ jest określony przez \ begin {equation *} f_ {Y} (y) = – f_ {X} (g ^ {- 1} (y)) \ cdot \ frac {d} {dy} g ^ {- 1} (y) \ end {equation *} powyższe dwa równania można połączyć w jedno równanie: \ begin {equation *} \ w związku z tym f_ {Y} (y) = f_ {X} (g ^ {- 1} (y)) \ cdot | \ frac {d} {dy} g ^ {- 1} (y) | \ end {equation *}
Komentarze
- Ponieważ całka po fx musi sumować się do 1, a fy jest skalowaną wersją fx, nie ' t co oznacza, że fy nie jest właściwym plikiem PDF, chyba że jakobian w abs () to 1 lub -1?
- @Chris Jakobian z $ g ^ {-1} $ niekoniecznie jest funkcją stałą, więc w niektórych miejscach może wynosić > 1, a w innych <.
- Uważam, że powyższe wyprowadzenie jest nieprawidłowe. Kiedy $ g (.) $ Maleje monotonicznie, $ g (X) \ le y \ implikuje X \ ge g ^ {- 1} (y) $. Znak minus nie pojawia się w magiczny sposób.
- Znak minus pochodzi z faktu, że nierówność jest przełączana na monotonicznie malejące transformacje.
Dodaj komentarz