Derivação da mudança de variáveis de uma função de densidade de probabilidade?
On Fevereiro 9, 2021 by adminNo livro reconhecimento de padrões e aprendizado de máquina (fórmula 1.27), dá
$$ p_y (y) = p_x (x) \ left | \ frac {d x} {d y} \ right | = p_x (g (y)) | g “(y) | $$ onde $ x = g (y) $, $ p_x (x) $ é o pdf que corresponde a $ p_y (y) $ com respeito à mudança da variável.
Os livros dizem que “s porque as observações que caem no intervalo $ (x, x + \ delta x) $ serão, para pequenos valores de $ \ delta x $, transformadas no intervalo $ (y, y + \ delta y) $.
Como isso é derivado formalmente?
Atualização de Dilip Sarwate
O resultado é válido apenas se $ g $ for uma função crescente ou decrescente estritamente monótona.
Alguma edição menor em LV Resposta de Rao “$$ \ begin {equation} P (Y \ le y) = P (g (X) \ le y) = \ begin {casos} P (X \ le g ^ {- 1} (y)) , & \ text {if} \ g \ text {está aumentando monotonicamente} \\ P (X \ ge g ^ {- 1} (y)), & \ text {if} \ g \ text {está diminuindo monotonicamente} \ end {casos} \ end {equação} $$ Portanto, se $ g $ está aumentando monotonicamente $$ F_ {Y} (y) = F_ {X} (g ^ {- 1} (y)) $$ $$ f_ {Y} (y) = f_ {X} (g ^ {- 1} (y)) \ cdot \ frac {d} {dy} g ^ {- 1} (y) $$ se diminuir monotonicamente $$ F_ {Y} (y) = 1-F_ {X} (g ^ {- 1} (y)) $$ $$ f_ { Y} (y) = – f_ {X} (g ^ {- 1} (y)) \ cdot \ frac {d} {dy} g ^ {- 1} (y) $$ $$ \ portanto f_ {Y } (y) = f_ {X} (g ^ {- 1} (y)) \ cdot \ left | \ frac {d} {dy} g ^ {- 1} (y) \ right | $$
Comentários
- O resultado é válido apenas se $ g $ for uma função crescente ou decrescente estritamente monótona. Desenhe um gráfico de $ g $ e decifre-o usando o ideia básica por trás da definição da derivada (não a definição formal com épsilon e delta). Além disso, há uma resposta de @whuber neste site que explica os detalhes ; ou seja, deve ser fechado como uma duplicata.
- A explicação de seu livro ' é uma reminiscência daquela que ofereci em stats.stackexchange.com/a/14490/919 . Também postei um método algébrico geral em stats.stackexchange.com/a/101298/919 e uma explicação geométrica em stats.stackexchange.com/a/4223/919 .
- @DilipSarwate obrigado por sua explicação, acho que entendo a intuição, mas ' estou mais interessado em como ele pode ser derivado usando as regras e teoremas existentes 🙂
Resposta
Suponha que $ X $ seja uma variável aleatória contínua com pdf
f (x). Se definirmos $ Y = g (X) $, onde g () é uma função monótona, então o pdf
de $ Y $ é obtido da seguinte forma: \ begin {eqnarray *} P (Y \ le y) & = & P (g (X) \ le y) \\ & = & P (X \ le g ^ {- 1} (y)) \\ ou \; \; F_ {Y} (y) & = & F_ {X} (g ^ {- 1} (y)), \ quad \ mbox {pela definição de CDF} \\ \ end {eqnarray *} Diferenciando os CDFs em ambos os lados wrt $ y $, obtemos o pdf de $ Y $. A função g () pode ser monotonicamente crescente ou monotonicamente decrescente. Se a função g () está aumentando monotonicamente, então a fdp de $ Y $ é dada por \ begin {equation *} f_ {Y} (y) = f_ {X} (g ^ {- 1} (y)) \ cdot \ frac {d} {dy} g ^ {- 1} (y) \ end {equação *} e por outro lado, se for monotonicamente decrescente, então a pdf de $ Y $ é dada por \ begin {equação *} f_ {Y} (y) = – f_ {X} (g ^ {- 1} (y)) \ cdot \ frac {d} {dy} g ^ {- 1} (y) \ end {equation *} O as duas equações acima podem ser combinadas em uma única equação: \ begin {equation *} \ portanto f_ {Y} (y) = f_ {X} (g ^ {- 1} (y)) \ cdot | \ frac {d} {dy} g ^ {- 1} (y) | \ end {equation *}
Comentários
- Mas como a integral sobre fx deve somar 1 e fy é uma versão em escala de fx, não ' t que significa que fy não é um pdf adequado, a menos que o jacobiano em abs () seja 1 ou -1?
- @Chris O Jacobiano de $ g ^ {-1} $ não é necessariamente uma função constante, então pode ser > 1 em alguns lugares e < 1 em outros.
- Eu acredito que a derivação acima está incorreta. Quando $ g (.) $ Diminui monotonicamente, $ g (X) \ le y \ implica X \ ge g ^ {- 1} (y) $. O sinal de menos não aparece magicamente.
- O sinal de menos vem do fato de que a desigualdade é trocada por transformações monotonicamente decrescentes
Deixe uma resposta