Korreláció egy állandó
On február 9, 2021 by adminkonstanssal próbálom megkapni a korrelációt 2 változó között, adott adatsor alapján. Időnként az adott adatsorban, Ha az egyik változónak állandó értéke van, mivel ennek a változónak a szórása nulla, akkor kapok egy NA értéket a korrelációra. (R-ben). Szeretnék kifejezetten hozzárendelni egy értéket a korrelációhoz ezekben a forgatókönyvekben, vagy alternatív eszközökkel próbálnék valamilyen értéket szerezni, hogy ezt a pontot összehasonlíthassam máskor, amikor kiszámolom a korrelációt. Hogyan folytassam? (1) Kell-e adnom némi zajt ahhoz a változóhoz, és újra kiszámítani a korrelációt. Értelmes dolog lenne ez?
Megjegyzések
- Ne feledje, hogy a válaszállandó a változó prediktor és a prediktor konstans ellenére, míg a válaszváltozó lényegében teljesen különböző helyzetek, nem szabad ' nem akarja őket ugyanúgy kezelni, függetlenül attól, hogy a korreláció mindkét esetben (meglehetősen közölt) határozatlan. (A teljesség kedvéért adja hozzá mindkét változót állandóval.
- Bővítheti a jelentését azzal, hogy összehasonlítja másokkal, amikor kiszámítja a korrelációt?
Válasz
Emlékezzünk vissza, hogy a korreláció a következőképpen van meghatározva:
$$ \ rho_ {X, Y} = \ frac {\ sigma (X, Y)} { \ sigma_X \ sigma_Y} $$
Ez azt jelenti, hogy ha az egyik “változód” állandó, akkor ez nem változó, varianciája nullával egyenlő és így korreláció bármi undefined (mivel osztasz nullával).
A $ X $ változó és a konstans $ c $ szórása megegyezik a $ X $ szórásával.
$$ \ sigma (X + c) = \ sigma (X) $$
ugyanaz a kovariancia esetében
$$ \ sigma (X + c, Y) = \ sigma (X, Y) $$
így a zaj hozzáadása az állandó “változóhoz” azt eredményezné, hogy a zajod nak korrelációját mérjük valamilyen más változóval (a “változó” $ c $ és a zaj $ X $).
Másrészt a véletlen változó állandóval való kovarianciája zer o
$$ \ sigma (Y, c) = 0 $$
és az állandó véletlen változó független bármely más véletlen változó. Tehát, ha valóban újra kell határoznia a korrelációt egy ilyen esetre, akkor a legjobb választás $ 0 $ lenne. Figyeljük meg azonban, hogy amint azt az Nick Cox megjegyezte az alábbi megjegyzésben, ez nem oldja meg egyik problémáját sem.
Az állandó véletlenszerű változóval az az alapvető probléma, hogy független a minden mást, és ez semmit sem fog változtatni az elemzésén. Emiatt sok szoftvercsomag hibákat ad vissza állandó változók használatakor, vagy automatikusan elveti őket az elemzésből. Ezt R teszi, és az ilyen viselkedés összhangban van a korreláció meghatározásával.
Megjegyzések
- Az itt látható logika ellenére összefüggés undefined " tűnik a jobb válasznak bárki előtt, aki szembesül ezzel a kérdéssel. " Nem tudjuk, hogy ' nem tudjuk, hogy " nem azonos a nulla korrelációval. Ezenkívül a korrelációt nullaként kezelő további elemzés nagyobb valószínűséggel elrontja a későbbi elemzéseket, pl. PCA a korrelációs mátrix alapján, a nulla nullával.
- Tehát, ha a kovariancia 0, akkor a számláló 0. Ha pedig egy változó állandó, akkor a nevező 0. És 0/0 rendetlenség. Azonban itt a megnevező csak méretezési tényező, tehát talán a korr = 0 rendben van. De bár biztosan igazad van abban, hogy egy állandóval változó kovarianciája 0-ként van meghatározva, számomra ' nem világos, hogy ennek is van értelme. érdemben. Tehát az NA a legjobb, szerintem
- @PeterFlom teljes mértékben egyetértek veled.
- Ezt R mondja el az ügyről: `cor (x < – rep (1, 10), y < – rnorm (10)) [1] NA figyelmeztető üzenet: In cor (x < – rep (1, 10), y < – rnorm (10): a szórás nulla”
Válasz
Az R (vagy bármely más nyelvű) műveletekkel kapcsolatos kérdések itt nem témakörök, de van egy statisztikai kérdésed is, azaz
Mi az ésszerű értéke a két változó közötti korrelációnak, ha egy változó állandó?
Javasoljuk, hogy adjon némi zajt a változóhoz. Ha ezt meg akarja tenni, akkor egyszerűen azt is mondhatja, hogy az összefüggés nulla.
Az a baj, hogy valójában nincs fogalma arról, hogy mi legyen az összefüggés – ez bármi lehet. -1-től 1-ig. Ezért adja R az NA-t. Tehát nincs igazán ésszerű dolog, csak azt mondani, hogy “nincs információnk”, és nem hasonlítani más értékekkel.
Vélemény, hozzászólás?