A kovariancia és korrelációs együttható

Korábban szórás diagram vitatták, amely szemlélteti az eloszlás kétdimenziós numerikus adatokat (lásd. Az utolsó rész a kétdimenziós kép ábrázolása numerikus adatok számszerű adatok jegyzetek formájában táblázatok és diagramok). Ebben a tanulmányban azt vizsgáljuk, két mennyiségi jellemző mutatókat a hálózati kapcsolat a két változó - kovariancia és korrelációs együttható. [1] A kovariancia becslések, mert a lineáris kapcsolat két numerikus változók X és Y. A minta kovariancia:

Mi a kovariancia

Ábra. 1. Az ötéves átlag hozam és a részesedése a költségek a befektetési alapok nagyon alacsony kockázatú

Érdekes, hogy a kovariancia a valószínűségi változó varianciája egyenlő:

Ha a kovariancia pozitív, a növekvő értékek egy véletlenszerű változó, a második érték növeli, és ha a jel negatív - azaz csökken. Azonban csak az abszolút értéke a kovariancia lehet megítélni, hogy mennyi az értéke összekapcsolt, mivel ez függ a skála szórásuk. Scale képes normalizálni elosztjuk a termék által a kovariancia-érték standard deviáció (négyzetgyök variancia). Ez azt eredményezi, úgynevezett Pearson korrelációs együttható.

Attól függően, hogy a relatív erő vagy a kapcsolatot, a két változó közötti alkotó kétdimenziós mintában mért korrelációs együttható, amely változik -1 ideális fordított arányban egy tökéletes egyenes arányban. A korrelációs együttható jelöli a görög betű ρ. A linearitás A korrelációs azt jelenti, hogy az összes pontot található ábra scatter, feküdjön egy egyenes vonal (2. ábra). A panel mutatja a lineáris összefüggés a változók között X és Y. Így a korrelációs együttható ρ egyenlő -1, azaz ha a változó nő X, Y csökken változó. A B panel a helyzetben, amelyben a változók között az X és Y a korreláció. Ebben az esetben a korrelációs együttható ρ értéke 0, és ha a változó nő X, Y változó nem mutat határozott trend: ez nem csökkenti, sem növeli. A B panel között közvetlen összefüggés a lineáris változók X és Y. Így a korrelációs együttható ρ értéke 1, és amikor X változó növekszik, Y változó is növeli.

Mi a kovariancia

Ábra. 2. Háromféle két változó közötti kapcsolat

Amikor mintaelemzés tartalmazó kétdimenziós adatokat korrelációs együttható számított mintát, amely jelöli a levél r. A valóságos helyzetekben a korrelációs együttható veszi ritkán pontos értékek -1, 0 és 1. Ábra. A 3. ábra hat diagramok scatter és megfelelő korrelációs együtthatók r között változó értékeket 100 X és Y.

Mi a kovariancia

Ábra. 3. Hat szórás diagramok és megfelelő korrelációs együtthatók kapott Excel programban

A panel mutatja a helyzetet, amelyben a minta korrelációs együttható r értéke -0,9. Megfigyelt egyértelmű trend: kis értékei X megfelelnek az igen magas értékeket az Y változó, és fordítva, a nagy értékek X megfelelnek kis értékekhez Y. Az adatok azonban nem fekszenek egy egyenes vonal, így a köztük lévő kapcsolat nem nevezhető lineáris. B panel adatmintával korrelációs együttható közöttük egyenlő -0,6. Kis értékek megfelelnek az X nagy értékeket változó Y. Megjegyezzük, hogy a változók közötti kapcsolat X és Y nem nevezhető lineáris, mint a panel, és a köztük lévő korreláció nem olyan nagy. A korrelációs együttható a változók közötti X és Y, ábrázolt B panel, egyenlő -0.3. Megfigyelt egy enyhe tendencia, amely szerint nagy értékeket az X változó, általában megfelelnek a kis változó értékei Y. panelek D-F szemléltetik pozitív korreláció közötti adatok - alacsony változó értékek X megfelelnek az nagy értékeket a változó Y.

Megvitatása ábra. 3, azt használta ezt a kifejezést tendencia, hiszen a változók között az X és Y nem ok-okozati összefüggések. A korreláció nem jelent ok-okozati összefüggést a változók közötti X és Y, azaz változó értéke egy változó nem feltétlenül eredményez változást az értékét egy másik. A szoros összefüggés lehet véletlenszerű, és egy harmadik változó attribútumokat kívül maradt az elemzés. Ilyen esetekben szükséges, hogy végezzen további kutatást. Így azt lehet mondani, hogy ok-okozati kapcsolatok létrehozására összefüggés, de a korreláció nem jelent ok-okozati összefüggést.

Szelektív korrelációs együttható:

Mi a kovariancia

Az itt használt Excel függvény CORREL = () (ábra. 4) kiszámítására a korrelációs együtthatót.

Mi a kovariancia

Ábra. 4. CORREL funkció az Excel

Így a korrelációs együttható azt mutatja, lineáris összefüggés vagy kapcsolat a két változó között. Minél közelebb van a korrelációs együttható értéke -1 vagy +1, annál erősebb a lineáris összefüggés a két változó. A jel a korrelációs együttható határozza meg a kapcsolat jellegét: a közvetlen (+) és hátra (-). Egy erős összefüggés nem ok-okozati összefüggés. Ez csak azt jelzi a trend jellemző a minta.