Analisis korélasi

Sajeroning téyori probabilitas lan statistika, korélasi, uga diarani koéfisien korélasi, iku aji sing nuduhaké kakuwatan lan arah gegayutan linièr antara loro pangowah acak (random variable).

Jinis-jinis korélasi
Koèfisien korélasi
Korélasi dhuwur Dhuwur Asor Asor Tanpa korélasi Ora ana korélasi (acak) Tanpa korélasi Asor Asor Dhuwur Korélasi dhuwur
−1 < −0.9 > −0.9 < −0.4 > −0.4 0 < +0.4 > +0.4 < +0.9 > +0.9 +1

Salah siji jinis korélasi sing paling populèr yaiku koèfisièn korélasi momèn-prodhuk Pearson, sing dikasilaké saka mara kovarians kaloro variabel kanthi ping-pingan simpangan bakuné. Sanadyan duwé jeneng Pearson, métodhe iki pisanan diwanuhaké déning Francis Galton.

Koèfisièn korélasi momèn-prodhuk Pearson

besut

Sipat-sipat matematis

besut
 
Korélasi linier antara 1000 pasang pengamatan. Dhata digambaraké ing pérangan kiwa ngisor lan koèfisièn korelasiné dituduhaké ing pérangan tengen ndhuwur. Saben titik pengamatan duwé korélasi maksimum karo awaké dhéwé, kaya ditudhuhaké ing dhiagonal (kabèh korélasi = +1).

Korélasi ρX, Y antara loro pangowah acak X lan Y kanthi aji sing dikarepaké μX lan μY lan simpangan baku σX lan σY didhéfinisi minangka:

 

Amarga μX = E(X), σX2 = E(X2) − E2(X) lan semono uga tumrap Y, mula bisa uga ditulis

 

Korélasi bisa diitung yèn simpangan baku finit lan kaloroné ora padha karo nol. Sajeroning pambuktèn Nir pepadhan Cauchy-Schwarz, koèfisièn korélasi ora bakal ngluwihi saka 1 sajeroning aji absolut. Korélasi mawa aji 1 yèn ana gegayutan linier sing positif, mawa aji -1 yèn ana gegayutan linier sing négatif, lan antara -1 lan +1 sing nuduhaké tingkat dhépendhènsi linièr antara loro variabel. Tansaya cedhak karo -1 utawa +1, tansaya kuwat korélasi antara kaloro variabel mau.

Yèn variabel-variabel mau silih bébas, aji korélasi padha karo 0. Nanging ora mangkono kanggo suwaliké, amarga koèfisièn korélasi mung ndhétèksi kagumantungan linièr antara kaloro variabel. Umpamané, pangowah acak X mawa dhistribusi uniform ing interval antara -1 lan +1, lan Y = X2. Kanthi mangkono aji Y ditemtokaké mung déning X.'

Koèfisièn korélasi non-paramètrik

besut
 

Koèfisièn korélasi Pearson minangka statistik paramètrik, lan kurang nggambaraké korélasi yèn asumsi dhasar normalitas sawiji data dilanggar. Métodhe korélasi non-paramètrik kaya ρ Spearman lan τ Kendall migunani nalika dhistribusi ora normal. Koèfisièn korélasi non-paramètrik isih kurang kuwat yèn dibandhingaké karo métodhe paramètrik yèn asumsi normalitas data dikebaki, nanging cenderung mènèhi asil distrosi nalika asumsi mau ora dikebaki.

Métodhe pangukuran sing liya kanggo meruhi dhépendhènsi antara loro pangowah acak

besut

Kanggo ngantukaké sawiji pangukuran ngenani dependensi data (uga nonlinier), bisa dipigunakaké rasio korélasi, sing mampu ndhétèksi amèh kabèh dependensi fungsional

Kopula lan korélasi

besut

Akèh wong sing klèru nganggep yèn informasi sing diwènèhaké déning sawiji koèfisièn korélasi wis cukup ndhéfinisin struktur kagumantungan (dependensi) antara pangowah acak. Nanging kanggo meruhi anané kagumantungan antara pangowah acak kudu ditimbang uga kopula antara kaloroné. Koèfisièn korélasi bisa didhéfinisi minangka struktur kagumantungan mung ana ing sawatara kasus, umpamané sajeroning fungsi distribusi kumulatif ing distribusi normal multivariat.

Matriks korélasi

besut

Matriks korélasi n pangowah acak X1,..., Xn yaiku n  ×  n matrik ing ngendi i,j yaiku corr(XiXj). Yèn ukuran korélasi sing dipigunakaké wujud koèfisièn momèn-prodhuk, matriks korélasi bakal padha karo matriks kovarians pangowah acak sing wis distandaraké Xi /SD(Xi) untuk i = 1, ..., n. Saéngga, matriks korélasi minangka matriks definit ora-négatif.

Matriks korélasi tansah simètris, yakuwi korélasi antara   lan   yaiku padha karo korélasi antara   lan  ).

"Korélasi ora mesthi sebab-akibat"

besut

Diktum konvensi yèn "korélasi ora tansah ateges sebab-akibat" dibahas sajeroning artikel gegayutan artifisial (spurious relationship). Deleng uga korélasi ngarah menyang gegayutan sebab-akibat (kakliruan logis). Kepiyé waé, korélasi ora diasumsi tansah akausal, sanadyan jalaran mau bisa uga ora diweruhi.

Ngitung korélasi kanthi akurat nganggo métode numerik

besut

Ing ngisor iki algoritma (sajeroning pseudocode) sing bakal mènèhi èstimasi korélasi kanthi migunakaké métodhe mumerik

sum_sq_x = 0
sum_sq_y = 0
sum_coproduct = 0
mean_x = x[1]
mean_y = y[1]
last_x = x[1]
last_y = y[1]
for i in 2 to N:
    sweep = (i - 1.0) / i
    delta_x = x[i] - mean_x
    delta_y = y[i] - mean_y
    sum_sq_x += delta_x * delta_x * sweep
    sum_sq_y += delta_y * delta_y * sweep
    sum_coproduct += delta_x * delta_y * sweep
    mean_x += delta_x / i
    mean_y += delta_y / i 
pop_sd_x = sqrt(sum_sq_x / N)
pop_sd_y = sqrt(sum_sq_y / N)
cov_x_y = sum_coproduct / N
correlation = cov_x_y / (pop_sd_x * pop_sd_y)


Pranala njaba

besut