Analisis korélasi
Sajeroning téyori probabilitas lan statistika, korélasi, uga diarani koéfisien korélasi, iku aji sing nuduhaké kakuwatan lan arah gegayutan linièr antara loro pangowah acak (random variable).
Korélasi dhuwur | Dhuwur | Asor | Asor | Tanpa korélasi | Ora ana korélasi (acak) | Tanpa korélasi | Asor | Asor | Dhuwur | Korélasi dhuwur |
---|---|---|---|---|---|---|---|---|---|---|
−1 | < −0.9 | > −0.9 | < −0.4 | > −0.4 | 0 | < +0.4 | > +0.4 | < +0.9 | > +0.9 | +1 |
Salah siji jinis korélasi sing paling populèr yaiku koèfisièn korélasi momèn-prodhuk Pearson, sing dikasilaké saka mara kovarians kaloro variabel kanthi ping-pingan simpangan bakuné. Sanadyan duwé jeneng Pearson, métodhe iki pisanan diwanuhaké déning Francis Galton.
Koèfisièn korélasi momèn-prodhuk Pearson
besutSipat-sipat matematis
besutKorélasi ρX, Y antara loro pangowah acak X lan Y kanthi aji sing dikarepaké μX lan μY lan simpangan baku σX lan σY didhéfinisi minangka:
Amarga μX = E(X), σX2 = E(X2) − E2(X) lan semono uga tumrap Y, mula bisa uga ditulis
Korélasi bisa diitung yèn simpangan baku finit lan kaloroné ora padha karo nol. Sajeroning pambuktèn Nir pepadhan Cauchy-Schwarz, koèfisièn korélasi ora bakal ngluwihi saka 1 sajeroning aji absolut. Korélasi mawa aji 1 yèn ana gegayutan linier sing positif, mawa aji -1 yèn ana gegayutan linier sing négatif, lan antara -1 lan +1 sing nuduhaké tingkat dhépendhènsi linièr antara loro variabel. Tansaya cedhak karo -1 utawa +1, tansaya kuwat korélasi antara kaloro variabel mau.
Yèn variabel-variabel mau silih bébas, aji korélasi padha karo 0. Nanging ora mangkono kanggo suwaliké, amarga koèfisièn korélasi mung ndhétèksi kagumantungan linièr antara kaloro variabel. Umpamané, pangowah acak X mawa dhistribusi uniform ing interval antara -1 lan +1, lan Y = X2. Kanthi mangkono aji Y ditemtokaké mung déning X.'
Koèfisièn korélasi non-paramètrik
besutKoèfisièn korélasi Pearson minangka statistik paramètrik, lan kurang nggambaraké korélasi yèn asumsi dhasar normalitas sawiji data dilanggar. Métodhe korélasi non-paramètrik kaya ρ Spearman lan τ Kendall migunani nalika dhistribusi ora normal. Koèfisièn korélasi non-paramètrik isih kurang kuwat yèn dibandhingaké karo métodhe paramètrik yèn asumsi normalitas data dikebaki, nanging cenderung mènèhi asil distrosi nalika asumsi mau ora dikebaki.
Métodhe pangukuran sing liya kanggo meruhi dhépendhènsi antara loro pangowah acak
besutKanggo ngantukaké sawiji pangukuran ngenani dependensi data (uga nonlinier), bisa dipigunakaké rasio korélasi, sing mampu ndhétèksi amèh kabèh dependensi fungsional
Kopula lan korélasi
besutAkèh wong sing klèru nganggep yèn informasi sing diwènèhaké déning sawiji koèfisièn korélasi wis cukup ndhéfinisin struktur kagumantungan (dependensi) antara pangowah acak. Nanging kanggo meruhi anané kagumantungan antara pangowah acak kudu ditimbang uga kopula antara kaloroné. Koèfisièn korélasi bisa didhéfinisi minangka struktur kagumantungan mung ana ing sawatara kasus, umpamané sajeroning fungsi distribusi kumulatif ing distribusi normal multivariat.
Matriks korélasi
besutMatriks korélasi n pangowah acak X1,..., Xn yaiku n × n matrik ing ngendi i,j yaiku corr(Xi, Xj). Yèn ukuran korélasi sing dipigunakaké wujud koèfisièn momèn-prodhuk, matriks korélasi bakal padha karo matriks kovarians pangowah acak sing wis distandaraké Xi /SD(Xi) untuk i = 1, ..., n. Saéngga, matriks korélasi minangka matriks definit ora-négatif.
Matriks korélasi tansah simètris, yakuwi korélasi antara lan yaiku padha karo korélasi antara lan ).
"Korélasi ora mesthi sebab-akibat"
besutDiktum konvensi yèn "korélasi ora tansah ateges sebab-akibat" dibahas sajeroning artikel gegayutan artifisial (spurious relationship). Deleng uga korélasi ngarah menyang gegayutan sebab-akibat (kakliruan logis). Kepiyé waé, korélasi ora diasumsi tansah akausal, sanadyan jalaran mau bisa uga ora diweruhi.
Ngitung korélasi kanthi akurat nganggo métode numerik
besutIng ngisor iki algoritma (sajeroning pseudocode) sing bakal mènèhi èstimasi korélasi kanthi migunakaké métodhe mumerik
sum_sq_x = 0 sum_sq_y = 0 sum_coproduct = 0 mean_x = x[1] mean_y = y[1] last_x = x[1] last_y = y[1] for i in 2 to N: sweep = (i - 1.0) / i delta_x = x[i] - mean_x delta_y = y[i] - mean_y sum_sq_x += delta_x * delta_x * sweep sum_sq_y += delta_y * delta_y * sweep sum_coproduct += delta_x * delta_y * sweep mean_x += delta_x / i mean_y += delta_y / i pop_sd_x = sqrt(sum_sq_x / N) pop_sd_y = sqrt(sum_sq_y / N) cov_x_y = sum_coproduct / N correlation = cov_x_y / (pop_sd_x * pop_sd_y)
Pranala njaba
besut- Understanding Correlation Archived 2011-11-21 at the Wayback Machine. - Materi pegantar
- Statsoft Electronic Textbook
- Pearson's Correlation Coefficient
- Learning by Simulations - Distribusi koèfisièn korélasi
- Jasa analisis statistik penelitian Archived 2007-05-14 at the Wayback Machine. - Jasa analisis statistik panalitèn