皮爾森相關係數 (Pearson correlation coefficient)


套路24: 皮爾森相關係數 (Pearson correlation coefficient)

1. 使用時機: 皮爾森相關係數是用以反映兩組變數之間關係密切程度的統計指標。
2. 分析類型: 母數分析(parametric analysis)直接使用資料數值算統計叫parametric方法,把資料排序之後用排序的名次算統計叫non-parametric方法。
3. 皮爾森相關係數前提假設: 兩組變數之資料均為常態分布(normal distribution)或接近常態分布
4. 範例資料1: 某研究餵食量對斑馬魚(zebrafish)存活的影響。在恆溫下投入飼料X (mg)斑馬魚存活比例Y的資料如下:
X (mg)        
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0.55
Y (存活比例)
1
0.95
0.95
0.9
0.85
0.7
0.65
0.6
0.55
0.42
餵食量與斑馬魚(zebrafish)存活有無線性關係?
5. 畫圖看資料分佈:
v1 = [0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55]
v2 = [1, 0.95, 0.95, 0.9, 0.85, 0.7, 0.65, 0.6, 0.55, 0.42]
dat = {'ValueX':v1,'ValueY':v2}  # ValueX, ValueY是資料標題
import pandas as pd
df = pd.DataFrame(dat)
import seaborn as sb
from matplotlib import pyplot as plt
sb.lmplot(x = "ValueX", y = "ValueY", data = df)
plt.show()
# 灰色區域是回歸線的95%信賴區間。
6. 檢查資料是否為常態分布 (H0:資料為常態分佈):
v1 = [0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55]
v2 = [1, 0.95, 0.95, 0.9, 0.85, 0.7, 0.65, 0.6, 0.55, 0.42]
import scipy.stats
scipy.stats.shapiro(v1)
結果: (0.9701647162437439, 0.8923683762550354)
p = 0.8923 > 0.05接受H0:資料為常態分佈。
scipy.stats.shapiro(v2)
(0.925931453704834, 0.4090862274169922)
p = 0.4091 > 0.05接受H0:資料為常態分佈。
# 如計算結果p-value < 0.05H0:資料為常態分佈,不成立。
# 如計算結果p-value > 0.05H0:資料為常態分佈,成立。
7. 使用Python計算皮爾森相關係數
方法一:
v1 = [0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55]
v2 = [1, 0.95, 0.95, 0.9, 0.85, 0.7, 0.65, 0.6, 0.55, 0.42]
import numpy
numpy.corrcoef(v1, v2)
結果: array([[ 1.       , -0.9811093],
          [-0.9811093,  1.       ]])
# 相關係數矩陣沒有p
方法二:
v1 = [0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55]
v2 = [1, 0.95, 0.95, 0.9, 0.85, 0.7, 0.65, 0.6, 0.55, 0.42]
import scipy.stats
scipy.stats.pearsonr(v1, v2)
結果: (-0.9811092951214497, 5.44617409946044e-07)
皮爾森相關係數: -0.9811  p-value = 5.44e-7 < 0.05
# 如計算結果p-value < 0.05H0: ρ = 0,不成立,XY有關
# 如計算結果p-value > 0.05H0: ρ = 0,成立,XY無關


留言

這個網誌中的熱門文章

三因子變異數分析 (Three-Way ANOVA)

兩組獨立樣本變異數相同 t 檢定 (Two-Sample t test with equal variances,parametric)

雙因子變異數分析 (Two-Way ANOVA)