發表文章

目前顯示的是 8月, 2019的文章

費雪正確性檢定 (Fisher's exact test)

套路 34: 費雪正確性檢定 (Fisher's exact test) 1. 使用時機 : 用於樣本數較少的列聯表的檢定 。 檢定兩個隨機變數之間是否無關 (independent) 。 2. 分析類型 : 類別資料分析 (Categorical Data Analysis) 。 3. 資料範例 : 咪路調查不同性別大學生頭髮顏色 , 資料如下: 髮色 黑色 紅色 總數 男生 5 2 7 女生 3 4 7 總數 8 6 試問髮色與性別是否有關 ? H 0 : 髮色與性別無關 (independent) 。 H A : 髮色與性別有關。 4. 使用 Python 計算 費雪正確性檢定 : import scipy.stats scipy.stats.fisher_exact([[5,2],[3,4]], alternative='two-sided') 結果 : (3.3333333333333335, 0.5920745920745929) # p = 0.592 > 0.05 , H 0 : 髮色與性別無關 (independent) , 成立。 # 反之 , 如果 p-value < 0.05 , H 0 : 髮色與性別無關 (independent) , 不成立。 5. 比較 ,相同數據以卡方獨立檢定分析 , 因資料為 2 x 2 列聯表 (degree of freedom = 1) 時需做葉慈修正 (Yates' correction) , 如下列範例所示 : import numpy as np import scipy.stats obs = np.array([[5,2], [3,4]]) scipy.stats.chi2_contingency(obs, correction = True) 結果 : (0.2916666

列聯表: 獨立檢定 (Contingency Table: Test of Independence)

套路 33: 列聯表 : 獨立檢定 (Contingency Table: Test of Independence) 1. 使用時機 : 用於檢定兩個隨機變數之間是否無關 (independent) 。 2. 分析類型 : 類別資料分析 (Categorical Data Analysis) 。 3. 資料範例一 : 咪路調查不同性別大學生頭髮顏色 , 資料如下: 髮色 黑色 棕色 金色 紅色 總數 男生 32 43 16 9 100 女生 55 65 64 16 200 試問髮色與性別是否有關 ? H 0 : 髮色與性別無關 (independent) 。 H A : 髮色與性別有關。 4. 使用 Python 計算 列聯表分析一 : import numpy as np import scipy.stats obs = np.array([[32,43,16,9], [55,65,64,16]]) scipy.stats.chi2_contingency(obs, correction = False, lambda_ = "log-likelihood") 結果 : (9.512148957197008,          # The test statistic   0.023202466535552493,       # The p-value of the test   3,                          # Degrees of freedom   array([[29.         , 36.         , 26.66666667,   8.33333333],         [58.         , 72.         , 53.33333333, 16.66666667]]))

列聯表: 卡方獨立檢定 (Contingency Table: Chi-square Test of Independence)

套路 32: 列聯表 : 卡方獨立檢定 (Contingency Table: Chi-square Test of Independence) 1. 使用時機 : 用於檢定兩個隨機變數之間是否無關 (independent) 。 2. 分析類型 : 類別資料分析 (Categorical Data Analysis) 。 3. 資料範例一 : 咪路調查不同性別大學生頭髮顏色 , 資料如下: 髮色 黑色 棕色 金色 紅色 總數 男生 32 43 16 9 100 女生 55 65 64 16 200 試問髮色與性別是否有關 ? H 0 : 髮色與性別無關 (independent) 。 H A : 髮色與性別有關。 4. 使用 Python 計算 列聯表卡方分析一 : import numpy as np import scipy.stats obs = np.array([[32,43,16,9], [55,65,64,16]]) scipy.stats.chi2_contingency(obs, correction = False) 結果 : (8.987183908045976,       # The test statistic   0.02946176965294219,     # The p-value of the test   3,                      # Degrees of freedom   array([[29.         , 36.         , 26.66666667,   8.33333333],         [58.         , 72.         , 53.33333333, 16.66666667]])) # p = 0.029 < 0.05 , H 0 : 髮色與