Python 多因素方差分析
生活随笔
收集整理的這篇文章主要介紹了
Python 多因素方差分析
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
在實際應用中,一個實驗的指標往往受到多個因素的影響。
例如飲料的銷量有可能受到銷售地區或者飲料顏色的影響。在方差分析中,若把飲料的顏色看做影響銷量的因素A,把銷售地區看做影響因素B。同時對因素A和因素B進行分析,就稱為雙因素方差分析。
a b c a1 b1 20 a1 b2 22 a1 b3 24 a1 b4 16 a1 b5 26 a2 b1 12 a2 b2 10 a2 b3 14 a2 b4 4 a2 b5 22 a3 b1 20 a3 b2 20 a3 b3 18 a3 b4 8 a3 b5 16 a4 b1 10 a4 b2 12 a4 b3 18 a4 b4 6 a4 b5 20 a5 b1 14 a5 b2 6 a5 b3 10 a5 b4 18 a5 b5 10 from statsmodels.formula.api import ols from statsmodels.stats.anova import anova_lmformula = 'c~ a + b ' anova_results = anova_lm(ols(formula,df).fit()) print(anova_results) df sum_sq mean_sq F PR(>F) a 4.0 335.36 83.84 3.874307 0.021886 b 4.0 199.36 49.84 2.303142 0.103195 Residual 16.0 346.24 21.64 NaN NaN檢驗的結論:
因素A的p值0.021886<0.05,拒絕原假設,說明飲料顏色對銷量有顯著影響;而因素B的p值0.103195>0.05,不能拒絕原假設,因此沒有充分的理由說明銷售地區對銷量有顯著影響。
然而,我們知道了顏色對銷量有顯著影響,那么是哪種顏色呢?
使用tukey方法對顏色進行多重比較
結果說明:1和5的reject=True,說明這兩種顏色有顯著性差異
總結
以上是生活随笔為你收集整理的Python 多因素方差分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 历史上的今天:NetBSD 系统发布;W
- 下一篇: Python----virtualenv