数学建模-分类模型
分類(lèi)模型
1. 二分類(lèi)模型-SPSS實(shí)現(xiàn)
1.1數(shù)據(jù)預(yù)處理
定性變量生成定量的虛擬變量
- 步驟:SPSS->轉(zhuǎn)換->創(chuàng)建虛變量
1.2 使用邏輯回歸進(jìn)行處理
- 根據(jù)原理:兩點(diǎn)分布(伯努利分布)
在給定xxx的情況下,考慮yyy的兩點(diǎn)分布概率:
{P(y=1∣x)=F(x,β)P(y=0∣x)=1?F(x,β)\begin{cases} P(y=1|x)=F(x,β)\\ P(y=0|x)=1-F(x,β)\end{cases} {P(y=1∣x)=F(x,β)P(y=0∣x)=1?F(x,β)?
F(x,β)F(x,β)F(x,β)稱(chēng)為連接函數(shù)(link function),它將解釋變量xxx和被解釋變量yyy連接起來(lái)
-
步驟:SPSS->分析->回歸->二元Logistic(保存:概率、組成員)
-
預(yù)測(cè)結(jié)果較差怎么辦?(準(zhǔn)確率較低)
- 可在logistic回歸模型中加入平方項(xiàng)、交互項(xiàng)
- 選擇變量->轉(zhuǎn)換->計(jì)算變量
- 重新進(jìn)行二元Logistic,協(xié)變量里要把原來(lái)的和處理后的變量都加入
- 但容易出現(xiàn)過(guò)擬合現(xiàn)象,變量的顯著性變得很高
- 可在logistic回歸模型中加入平方項(xiàng)、交互項(xiàng)
-
如何確定合適的模型?
- 交叉驗(yàn)證方法:
- 把已知數(shù)據(jù)分為訓(xùn)練組和測(cè)試組
- 一般設(shè)置為8:2
- 利用訓(xùn)練組的數(shù)據(jù)來(lái)估計(jì)出模型,再用測(cè)試組的數(shù)據(jù)來(lái)進(jìn)行測(cè)試
- 交叉驗(yàn)證方法:
1.3 Fisher線(xiàn)性判別分析
LDA(Linear Discriminant Analysis)是一種經(jīng)典的線(xiàn)性判別方法,又稱(chēng)Fisher判別分析
給定訓(xùn)練集樣例,設(shè)法將樣例投影到一維的直線(xiàn)上,使得同類(lèi)樣例的投影點(diǎn)盡可能接近和密集,異類(lèi)投影點(diǎn)盡可能遠(yuǎn)離。
1.3.1SPSS實(shí)現(xiàn)方法
-
步驟:分析->分類(lèi)->判別式->添加分組變量(y)->定義范圍(種類(lèi))->添加自變量->統(tǒng)計(jì)(費(fèi)希爾、未標(biāo)準(zhǔn)化)->分類(lèi)(摘要表)->保存(預(yù)判組成員、組成員概率)
-
關(guān)注點(diǎn):未標(biāo)準(zhǔn)化系數(shù)(線(xiàn)性系數(shù)ω)、分類(lèi)結(jié)果
2.多分類(lèi)模型
- Fisher判別同樣適用,在SPSS中修改定義范圍即可
- 邏輯回歸方法:多元Logistic回歸
總結(jié)
- 上一篇: 惊了!最通俗易懂的Djongo入门竟然在
- 下一篇: Markdown简单上手