基于统计学的商务与经济数据分析知识
以下基于統(tǒng)計(jì)學(xué)視角,對(duì)商務(wù)與經(jīng)濟(jì)的數(shù)據(jù)分析知識(shí)進(jìn)行總結(jié):
(1)數(shù)據(jù)
元素(數(shù)據(jù)來(lái)源的原有實(shí)物(體))、變量和觀測(cè)值
度量尺度
定性和定量數(shù)據(jù)
截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)
?
(2)描述性統(tǒng)計(jì)
①表格法和圖形法
匯總定性數(shù)據(jù)(柱狀圖和餅狀圖)
匯總定量數(shù)據(jù)(點(diǎn)位圖(橫軸表示觀測(cè)值得取值范圍,每一個(gè)觀測(cè)值由位于橫軸上的點(diǎn)表示)、直方圖、累積分布、累積曲線)
探索性數(shù)據(jù)分析(莖葉圖)
交叉分組列表和散點(diǎn)圖
②數(shù)值方法(位置、變異程度、探索性數(shù)據(jù)分析(五數(shù)概括、箱形圖)、兩變量間關(guān)系、加權(quán)平均)
(3)統(tǒng)計(jì)推斷
?
點(diǎn)估計(jì)
?
區(qū)間估計(jì)
一個(gè)總體均值:①大樣本下總體均值區(qū)間估計(jì),用z分布,如果總體方差未知,則用樣本方差s代替;②小樣本下總體均值區(qū)間估計(jì),假定總體服從正態(tài)分布,則總體方差已知情況下,用z分布,總體方差未知用樣本方差代替,且用t分布
兩總體均值(獨(dú)立樣本):①大樣本下,用z分布,如果兩總體方差未知,則用樣本標(biāo)準(zhǔn)差代替;②小樣本下,用t分布
兩總體均值(匹配樣本):使用樣本標(biāo)準(zhǔn)差,t分布
(4)假設(shè)檢驗(yàn)
判斷總體分布情況(泊松分布、正態(tài)分布),均可用擬合度檢驗(yàn)先后表示用泊松分布、正態(tài)分布概率公式求得的總體頻數(shù)預(yù)期結(jié)果值。
(5)方差分析
①k個(gè)總體均值相等性檢驗(yàn)分子、分母分別表示組間、組內(nèi)均方差;多重比較:費(fèi)舍爾(Fisher)LSD法( Least-Significant Difference, 最小顯著差異法, 用t檢驗(yàn)完成各組均值間的配對(duì)比較的方法);②實(shí)驗(yàn)設(shè)計(jì):純隨機(jī)設(shè)計(jì)(方差分析F檢驗(yàn))、隨機(jī)區(qū)組設(shè)計(jì)(樣本在某一水平進(jìn)行了重復(fù)觀測(cè),SST=SSTR+SSBL+SSE)、因子試驗(yàn)(SST=SSA+SSB+SSAB+SSE)
?
(6)簡(jiǎn)單線性回歸
①最小二乘法估計(jì)系數(shù);
②判定系數(shù)(判斷估計(jì)回歸方程的擬合程度)
④利用回歸方程估計(jì)與預(yù)測(cè):點(diǎn)估計(jì)、區(qū)間估計(jì)
⑤殘差分析:
殘差圖;
殘差正態(tài)概率判斷圖(首先得到標(biāo)準(zhǔn)正態(tài)分?jǐn)?shù)表,然后將被檢測(cè)的標(biāo)準(zhǔn)殘差序列從大到小依次和該分?jǐn)?shù)表進(jìn)行比對(duì),可以得到殘差正態(tài)分布檢測(cè)圖);
檢測(cè)異常值(散點(diǎn)圖,軟件包)如果一個(gè)觀測(cè)值與其他數(shù)據(jù)的形狀偏離很大,那么對(duì)應(yīng)的標(biāo)準(zhǔn)殘絕對(duì)值也將很大;
高杠桿率點(diǎn),指自變量的值是極端值的觀察值。可以根據(jù)自變量的值與它們的平均值距離的遠(yuǎn)近確定一個(gè)觀察值的杠桿率(對(duì)于只有一個(gè)自變量的情形)⑥多重共線性(兩變量相關(guān)系數(shù)大于0.7或者小于-0.7,將可能產(chǎn)生多重共線性)
⑦變量選擇逐步回歸、前向選擇、后向消元)
⑧自相關(guān)性:杜賓-瓦特森(DW)檢驗(yàn)
(7)預(yù)測(cè)
? 加權(quán)移動(dòng)平均法
?消除季節(jié)影響的時(shí)間系列來(lái)分析趨勢(shì)
? 回歸分析
? 定性預(yù)測(cè)(德?tīng)柗品ā<遗袛喾ā⑦h(yuǎn)景規(guī)劃法)
?
(8)非參數(shù)法
? 用于一個(gè)主體前后變化比較,或者兩個(gè)主體差異比較。
①符號(hào)檢驗(yàn)(signtest)
針對(duì)的是正號(hào)或負(fù)號(hào)的符號(hào)個(gè)數(shù)。
小樣本,根據(jù)發(fā)生概率得到二項(xiàng)概率分布表,利用二項(xiàng)概率分布進(jìn)行檢驗(yàn);
大樣本,近似正態(tài)分布z檢驗(yàn)
?
? ②威爾克科森符號(hào)秩檢驗(yàn)
基于匹配樣本,針對(duì)的是正負(fù)符號(hào)個(gè)數(shù)的差值。
當(dāng),使用近似正態(tài)分布z檢驗(yàn)。
?
? ③曼-懷特尼檢驗(yàn):
所使用的兩個(gè)獨(dú)立樣本來(lái)自不同的總體。
小樣本,,,;大樣本,近似正態(tài)分布z檢驗(yàn)
? ④克魯斯卡爾-沃利斯檢驗(yàn):多個(gè)總體
⑤秩相關(guān):
使用斯皮爾曼秩相關(guān)系數(shù)(spearman 等級(jí)相關(guān)系數(shù))求解品質(zhì)相關(guān)系數(shù)。
秩相關(guān)顯著性檢驗(yàn)(,使用近似正態(tài)分布z檢驗(yàn))
?
總結(jié)
以上是生活随笔為你收集整理的基于统计学的商务与经济数据分析知识的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【分享】Android JNI实例
- 下一篇: Hadoop的配置