日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

[概率统计]商务与经济统计知识点总结 Part 1

發(fā)布時間:2023/12/20 编程问答 23 豆豆
生活随笔 收集整理的這篇文章主要介紹了 [概率统计]商务与经济统计知识点总结 Part 1 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

寫在前面

概率統(tǒng)計無疑是數(shù)據(jù)類崗位筆試和面試中很重要的一塊,尤其是對我們這種本碩統(tǒng)計學(xué)專業(yè)的,可能問的就要更系統(tǒng)一些。思考了很久還是需要從基礎(chǔ)知識慢慢復(fù)習(xí)起,理論結(jié)合具體實踐,不然越看面經(jīng)越焦慮哈不是嘛。不知道我的博客有沒有人看,不過就當(dāng)是一個小白2020的求職復(fù)習(xí)之路吧。
這個系列大概會按照安德森的商務(wù)與經(jīng)濟統(tǒng)計來慢慢梳理,也不想去找什么速成的方法了,總覺得是不靠譜的。每一部分會整理基本的知識點,盡可能的加上一點實際中的運用吧,如果有面經(jīng)里的一些會稍微整理一點(當(dāng)然以基礎(chǔ)為主)。

這一 part 主要包括第一章到第二章的內(nèi)容。


第一章 數(shù)據(jù)與統(tǒng)計資料

數(shù)據(jù)類型劃分

分類變量和數(shù)量變量
截面數(shù)據(jù)和時間序列數(shù)據(jù)

兩種統(tǒng)計

統(tǒng)計一般包括描述性統(tǒng)計統(tǒng)計推斷


第二章 描述統(tǒng)計學(xué)1:表格法和圖形法

描述性統(tǒng)計一般會用在數(shù)據(jù)分析比賽的第一步用來對數(shù)據(jù)進行初步的感知,或者是用在最后的數(shù)據(jù)可視化,所以這一步看似簡單但實則是很重要的,怎么去直觀的感受數(shù)據(jù)帶來的信息,下面就來看看都有哪些操作。

針對分類變量的描述

頻數(shù)分布

相對頻數(shù)分布和百分?jǐn)?shù)頻數(shù)分布
這個雖然沒有怎么接觸到,但意義也是比較好理解的。

條形圖和餅圖
一般而言,人們更喜歡用條形圖來展示,因為長度往往比角度更加的直觀

針對數(shù)量變量的描述

頻數(shù)分布
這里我們會問啦,上面分類變量也有這個方法啊,這里說的頻數(shù)分布有哪里不一樣嘛。答案是肯定的,因為類型的不同,所以說對于分類變量可以直接的根據(jù)類型進行計數(shù),而數(shù)值型變量是沒有類別的,需要人為的去劃定一些組別,那么問題就聚焦到應(yīng)該怎么去劃定這個組別比較合理等等。
基本步驟為:

  • 確定組數(shù)
  • 確定組寬
  • 確定組限

  • 以這個例子來進行介紹,第一步共20個數(shù)據(jù),要確定適合的組數(shù),總不能說20個數(shù)據(jù)分10個組吧,這也太多了,也不能只分兩組。根據(jù)一般的原則,組數(shù)會在5~20之間,根據(jù)數(shù)據(jù)的個數(shù)再酌情確定,這里我們選擇5.
    第二步,我們一般用這個公式來近似的確定組寬,

    這里的話,即組寬近似為4.2,則取整選擇為5.
    最后則根據(jù)這些來確定組限即可,注意不要重疊,一些統(tǒng)計學(xué)的教材上面會強調(diào)左開右閉或者左閉右開(兩個我都看到過),我個人感覺應(yīng)該不是太重要,每個值都有去處就可以了。

    相對頻數(shù)分布和百分?jǐn)?shù)頻數(shù)分布
    和上面的同理了,我就不說了。

    打點圖
    這個圖我倒是第一次聽說!
    它長這個樣子!
    大概意思就是取值一次就打一個點,還真可愛哈哈。

    直方圖
    直方圖是常用的數(shù)值型變量分布的可視化形式,要注意直方圖的橫坐標(biāo)是連續(xù)的,區(qū)別于條形圖(用于類別變量)是分割開的。
    直方圖是很好的展示分布形態(tài)的一個工具,很輕易的看到下面這張圖是右偏的,

    累積頻數(shù)分布

    莖葉顯示
    也就是通常所說的莖葉圖哈,
    非常簡單的理解,要注意右側(cè)數(shù)值要排序展示。
    和直方圖的區(qū)別就在于,一個是橫的一個是豎的,莖葉圖能展示更多的細(xì)節(jié)數(shù)據(jù)。

    用表格方法匯總兩個變量的數(shù)據(jù)

    交叉分組表
    通過這個交叉匯總的方式,我們可以接著得到很多的信息,比如針對橫坐標(biāo)進行質(zhì)量等級的展示,或者針對縱坐標(biāo)進行參加等級的展示等等。

    辛普森悖論(重點)
    這個真的考的是重中之重啊,幾乎每個面試都有問到,雖然我暫時不知道運用在工作中是以什么形式體現(xiàn),但是既然接觸到了理論就需要好好的總結(jié)一下!
    我們常常合并或綜合兩個或兩個以上的交叉分組表中的數(shù)據(jù),生成一個匯總的交叉分組表,以顯示兩個變量的相關(guān)性。在這種情形下,從兩個或多個單獨的交叉分組表得到的結(jié)論與一個綜合的交叉分組表數(shù)據(jù)得到的結(jié)論可能截然相反。依據(jù)綜合和未綜合數(shù)據(jù)得到的相反結(jié)論被稱為辛普森悖論
    下面給出一個經(jīng)典的例子~法官判決
    綜合民事庭和市政庭

    未綜合民事庭和市政庭

    可以看到兩個數(shù)據(jù)結(jié)論是截然相反的。對兩位法官來說,法庭類型是一個隱藏的變量,所以當(dāng)評價兩位法官的記錄時,它是不可忽視的變量。
    在得出結(jié)論之前,我們應(yīng)該思考應(yīng)該考察綜合形式還是未綜合形式。

    用圖形顯示方法匯總兩個變量的數(shù)據(jù)

    散點圖和趨勢線
    是可以明顯的展示變量之間的相關(guān)關(guān)系的。

    復(fù)合條形圖和結(jié)構(gòu)條形圖

    數(shù)據(jù)可視化:創(chuàng)建有效圖形顯示的最佳實踐


    這一部分的話就是說如何選擇合適的可視化圖示來更好的說明數(shù)據(jù)帶來的信息吧!這一塊對于數(shù)據(jù)分析師來說當(dāng)然也是非常重要的,在今后的實習(xí)和工作中應(yīng)該也會進一步的學(xué)習(xí),當(dāng)然在筆試面試的考察中占比不是太大,但是依然要注意積累和總結(jié)。


    小總結(jié)

    好了今天這一部分就到這里了,前面一部分都是比較容易的,但是一步一步理解就會由淺入深了。
    Part 1 的重點就在于了解一些描述變量的圖示和表格,以及最重要的辛普森悖論,有機會后面會單獨寫一篇辛普森悖論,拭目以待啦。

    總結(jié)

    以上是生活随笔為你收集整理的[概率统计]商务与经济统计知识点总结 Part 1的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。