python建模用什么库_Python 建模库介绍 - 树懒学堂
Python建模庫介紹
專注于提供一個用Python做數(shù)據(jù)分析的編程基礎(chǔ)。因為數(shù)據(jù)分析師和科學(xué)家經(jīng)常在數(shù)據(jù)規(guī)整和準(zhǔn)備上花費大量的時間,本文的結(jié)構(gòu)反映了精通這些技術(shù)的重要性。
使用哪個庫進(jìn)行模型開發(fā)取決于應(yīng)用。很多統(tǒng)計上的難題可以通過更簡單的技術(shù),例如最小二乘回歸等方法,來解決,但另外一些問題可能需要用到高階的機(jī)器學(xué)習(xí)方法。幸運的是Python已經(jīng)成為實現(xiàn)分析方法的語言選擇之一,因此在完成學(xué)習(xí)后可以探索很多工具的使用。
在本章,將回顧pandas的一些特性,這些特性可能會在使用pandas進(jìn)行模型訓(xùn)練和評分時有用。介紹兩個流行的建模工具包——scikit-learn和statsmodels。
scikit-learn介紹
就像用于數(shù)據(jù)操作的Pandas和用于可視化的matplotlib一樣,scikit-learn是Python構(gòu)建模型中的佼佼者。沒有什么能與之媲美。
事實上,scikit-learn建立在NumPy,SciPy和matplotlib之上。它是開放源碼的,每個人都可以訪問,并且可以在各種環(huán)境中重用。
scikit-learn支持在機(jī)器學(xué)習(xí)中執(zhí)行的不同操作,如分類、回歸、聚類和模型選擇等。
statsmodels是一個有很多統(tǒng)計模型的python庫,能完成很多統(tǒng)計測試,數(shù)據(jù)探索以及可視化。它也包含一些經(jīng)典的統(tǒng)計方法,比如貝葉斯方法和一個機(jī)器學(xué)習(xí)的模型。
scikit-learn是機(jī)器學(xué)習(xí)中常用的第三方模塊,對常用的機(jī)器學(xué)習(xí)方法進(jìn)行了封裝,包括回歸(Regression)、降維(Dimensionality Reduction)、分類(Classfication)、聚類(Clustering)等方法。scikit-learn具有以下特點:
簡單高效的數(shù)據(jù)挖掘和數(shù)據(jù)分析工具
讓每個人能夠在復(fù)雜環(huán)境中重復(fù)使用
建立NumPy、Scipy、MatPlotLib之上
statsmodels介紹:
statsmodels是一個有很多統(tǒng)計模型的python庫,能完成很多統(tǒng)計測試,數(shù)據(jù)探索以及可視化。它也包含一些經(jīng)典的統(tǒng)計方法,比如貝葉斯方法和一個機(jī)器學(xué)習(xí)的模型。
線性模型,廣義線性模型,魯棒線性模型
線性混合效應(yīng)模型(Linear mixed effects models)
方差分析(ANOVA)方法(Analysis of variance (ANOVA) methods)
時間序列處理(Time series processes)和狀態(tài)空間模型(state space models)
廣義矩估計方法(Generalized method of moments)
由于這兩個項目每個都大到可以單獨成書,不再嘗試完整地介紹,而是像其他基于Python的數(shù)據(jù)科學(xué)、統(tǒng)計學(xué)和機(jī)器學(xué)習(xí)的書籍一樣,直接進(jìn)入到項目的官方在線文檔。
總結(jié)
以上是生活随笔為你收集整理的python建模用什么库_Python 建模库介绍 - 树懒学堂的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用webgl(three.js)搭建一
- 下一篇: websocket python爬虫_p