Python:Sklearn概述
文章來源:https://blog.csdn.net/algorithmPro/article/details/103045824
?
Sklearn (全稱 Scikit-Learn) 是基于 Python 語言的機器學習工具。它建立在 NumPy, SciPy, Pandas 和 Matplotlib 之上,里面的 API 的設計非常好,所有對象的接口簡單,很適合新手上路。
在 Sklearn 里面有六大任務模塊:分別是分類、回歸、聚類、降維、模型選擇和預處理,如下圖從其官網的截屏。
要使用上述六大模塊的方法,可以用以下的偽代碼,注意?import?后面我用的都是一些通用名稱,如?SomeClassifier,?SomeRegressor,?SomeModel,具體化的名稱由具體問題而定,比如
-
SomeClassifier = RandomForestClassifier
-
SomeRegressor =?LinearRegression
-
SomeModel = KMeans, PCA
-
SomeModel = GridSearchCV, OneHotEncoder
上面具體化的例子分別是隨機森林分類器、線性回歸器、K 均值聚類、主成分分析、網格追蹤法、獨熱編碼。
1.分類 (Classification)
from sklearn import SomeClassifier
from sklearn.linear_model import SomeClassifier
from?sklearn.ensemble?import?SomeClassifier
2.回歸 (Regression)
from sklearn import SomeRegressor
from?sklearn.linear_model?import?SomeRegressor
from?sklearn.ensemble?import?SomeRegressor
3.聚類 (Clustering)
from sklearn.cluster import SomeModel4.降維 (Dimensionality Reduction)
from sklearn.decomposition import SomeModel5.模型選擇 (Model Selection)
from sklearn.model_selection import SomeModel6.預處理 (Preprocessing)
from sklearn.preprocessing import SomeModelSomeClassifier,?SomeRegressor,?SomeModel?其實都叫做估計器 (estimator),就像 Python 里「萬物皆對象」那樣,Sklearn 里「萬物皆估計器」。
?
此外,Sklearn 里面還有很多自帶數據集供,引入它們的偽代碼如下。
7.數據集 (Dataset)
from sklearn.datasets import SomeData總結
以上是生活随笔為你收集整理的Python:Sklearn概述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 银行存款利率终于涨了,现在去银行存钱,怎
- 下一篇: Python操作Kafka爬坑