机器学习基本库学习
前言
之前做過將近一年的python爬蟲,python語言基礎還是有的。眼下機器學習如日中天,項目中有用到機器學習對采集的內容進行分類的功能,閑暇之際學習一下相關的庫,以期待money++
簡介
- numpy
python科學計算基礎庫 - matplotlib
Matplotlib 是一個 Python 的 2D繪圖庫,它以各種硬拷貝格式和跨平臺的交互式環境生成出版質量級別的圖形 - pandas
python數據分析庫
NumPy基本知識點
數組輸出設置
set_printoptions(precision=None, threshold=None, edgeitems=None, linewidth=None, suppress=None, nanstr=None, infstr=None, formatter=None)
- precision 輸出浮點數精度設置,默認為8
- threshold 觸發輸出總結的閾值,可以設置為np.inf全部打印出來
切片 來源
python序列切片地址可以寫為[開始:結束:步長],其中的開始、結束和步長都可以省略
- range(10) =>[0,1,2,3,4,5,6,7,8,9]
- 開始start省略時,默認從第0項開始 range(10)[:10:2] => [0,2,4,6,8]
- 結尾省略的時候,默認到數組最后 range(10)[1::2] => [1,3,5,7,9]
- 開始和結尾不省略的時候,step缺省為1 range(10)[2:6:] => [2,3,4,5]
- 步長step=n;代表從start開始(start也算)每隔step間隔,取一個數,一直到結尾end range(20)[::3] => [0,3,6,9,12,15,18]
- 當step等于負數的時候,從右向左取數 range(10)[::-1] => [9,8,7,6,5,4,3,2,1,0]; range(10)[::-2] => [9,7,5,3,1]
- a[start:end]:取得范圍為[start,end)
- a[:end]:取得范圍為[0,end)
- a[start:]:取得范圍為從start到最后(包括最后)
多維切片
In [1]: import numpy as npIn [2]: a = np.arange(25).reshape((5,5))In [3]: a Out[3]: array([[ 0, 1, 2, 3, 4],[ 5, 6, 7, 8, 9],[10, 11, 12, 13, 14],[15, 16, 17, 18, 19],[20, 21, 22, 23, 24]])# 各個維度分別取,冒號表示取這個維度的所有In [4]: a[:,2:5] Out[4]: array([[ 2, 3, 4],[ 7, 8, 9],[12, 13, 14],[17, 18, 19],[22, 23, 24]])In [5]: a[:, None].shape Out[5]: (5, 1, 5)# None代表新增加一個維度,它有一個別稱叫newaxis, None放在哪一維,就會在哪一維上出現新的維度In [6]: a[:, None] Out[6]: array([[[ 0, 1, 2, 3, 4]], [[ 5, 6, 7, 8, 9]], [[10, 11, 12, 13, 14]], [[15, 16, 17, 18, 19]], [[20, 21, 22, 23, 24]]]) In [7]: a[:,:, None].shape Out[7]: (5, 5, 1)In [8]: a[..., None].shape Out[8]: (5, 5, 1)The dots (…) represent as many colons as needed to produce a complete indexing tuple. For example, if x is a rank 5 array (i.e., it has 5 axes), then
- x[1,2,…] is equivalent to x[1,2,:,:,:],
- x[…,3] to x[:,:,:,:,3]
- x[4,…,5,:] to x[4,:,:,5,:].
測試安裝
import matplotlib.pyplot as plt import numpy as npX = np.linspace(-np.pi,np.pi,256,endpoint=True) (C,S)=np.cos(X),np.sin(X)#這里用到了Matplotlib和numpy模塊,linspace在(?π,π)之間分成共256個小段, #并把這256個值賦予X。C,S分別是cosine和sine值(X,C,S都是numpy數組) plt.plot(X,C) plt.plot(X,S)#進行顯示 plt.show() 創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
- 上一篇: 训练总结(大一下)
- 下一篇: spring配置讲解