日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

1.5 特征缩放-机器学习笔记-斯坦福吴恩达教授

發布時間:2025/4/5 编程问答 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 1.5 特征缩放-机器学习笔记-斯坦福吴恩达教授 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

特征縮放

引子

在前一章節中,對房屋售價進行預測時,我們的特征僅有房屋面積一項,但是,在實際生活中,臥室數目也一定程度上影響了房屋售價。下面,我們有這樣一組訓練樣本:

注意到,房屋面積及臥室數量兩個特征在數值上差異巨大,如果直接將該樣本送入訓練,則代價函數的輪廓會是“扁長的”,在找到最優解前,梯度下降的過程不僅是曲折的,也是非常耗時的:

縮放

該問題的出現是因為我們沒有同等程度的看待各個特征,即我們沒有將各個特征量化到統一的區間。量化的方式有如下兩種:

Standardization

Standardization 又稱為 Z-score normalization,量化后的特征將服從標準正態分布:
z=xi?μδz=\frac{x_i?μ}δz=δxi??μ?

其中, μμμδδδ 分別為對應特征 xix_ixi? 的均值和標準差。量化后的特征將分布在 [?1,1] 區間。

Min-Max Scaling

Min-Max Scaling 又稱為 normalization,特征量化的公式為:
z=xi?min(xi)max(xi)?min(xi)z=\frac {x_i?min(x_i)}{max(x_i)?min(x_i)}z=max(xi?)?min(xi?)xi??min(xi?)?

量化后的特征將分布在 [0,1] 區間。

大多數機器學習算法中,會選擇 Standardization 來進行特征縮放,但是,Min-Max Scaling 也并非會被棄置一地。在數字圖像處理中,像素強度通常就會被量化到 [0,1] 區間,在一般的神經網絡算法中,也會要求特征被量化到 [0,1] 區間。

進行了特征縮放以后,代價函數的輪廓會是“偏圓”的,梯度下降過程更加筆直,性能因此也得到提升:

代碼實現

在 regression.py 中,我們添加了 Standardization 和 Normalization 的實現:

# linear_regression/regression.py# ... def standardize(X):"""特征標準化處理Args:X: 樣本集Returns:標準后的樣本集"""m, n = X.shape# 歸一化每一個特征for j in range(n):features = X[:,j]meanVal = features.mean(axis=0)std = features.std(axis=0)if std != 0:X[:, j] = (features-meanVal)/stdelseX[:, j] = 0return Xdef normalize(X):"""特征歸一化處理Args:X: 樣本集Returns:歸一化后的樣本集"""m, n = X.shape# 歸一化每一個特征for j in range(n):features = X[:,j]minVal = features.min(axis=0)maxVal = features.max(axis=0)diff = maxVal - minValif diff != 0:X[:,j] = (features-minVal)/diffelse:X[:,j] = 0return X # ...

參考文獻

  • About Feature Scaling and Normalization
  • Wiki–Feature scaling

總結

以上是生活随笔為你收集整理的1.5 特征缩放-机器学习笔记-斯坦福吴恩达教授的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。