关于数据预处理的一些想法
生活随笔
收集整理的這篇文章主要介紹了
关于数据预处理的一些想法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
今天在做數據預處理進行數據變換這步的時候,一直卡著,主要因為對于數據維度的確定老是拿不準。
數據預處理的步驟一般是初始數據源的獲取、數據清理、數據集成、數據融合、數據轉換、數據規約。
數據變換是采用線性或非線性的變換方法將高緯度的數據變為低緯度的數據,雖然對原來的數據有一定的損害,但是往往有更大的實用性。其方法分類有:將連續數據進行離散化、將數據匯總、選擇特定區域的數據、構建新屬性。
個人覺得不論方法有多少,做這不首要的方法是將最基本的特征區域屬性確定下來,再進行數據轉換,不然這步做起來往往會不斷重復著做,很麻煩,哎!
轉載于:https://www.cnblogs.com/CQ-LQJ/p/4921538.html
總結
以上是生活随笔為你收集整理的关于数据预处理的一些想法的全部內容,希望文章能夠幫你解決所遇到的問題。