日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据挖掘学习日志(part1)--熵值法

發(fā)布時間:2023/12/19 编程问答 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据挖掘学习日志(part1)--熵值法 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

學(xué)習(xí)筆記,僅供參考


熵值法


信息熵介紹


信息熵是將系統(tǒng)無序程度的度量,信息是系統(tǒng)有序程度的度量,二者絕對值相等但符號相反,某項指標(biāo)的指標(biāo)值變異程度越大,信息熵就越小,該指標(biāo)提供的信息量就越大,該指標(biāo)的權(quán)重也應(yīng)越大;反之,某項指標(biāo)的指標(biāo)值變異程度越小,信息熵越大,該指標(biāo)提供的信息量越小,該指標(biāo)的權(quán)重也應(yīng)越小。

計算步驟


首先,我們由于指標(biāo)體系中的各個指標(biāo)的量綱、數(shù)量級不同,我們需要對它們進(jìn)行無量綱化處理,具體方法如下:

Positiveindicators:xij′=xij?xminxmax?xminNegativeindex:xij′=xmax?xijxmax?xminPositive \; indicators:x'_{ij} = \frac{x_{ij}-x_{min}}{x_{max}-x_{min}} \\Negative \; index: x'_{ij} = \frac{x_{max}-x_{ij}}{x_{max}-x_{min}} Positiveindicators:xij?=xmax??xmin?xij??xmin??Negativeindex:xij?=xmax??xmin?xmax??xij??

其中,xijx_{ij}xij?為第iii個樣本第jjj個指標(biāo)的指標(biāo)值,xmaxx_{max}xmax?為第jjj個指標(biāo)的最大值,xminx_{min}xmin?為第jjj個指標(biāo)的最小值,其中有mmm個樣本,nnn個指標(biāo)。


根據(jù)各項指標(biāo)值的變異程度,利用信息熵工具,計算出各指標(biāo)權(quán)重,具體步驟為:

  • 將各指標(biāo)同度量化,計算第jjj項指標(biāo)下第iii個樣本指標(biāo)值的比重

pij=xij∑i=1mxijp_{ij}= \frac{x_{ij}}{\sum_{i=1}^m x_{ij}} pij?=i=1m?xij?xij??

  • 計算第jjj項指標(biāo)的熵值eje_jej?

$$ e_j = -k \sum_{i=1}^m p_{ij}lnp_{ij} $$

其中,k>0k>0k>0ej≥0e_j \ge 0ej?0,如果xijx_{ij}xij?對于給定的jjj全部相等。則pij=1mp_{ij}=\frac{1}{m}pij?=m1?,此時eje_jej?取極大值,即:


ej=?k∑i=1m1mln1m=klnme_j = -k \sum_{i=1}^m \frac{1}{m} ln \frac{1}{m} = klnm ej?=?ki=1m?m1?lnm1?=klnm

若設(shè)k=1lnmk=\frac{1}{lnm}k=lnm1?,于是有0≤ej≤10\le e_j \le 10ej?1.


  • 計算第jjj項指標(biāo)的差異性系數(shù)gig_igi?


gj=1?ejg_j=1-e_j gj?=1?ej?


  • 對于差異性系數(shù)進(jìn)行歸一化,可計算出各指標(biāo)的權(quán)重

wj=gj∑k=1mgkw_j = \frac{g_j}{\sum_{k=1}^m g_k} wj?=k=1m?gk?gj??


總結(jié)

以上是生活随笔為你收集整理的数据挖掘学习日志(part1)--熵值法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。