日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > python >内容正文

python

python分类时特征选择_关于python:是否有可用于分类数据输入的特征选择算法?...

發(fā)布時(shí)間:2025/3/15 python 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python分类时特征选择_关于python:是否有可用于分类数据输入的特征选择算法?... 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

我正在訓(xùn)練一個(gè)具有10個(gè)左右分類輸入的神經(jīng)網(wǎng)絡(luò)。 在對這些分類輸入進(jìn)行一次熱編碼之后,我最終將大約500個(gè)輸入饋入網(wǎng)絡(luò)。

我希望能夠確定我每個(gè)分類輸入的重要性。 Scikit-learn具有許多功能重要性算法,但是這些算法中的任何一種都可以應(yīng)用于分類數(shù)據(jù)輸入嗎? 所有示例均使用數(shù)字輸入。

我可以將這些方法應(yīng)用于"一鍵編碼"輸入,但是在應(yīng)用于二進(jìn)制輸入后如何提取含義? 如何判斷分類輸入中的特征重要性?

Ive已成功使用支持discrete_features=True的mutual_info_score。

看看scikit-learn.org/stable/modules/

謹(jǐn)慎使用單點(diǎn)編碼,因?yàn)槟鷮⑻卣骺臻g的維數(shù)增加了50倍。您還可以考慮使用隨機(jī)森林而不是神經(jīng)網(wǎng)絡(luò),因?yàn)殡S機(jī)森林方法具有內(nèi)置的特征重要性表征。

感謝您的意見。 @IgorRaush,我可以像這樣使用common_info_classif函數(shù):l_importance = mutual_info_classif(X, y, discrete_features=True)但是可以確認(rèn)我在X數(shù)組中編碼離散特征的方式。顯然,它必須是一個(gè)numpy數(shù)組,因此大多數(shù)輸入都必須進(jìn)行編碼。我可以使用離散索引嗎?如果我對輸入進(jìn)行了二值化,那么將很難從功能輸出中提取含義,因?yàn)楣δ苁侨绱朔蛛x。如果這些是我的輸入:X = [[A, X, alpha], [B, X, beta], [B, Y, gamma]]我將如何編碼?謝謝 -

@VivekKumar感謝您的回復(fù)。我知道如何編碼分類輸入。您是否暗示最佳實(shí)踐是在單熱編碼輸入上運(yùn)行標(biāo)準(zhǔn)特征選擇算法?如果是這種情況,您將如何包裝輸出以確定每個(gè)功能的重要性,而不是確定每個(gè)熱編碼列的重要性?謝謝

@ A555h5似乎實(shí)際上并不需要是一個(gè)Numpy數(shù)組,您提供的列表也可以作為輸入正常工作(盡管您可以將Numpy數(shù)組與dtype=np.str一起使用,該數(shù)組包含字符串并且也可以使用)。

通常,對于這種情況,您將使用索引編碼,其中分類功能的每個(gè)級別都映射到整數(shù)0、1等。請查看Scikit-learn中的LabelEncoder或Pandas中的分類系列。

在回答您對Vivek的問題時(shí),這取決于您要完成的工作。您可以使用重要性度量來修剪整個(gè)功能("功能選擇"),也可以一鍵編碼它們并僅修剪某些級別("值選擇")。我見過兩種使用方法。

感謝您的回答@IgorRaush-一個(gè)快速的問題。如果我在同一數(shù)據(jù)集中混合了分類特征和數(shù)字特征,那么該如何編碼?我想一起考慮它們,因?yàn)槲倚枰私馑鼈冎g的相互影響。我應(yīng)該將數(shù)字視為分類數(shù)字(因?yàn)槭シ?#xff0c;這似乎是錯(cuò)誤的),還是對分類數(shù)字使用索引編碼方法并與數(shù)字結(jié)合?再次感謝

在某些情況下,在進(jìn)入scikit-learn之前可能值得探索您的數(shù)據(jù)集。我通常使用Wekas GUI玩一些。在Weka中,您可以使用多種算法來可視化和評估特征。如果數(shù)據(jù)集太大,則將其稍微修剪一下。在此處獲取Weka:cs.waikato.ac.nz/ml/weka有關(guān)此處的屬性選擇的更多信息:wiki.pentaho.com/display/DATAMINING/Attribute+Selection

由于編碼特征之間的關(guān)系,在一種熱編碼上使用特征選擇算法可能會(huì)導(dǎo)致錯(cuò)過。例如,如果您將n個(gè)值的特征編碼為n個(gè)特征,并且已選擇m個(gè)中的n-1個(gè),則不需要最后一個(gè)特征。

由于您的功能數(shù)量很少(?10),因此功能選擇對您的幫助不大,因?yàn)槟赡苤荒軠p少其中的幾個(gè)而不會(huì)丟失太多信息。

您寫道,一種熱編碼將10個(gè)要素轉(zhuǎn)換為500個(gè),這意味著每個(gè)要素都有大約50個(gè)值。在這種情況下,您可能會(huì)對離散化算法更感興趣,可以對值本身進(jìn)行操作。如果值隱含順序,則可以對連續(xù)特征使用算法。另一種選擇是簡單地忽略稀有值或與概念沒有強(qiáng)相關(guān)性的值。

如果您使用特征選擇,則大多數(shù)算法將對分類數(shù)據(jù)起作用,但您應(yīng)提防極端情況。例如,@ Igor Raush建議的相互信息是一種很好的措施。但是,具有許多值的特征往往比具有較少值的特征具有更高的熵。反過來,這可能會(huì)導(dǎo)致更高的相互信息,并會(huì)偏向許多價(jià)值特征。一種解決此問題的方法是通過將互信息除以特征熵來進(jìn)行歸一化。

可能會(huì)幫助您的另一套功能選擇算法是包裝器。他們實(shí)際上將學(xué)習(xí)委托給分類算法,因此,只要分類算法可以應(yīng)對,它們就不會(huì)影響表示。

總結(jié)

以上是生活随笔為你收集整理的python分类时特征选择_关于python:是否有可用于分类数据输入的特征选择算法?...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产亚洲精品aaaaaaa片 | 精品一区二区在线播放 | 久久精品视频3 | 日韩黄色一区二区 | 国精品人妻无码一区二区三区喝尿 | 国产xxxx做受性欧美88 | 日韩综合在线视频 | 精品三级| 午夜小电影 | 久在操 | 国产成人在线一区二区 | 深夜福利在线免费观看 | 麻豆av网站 | 婷婷影视| 欧美视频一区二区三区四区 | 在线免费你懂的 | 欧美色视频在线 | 成人黄色大片 | 少妇床戏av | 亚洲精品99久久久久中文字幕 | 国产精品系列在线 | 久久精品亚洲无码 | 青娱乐导航| 一及黄色大片 | 男人天堂2024 | 美女88av | 好吊色视频988gao在线观看 | 欧美午夜精品久久久久久浪潮 | 动漫精品一区二区三区 | 黄色小视频国产 | 欧美在线天堂 | 欧美日韩一区二区三区四区五区六区 | 在线观看免费国产视频 | 黄色一几片| 少妇无码吹潮 | 青青草国产一区二区三区 | 99精品久久久久久久婷婷 | 国产乱人伦app精品久久 | 在线免费观看污网站 | 国产一区二区视频网站 | 九九九亚洲 | 天堂在线视频tv | 欧洲午夜视频 | 夜夜摸夜夜爽 | 四虎黄色网址 | 污视频网站免费观看 | 国产成人一区二区三区小说 | 久久精品—区二区三区舞蹈 | 日韩欧洲亚洲AV无码精品 | 色播99| 在线视频福利 | 岛国精品一区二区三区 | 亚洲欧美日韩在线播放 | 国产一级在线观看视频 | 调教小屁屁白丝丨vk | 隔壁邻居是巨爆乳寡妇 | 精品久久久久中文慕人妻 | 少妇一区二区视频 | 国产精品 欧美 日韩 | 一本大道东京热无码 | 欧美另类第一页 | 美乳人妻一区二区三区 | 伊人久久青青草 | 亚洲天堂一区二区三区 | 91精品91久久久中77777 | 一区在线观看 | 少妇高潮惨叫久久久久 | caoprom超碰| 色妞网 | 亚洲国产精品视频一区二区 | 韩国黄色网| 韩国三级在线 | a级一级片| 中文字幕一区二区三区久久久 | 日韩少妇av | 99福利影院 | 不卡的在线视频 | 天堂视频免费在线观看 | 国产成人午夜精华液 | 激情都市一区二区 | 黄色网址在线免费 | 精品人妻无码一区二区三区蜜桃一 | 国产精品视频在线观看免费 | 中文字幕有码无码人妻av蜜桃 | 影音先锋男人的天堂 | 天干夜天干天天天爽视频 | 风韵丰满熟妇啪啪区老熟熟女 | 99免费精品 | 少妇超碰 | 97伦伦午夜电影理伦片 | 天天搞天天 | 成人在线视频一区二区 | 五月婷婷操 | 少妇高潮网站 | 精品综合久久久 | 91视频论坛| 精品人妻一区二区三区久久夜夜嗨 | 欧美成人综合一区 | 国产乱淫视频 |