facets学习(1):什么是facets
ML 數(shù)據(jù)集可以包含數(shù)億個(gè)數(shù)據(jù)點(diǎn),每個(gè)數(shù)據(jù)點(diǎn)由數(shù)百(甚至數(shù)千)的特征組成,幾乎不可能以直觀的方式了解整個(gè)數(shù)據(jù)集。為幫助理解、分析和調(diào)試 ML 數(shù)據(jù)集,谷歌開源了 Facets,一款可視化工具。
Facets 包含兩個(gè)部分 —— Facets Overview 和 Facets Dive ,允許用戶以不同的粒度查看其數(shù)據(jù)的整體圖像。Facets Overview 可用于可視化數(shù)據(jù)的每一個(gè)特征,F(xiàn)acets Dive 用來(lái)探索個(gè)別的數(shù)據(jù)觀察集。
可視化的部分是通過(https://www.polymer-project.org)Polymer web components來(lái)實(shí)現(xiàn)的。后來(lái)采用的開發(fā)語(yǔ)言是TS(可惡,為啥不是JS,還要去學(xué)習(xí))。
而且,很容易的就可以嵌入到j(luò)upyter notebooks(使用python的我樂了)或者嵌入到web網(wǎng)頁(yè)中。
具體的demo可以訪問網(wǎng)頁(yè):https://pair-code.github.io/facets/
Facets Overview可以讓用戶快速了解其數(shù)據(jù)集特征值的分布情況,可以在相同的可視化上比較多個(gè)數(shù)據(jù)集,例如訓(xùn)練集和測(cè)試集。阻礙機(jī)器學(xué)習(xí)的常見數(shù)據(jù)問題被推到最前端,比如出乎意料的特征值、具有高比例遺失值的特征、帶有不平衡分布的特征,數(shù)據(jù)集之間的特征分布偏差等等。
Facets Dive 則提供了一個(gè)易于定制的直觀界面,用于探索數(shù)據(jù)集中不同特征數(shù)據(jù)點(diǎn)之間的關(guān)系。它是一種交互式探索多達(dá)數(shù)萬(wàn)個(gè)數(shù)據(jù)點(diǎn)的工具,允許用戶在高級(jí)概述和低級(jí)細(xì)節(jié)之間進(jìn)行無(wú)縫切換。通過 Facets Dive,你可以控制位置、顏色和視覺表現(xiàn)。每個(gè)示例在可視化中被表示為單個(gè)項(xiàng)目,并且可以通過其特征值在多個(gè)維度上通過 faceting/bucketing 來(lái)定位點(diǎn)。通過結(jié)合細(xì)分和過濾,Dive 可以輕松地在復(fù)雜數(shù)據(jù)集中識(shí)別樣式和異常值。
總結(jié)
以上是生活随笔為你收集整理的facets学习(1):什么是facets的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 安装SPSS22_SPSS 24安装教程
- 下一篇: 使用命令行加载 jMeter 自定义配置