【数据挖掘笔记十三】数据挖掘的发展趋势和研究前沿
13.數(shù)據(jù)挖掘的發(fā)展趨勢(shì)和研究前沿
1、挖掘復(fù)雜數(shù)據(jù)類型,包括挖掘序列數(shù)據(jù),如符合序列和生物學(xué)序列;挖掘圖和網(wǎng)絡(luò);挖掘其他類型的數(shù)據(jù),包括時(shí)間空間數(shù)據(jù)、信息物理系統(tǒng)數(shù)據(jù)、多媒體數(shù)據(jù)、文本和web數(shù)據(jù),以及數(shù)據(jù)流。
2、數(shù)據(jù)分析提出廣泛認(rèn)可的統(tǒng)計(jì)學(xué)方法,如回歸、廣義線性模型、方差分析、混合效應(yīng)模型、因素分析、判別分析、生存分析和質(zhì)量控制。
3、數(shù)據(jù)挖掘的理論基礎(chǔ),基于數(shù)據(jù)歸約、數(shù)據(jù)壓縮、概率統(tǒng)計(jì)理論、微觀經(jīng)濟(jì)學(xué)理論和基于模式發(fā)現(xiàn)的歸納數(shù)據(jù)庫。
4、可視數(shù)據(jù)挖掘集成數(shù)據(jù)挖掘和數(shù)據(jù)可視化,以便從大型數(shù)據(jù)集中發(fā)現(xiàn)隱藏的、有用知識(shí)。可視數(shù)據(jù)挖掘包括數(shù)據(jù)可視化、數(shù)據(jù)挖掘結(jié)果可視化、數(shù)據(jù)挖掘過程可視化和交互的可視數(shù)據(jù)挖掘。聽覺數(shù)據(jù)挖掘使用音頻信號(hào)指示數(shù)據(jù)挖掘結(jié)果中的模式或特征。
5、特定領(lǐng)域的數(shù)據(jù)挖掘工具,包括金融、零售和電信業(yè)、科學(xué)與工程、入侵檢測(cè)和預(yù)防,以及推薦系統(tǒng)。基于應(yīng)用領(lǐng)域的研究把特定領(lǐng)域的知識(shí)和數(shù)據(jù)分析技術(shù)結(jié)合起來,并提供了特定用途的數(shù)據(jù)挖掘解決方案。
6、普適的數(shù)據(jù)挖掘是指數(shù)據(jù)挖掘出現(xiàn)在日常中,如購物、工作、搜索。在無形的數(shù)據(jù)挖掘中,智慧軟件,如搜索引擎、顧客自適應(yīng)web服務(wù)(如推薦算法)、電子郵件管理器等,把數(shù)據(jù)挖掘結(jié)合到它們的功能模塊中,卻不為用戶所察覺。
7、數(shù)據(jù)挖掘帶來的主要社會(huì)關(guān)注是隱私和數(shù)據(jù)安全問題。保護(hù)隱私的數(shù)據(jù)挖掘處理合法的數(shù)據(jù)挖掘得到的結(jié)果,而不泄露底層敏感的數(shù)據(jù)值。它的目標(biāo)是保持?jǐn)?shù)據(jù)挖掘結(jié)果的總體質(zhì)量的同時(shí)保護(hù)隱私和確保安全。
8、數(shù)據(jù)挖掘的發(fā)展趨勢(shì)包括新應(yīng)用領(lǐng)域的探索,提高可伸縮性、交互性和基于約束的挖掘方法;數(shù)據(jù)挖掘與Web服務(wù)、數(shù)據(jù)庫、數(shù)據(jù)倉庫和云計(jì)算系統(tǒng)的集成;挖掘社會(huì)和信息網(wǎng)絡(luò)。其他的趨勢(shì)除了Web挖掘、分布式的和實(shí)時(shí)的挖掘、可視和聽覺挖掘、數(shù)據(jù)挖掘中的隱私和安全性外,還包括時(shí)間空間數(shù)據(jù)、物聯(lián)網(wǎng)系統(tǒng)數(shù)據(jù)、生物學(xué)數(shù)據(jù)、軟件/系統(tǒng)工程數(shù)據(jù)、多媒體和文本數(shù)據(jù)挖掘。
?
總結(jié)
以上是生活随笔為你收集整理的【数据挖掘笔记十三】数据挖掘的发展趋势和研究前沿的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【数据挖掘笔记十二】离群点检测
- 下一篇: 最大似然估计MLE和最大后验估计MAP理