日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

R学习之——R用于文本挖掘(tm包)

發布時間:2023/12/19 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 R学习之——R用于文本挖掘(tm包) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?

首先需要安裝并加載tm包。


?

1、讀取文本

x = readLines("222.txt")

2、建立語料庫

> r=Corpus(VectorSource(x))> rA corpus with 7012 text documents

3、語料庫輸出,保存到硬盤

> writeCorpus(r)

?

4、查看語料庫

> print(r) A corpus with 7012 text documents > summary(r) A corpus with 7012 text documentsThe metadata consists of 2 tag-value pairs and a data frame Available tags are:create_date creator Available variables in the data frame are:MetaID

? > inspect(r[2:2])
? A corpus with 1 text document

? The metadata consists of 2 tag-value pairs and a data frame
? Available tags are:
? create_date creator
? Available variables in the data frame are:
? MetaID

? [[1]]
? Female; Genital Neoplasms, Female/*therapy; Humans

? > r[[2]]
? Female; Genital Neoplasms, Female/*therapy; Humans

5、建立“文檔-詞”矩陣

> dtm = DocumentTermMatrix(r) > head(dtm) A document-term matrix (6 documents, 16381 terms)Non-/sparse entries: 110/98176 Sparsity : 100% Maximal term length: 81 Weighting : term frequency (tf)

6、查看“文檔-詞”矩陣

> inspect(dtm[1:2,1:4])

7、查找出現200次以上的詞

> findFreqTerms(dtm,200)[1] "acute" "adjuvant" "advanced" "after" [5] "and" "breast" "cancer" "cancer:" [9] "carcinoma" "cell" "chemotherapy" "clinical" [13] "colorectal" "factor" "for" "from" [17] "group" "growth" "iii" "leukemia" [21] "lung" "lymphoma" "metastatic" "non-small-cell" [25] "oncology" "patients" "phase" "plus" [29] "prostate" "randomized" "receptor" "response" [33] "results" "risk" "study" "survival" [37] "the" "therapy" "treatment" "trial" [41] "tumor" "with"

7、移除出現次數較少的詞

inspect(removeSparseTerms(dtm, 0.4))

8、查找和“stem”的相關系數在0.5以上的詞

> findAssocs(dtm, "stem", 0.5)stem cells 1.00 0.61

?9、計算文檔相似度(用cosine計算距離)

> dist_dtm <- dissimilarity(dtm, method = 'cosine') > head(dist_dtm) [1] 1.0000000 0.7958759 0.8567770 0.9183503 0.9139337 0.9309934

10、聚類

> hc <- hclust(dist_dtm, method = 'ave') > plot(hc,xlab='')

?

?

? ? ?

轉載于:https://www.cnblogs.com/todoit/archive/2012/07/13/2589741.html

總結

以上是生活随笔為你收集整理的R学习之——R用于文本挖掘(tm包)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 刘玥91精选国产在线观看 | 91精品婷婷国产综合久久蝌蚪 | 裸尼姑熟蜜桃 | 亚洲精品国产成人av在线 | xxxxx毛片| 麻豆av在线 | 激情欧美一区二区三区 | 日韩城人视频 | 丰满熟女人妻一区二区三 | 国产亚洲福利 | av资源在线 | 亚洲国产日韩精品 | 中国老熟女重囗味hdxx | 艳妇乳肉豪妇荡乳av | 7788色淫网站小说 | 99久热在线精品996热是什么 | 激情五月色婷婷 | 亚洲黄色免费在线观看 | 精品国产一区二区三区日日嗨 | 91中文在线| 国产在线啪 | 韩国精品久久久 | 看片国产 | 日本二区视频 | 国产中文字幕精品 | 性生生活大片又黄又 | 色就是色网站 | 黄色二级视频 | 永久免费精品视频 | 素人fc2av清纯18岁 | 日日日日干 | 玉蒲团在线 | 蜜桃av噜噜一区二区三区 | 午夜在线视频观看 | 色婷婷导航 | 丰满岳乱妇在线观看中字无码 | 911色| 少妇裸体淫交视频免费看高清 | 国产一区二区视频免费在线观看 | 不卡视频一区二区三区 | 欧美黄色特级视频 | 中文字幕一区二区视频 | 香蕉视频网址 | 国产情侣一区 | 农夫色综合 | 老王66福利网 | 欧美另类videos | 亚洲av无码专区国产乱码不卡 | 亚洲第6页 | 日韩一区免费 | 少妇激情网 | 99精品国自产在线 | 午夜伦理一区二区 | 日韩va在线观看 | 美女露胸露尿口 | 最近中文字幕在线观看视频 | 91香蕉国产 | 国产一区视频网站 | 中国亚洲老头同性gay男男… | 亚洲国产精华液网站w | 在线一二区 | gogo亚洲国模私拍人体 | 99久久99久久精品国产片果冰 | 日本黄色三级 | 国产在线小视频 | 在线观看中文字幕 | 又黄又爽又色的视频 | 极品销魂美女一区二区三区 | 久久成人黄色 | 色诱久久av| 成人在线观看免费高清 | 毛片基地免费观看 | 国产精品久久久久影院 | 国产精品久线在线观看 | 日本另类视频 | 国产精品一区二区三区四区 | 亚洲成人网页 | 91精品国产自产91精品 | 免费成人av网址 | 麻豆综合网 | 亚洲色偷偷色噜噜狠狠99网 | 精品视频在线免费看 | 日韩一区在线播放 | av在线有码 | 日韩精品福利视频 | 日本一区二区在线免费 | 中文字幕精品久久久久人妻红杏ⅰ | 亚洲国产精品久久精品怡红院 | 中文字幕日本一区二区 | 黄色亚洲视频 | 亚洲AV午夜成人片 | 欧美日韩在线播放视频 | 婷婷视频一区 | 国产精品久久无码一三区 | 欧美精品一区二区三区久久久 | 久久久久国产精品国产 | 色骚网| 国产自产一区二区 | 日韩αv|