知远点评
- 作者劉知遠 weibo:http://weibo.com/zibuyu9? 主頁:http://nlp.csai.tsinghua.edu.cn/~lzy ?
- 翟成祥老師早期在語言模型的工作很有影響力,他在2009年寫過一本綜述專著:Statistical Language Models for Information Retrieval,建議閱讀。
- 北大?@BatmanFly?(現在是人大老師啦)他們做的Knowledge Sharing via Social Login: Exploiting Microblogging Service for Warming up Social Question Answering Websites在微博和知乎之間建立了語義聯系,也是很贊的角度。http://t.cn/RPOzhh4
- COLING 2014論文集:http://t.cn/RPpdIIk?,首先要去看今年最佳論文,中科院自動化所?@劉康_自動化所?趙軍老師團隊的大作:Relation Classification via Convolutional Deep Neural Network。:)
- 斯坦福Richard Socher在EMNLP2014發表新作:GloVe: Global Vectors for Word Representation 粗看是融合LSA等算法的想法,利用global word co-occurrence信息提升word vector學習效果,很有意思,在word analogy task上準確率比word2vec提升了11%。?http://t.cn/RPohHyc
- 哈工大@張牧宇-哈工大SCIR?的Triple based Background Knowledge Ranking for Document Enrichment利用knowledge triple表示文檔,與今年WSDM的Knowledge-based Graph Document Modeling有異曲同工之妙。
- 發現哈工大的這篇 Learning Sense-specific Word Embeddings By Exploiting Bilingual Resources 利用雙語數據學習詞義表示。多語角度很有意思。
- ?MSRA A Probabilistic Model for Learning Multi-Prototype Word Embeddings,基于skip-gram采用概率模型和EM算法解決一詞多義的表示問題。
- @周光有_CAS?和趙軍老師在社區問答系統上的工作:Group Non-negative Matrix Factorization with Natural Categories for Question Retrieval in Community Question Answer Archives。最近word embedding和NMF都開始在NLP領域大顯身手了。
- IBM有篇Deep Convolutional Neural Networks for Sentiment Analysis of Short Texts,在Fine-Grained的評測上效果比Socher的RNTN高大約3個百分點不到。
- MSRA有篇 A Probabilistic Model for Learning Multi-Prototype Word Embeddings,基于skip-gram采用概率模型和EM算法解決一詞多義的表示問題。這個問題很有實用價值。@陳新雄_THU?也將在今年EMNLP展示我們組在這方面的工作:A Unified Model for Word Sense Representation and Disambiguation。
- 哈工大和MSRA合作的 Building Large-Scale Twitter-Specific Sentiment Lexicon : A Representation Learning Approach 想法也很有意思,利用word embedding技術構建情感詞典。作者?@唐都鈺HIT-SCIR?今年還有篇ACL和EMNLP,都是以情感分析為主題,國內NLP新星啊。:)
- 謝?@劉康_自動化所?推介。Jiawei Han老師綜述介紹得非常全面,建議以此為入口學習。我們組司憲策師兄博士論文也以此為主題,中文寫的比較好讀,下載地址http://t.cn/8F1qSPX?。社會標簽可從兩個角度思考,一是ML角度可看做多標簽分類問題,二是NLP角度可看做關鍵詞產生問題,都有大量前人工作參考。
- Richard Socher一如既往很有誠意地放出了代碼和數據,大家快圍觀:?http://t.cn/RPohHyc
- David Blei組提出主題模型新概念:Real-time Topic Models for Crisis Counseling。好像是KDD短文。http://t.cn/RPohSwB
- Barabasi團隊把“魔爪”伸向了歷史學:A network framework of cultural history發表在最近Science雜志的Quantitative Social Science欄目。
- IEEE TKDE上的一篇綜述:A Review on Multi-Label Learning Algorithmshttp://t.cn/RPirZh6?@張敏靈-SEU?老師和?@南大周志華?老師的工作,關注。
總結
- 上一篇: Prescan问题及处理办法汇总
- 下一篇: 阿里 2 年内市值将赶超苹果;腾讯回应吃