生活随笔
收集整理的這篇文章主要介紹了
面向中文自然语言处理的60余类系统开源实践项目与工业探索索引
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
面向中文自然語言處理的六十余類實踐項目及學習索引,涵蓋語言資源構建、社會計算、自然語言處理組件、知識圖譜、事理圖譜、知識抽取、情感分析、深度學習等幾個學習主題。包括作者個人簡介、學習心得、語言資源、工業落地系統等,是供自然語言處理入門學習者的一個較為全面的學習資源,歡迎大家使用,并提出批評意見。
項目類型中文名稱技術點 技術博客 技術落地與探索博客 技術博客、技術探索與應用實踐 技術公眾號 數地工場技術文章 面向事理圖譜、知識庫構建、社會計算等技術落地探索 現代打油詩集 現代詩集《聽說》 65首現代詩集,打油詩 自然語言處理語義平臺 數地工場 信息抽取、輿情分析、語義計算、信息采集類、問句解析類api 7*24小時實時抽象事理學習、搜索與關聯推理系統 學跡 實證學習,信息檢索、問答搜索,知識推理 尋鏈系統 事理圖譜Demo 前因后果模式的搜索展示 全行業實例事理搜索與關聯推理系統 數地搜搜 實時系統,事理應用,事件追蹤,事件檢索 在工業落地過程中與業界共享的圖譜數據 開放知識圖譜資源 知識庫數據,知識圖譜,開放共享
項目名稱中文名稱項目技術點 KnowledgeGraphSlides 知識圖譜CCKS會議報告合集(2013-2018) 知識圖譜, 學習資源 CCKS2018Summary CCKS2018會議總結 知識圖譜,個人心得 CCL2018Summary CCL2018參會總結 自然語言處理,心得
項目名稱中文名稱項目技術點 ChineseSemanticKB 中文處理的12類、百萬規模的語義常用詞典 中文處理的12類、百萬規模的語義常用詞典,支持句子擴展、轉寫、事件抽象與泛化 MiningZhiDaoQACorpus 知道類問答社區數據集 語言資源庫,語料庫,580萬問題,983萬問答對 CausalCollocation 頻繁因果詞對庫 語言資源庫,因果對 ChineseNLPCorpus 中文自然語言處理處理用語言資源 語言資源庫,語義庫,常用詞典, 語言資源觀, 語料庫 SentimentWordExpansion 情感詞擴展 SOPMI BaikeInfoExtraction 百科信息抽取 Urllib,xpath SougouWordCollector 搜狗詞庫自動構建 Urllib,Scrapy BaikeKnowledgeSchema 百科知識體系構建 Urllib,xpath,遞歸,知識庫本體概念
項目名稱中文名稱項目技術點 WordSegment 分詞 HMM, MAXCUT,Ngram HuanNLP 自然語言處理組件 HMM, maxent, CRF Pinyin2Chinese 拼音轉文字 Trie樹,HMM, bigram QueryCorrection 查詢糾錯 edit-distance ChineseCixing 中文詞形查詢 字形,音形 ChineseAntiword 中文反義詞查詢 反義詞
項目名稱中文名稱項目技術點 WordMultiSenseDisambiguation 中文多義詞詞義消歧 百科知識庫,詞義語義表示,詞義語義相似度計算 TextFeatureExtraction 文本特征提取 IG,CHI ,DF,MI WordCollocation 搭配抽取 MI KeyInfoExtraction 關鍵信息提取 TFIDF,TextRank EventTriplesExtraction 事件三元組提取 dependency parser
項目名稱中文名稱項目技術點 EventKGNELL 學跡事理實時知識庫終身學習 事件知識庫,實時學習,事件概念,事理邏輯,語言資源 AbstractKnowledgeGrap 抽象知識圖譜 抽象知識圖譜,抽象實體,抽象狀態,抽象動作 GoodsKG 電商商品概念與銷售知識圖譜 商品概念,商品類知識 ZhidaoChatbot 基于問答社區的邏輯知識問答 問答社區,邏輯問答 EventPredictBasedOnEG 基于事理圖譜的未來事件預測 事理圖譜,事件預測 QAonMilitaryKG 軍事知識圖譜與問答項目 知識圖譜,軍事,基于模板問答方式 TravelKnowledgeGraph 出行知識圖譜 路徑規劃,推薦,知識模型 PersonRelationKnowledgeGraph 中文人物關系圖譜 bootstrapping, 遠程監督, 訓練數據回標, 關系抽取 CrimeKgAssitant 法律罪行智能助手 知識圖譜, 智能預判, 自動問答 QASystemOnKG 醫療知識圖譜與自動問答 知識圖譜構建及自動問答 ComplexEventExtraction 復合事件圖譜 復合事件,條件事件、反轉事件抽取 CausalityEventExtraction 因果事件圖譜 因果圖譜,因果事件抽取 SequentialEventExtration 順承事件圖譜 動賓短語提取,事件圖譜 LanguageKnowledgeGraph 語言政策知識圖譜 Neo4j,Echarts,D3js HyponymyExtraction 上下位關系圖譜 模式匹配,上下位概念表示 MusicLyricChatbot 歌詞對對碰 es搜索,歌詞知識庫
項目名稱中文名稱項目技術點 IdealWordCloudKit 自定義形狀詞云項目 wordcloud, tfidf, 可視化 WeiboIndexSpyder 微博指數采集 selenium,xpath BaiduIndexSpyder 百度指數采集 xpath,selenium AliIndexSpyder 阿里指數采集 selenium,xpath DocSentimentAnalysis 基于句法依存的情感分析 Template, Dependencyparser LearningBasedSentiment 基于深度學習的情感分析 CNN,RNN,ML TextGrapher 文本結構化圖譜表示 EventExtraction,知識表示 ImportantEventExtractor 文本重要性計算 textrank ZhuguanDetection 文本主觀性計算 subjective knowledge base SentenceSimilarity 句子相似度計算 distance, hash, haiming ,eidtdistance TopicCluster 文本話題聚類 LDA,Kmeans EventMonitor 特定事件追蹤 新聞采集,事件監測架構,scrapy PoemMining 中國古代詩詞挖掘 語料庫構建,文本挖掘 LawCrimeMining 司法文本挖掘 語料庫構建,文本挖掘 ChineseHumorSentiment 中文幽默情緒計算 語料庫構建,幽默分類與情緒計算 LanguagePlatform 集成自然語言處理技術的語言平臺 Neo4j,Echarts,Django
項目名稱中文名稱項目技術點 ChineseTextualInference 中文文本蘊含/推理 Textual entailment, keras, 文本分類 SiameseSentenceSimilarity siamese相似問句匹配 siamese lstm network, keras, 文本分類 MedicalNamedEntityRecognition 中文電子病例命名實體識別 keras, bi-lstm-crf ChineseEmbedding 中文向量大全(字符向量、詞向量、拼音向量、依存向量、詞性向量) SKIP-GRAM,Co-Matrix Word2Vector 詞向量表示 CBOW, SKIP-GRAM,Co-Matrix Sentence2Vector 句子向量表示 CBOW Seq2SeqTranslation 端到端的翻譯模型 keras, lstm
劉煥勇, Liu Huanyong,2017年碩士畢業,目前就職于中國科學院軟件研究所,專注金融、情報兩大領域,從事事件抽取、事件演化、情感分析、事理(知識)圖譜、常識推理、語言資源構建與應用等研發工作。目前主持研發自然語言處理技術開放平臺數地工場、大規模實時事理知識學習系統學跡、全行業因果鏈查詢與溯源項目尋鏈系統,并在智能金融、智能情報落地中負責實施了多個項目。致力于面向中文處理的基礎知識庫建設與理論技術開源共享,目前累計對外開放自然語言處理實踐項目六十余個,在openkg開放知識圖譜聯盟中開放工業應用知識庫七類,主筆數地工場技術類系列文章二十余篇。
郵箱:lhy_in_blcu@126.com
地址:北京市海淀區中關村南四街4號
github:https://github.com/liuhuanyong
總結
以上是生活随笔 為你收集整理的面向中文自然语言处理的60余类系统开源实践项目与工业探索索引 的全部內容,希望文章能夠幫你解決所遇到的問題。
如果覺得生活随笔 網站內容還不錯,歡迎將生活随笔 推薦給好友。