本周 Github 精选:13 款炼丹利器,有开源工具包也有超大数据集
在碎片化閱讀充斥眼球的時代,越來越少的人會去關注每篇論文背后的探索和思考。
在這個欄目里,你會快速 get 每篇精選論文的亮點和痛點,時刻緊跟 AI 前沿成果。
點擊本文底部的「閱讀原文」即刻加入社區,查看更多最新論文推薦。
這是 PaperDaily 的第?65?篇文章#Swift for TensorFlow
Swift for TensorFlow 為 TensorFlow 提供了一種新的編程模型,將 TensorFlow 計算圖與 Eager Execution 的靈活性和表達能力結合在了一起,同時還注重提高整個軟件架構每一層的可用性。
本項目的設計基礎是 Graph Program Extraction 算法,它可以讓你用 Eager Execution 式的編程模型來輕松地實現代碼,同時還保留 TensorFlow 計算圖的高性能優勢。此外,本項目還將高級的自動微分功能直接集成在了 Swift 語言和編譯器里面。
項目鏈接
https://github.com/tensorflow/swift
#可視化降維Python工具包
HyperTools 是一個具有可視化功能的降維工具包,其基本流程是輸入高維數據,調用降維函數,同時進行繪圖。
▲?效果展示
項目鏈接
https://github.com/ContextLab/hypertools
GluonNLP
#NLP深度學習工具包
GluonNLP 提供了 NLP 方向的頂尖深度學習模型實現,并且構建了文本數據管道和模型的模塊。它專門面向工程師、研究人員和學者設計,大家可以基于這些模型快速實現研究思路,做出產品原型。
該項目具有如下特征:?
1. 訓練腳本來重現論文中的 state-of-the-art 結果;?
2. 針對常見 NLP 任務的預訓練模型;?
3. 精心設計的 API,可以極大減少實現的復雜性;?
4. 中文社區支持。
▲?案例展示
項目鏈接
https://github.com/dmlc/gluon-nlp
#CV深度學習工具包
GluonCV 提供了 CV 方向的頂尖深度學習模型實現。該項目能幫助工程師、研究人員和學者快速打造產品原型、驗證新思路以及學習計算機視覺。
該工具包提供如下功能:
1. 近年重要論文的復現;
2. 詳細文檔提供使用說明和代碼講解;
3. 提供預訓練的模型可以直接使用;
4. 性能評測,方便大家在不同模型之間做取舍;
5. 每個模型實現和接口盡量保證一致性,降低使用新模型的學習門檻;
6. 定時做重新訓練保證代碼正確性;
7. 中文社區支持。
▲?案例展示
項目鏈接
https://github.com/dmlc/gluon-cv
#PyTorch版Keras API:?model.summary()?
Keras 框架有一個用于模型可視化的簡潔 API —— model.summary(),本項目實現了用于 PyTorch 框架中的 model.summary() 功能,用于輸出模型各層的詳細參數。
▲?效果展示
項目鏈接
https://github.com/sksq96/pytorch-summary
#基于PyTorch的Neural版本CRF++
本項目是基于 PyTorch 的神經網絡序列標注開源庫,包含了幾種最先進的神經網絡序列標注模型(LSTMCRF, CNNCRF 等),算是神經網絡版的 CRF++。它可以讓用戶快速重現論文中的模型(如 Ma et. al ACL 2016; Lample et. al NAACL2016)。
該項目具有以下幾個特點:?
1. 無需寫代碼:只要通過修改配置文件就可以對模型的結構進行配置,無需任何代碼工作;
2. 自由添加特征:該項目不僅集成了幾種經典的特征結構(如 char-lstm, char-gru, char-cnn)還可以添加自定義的特征并初始化特征向量;
3. 高效準確:利用該開源庫可以輕松重現之前的多篇論文的結果,大部分情況下會得到比論文更高的精度。同時該項目時完全基于 batch 計算實現的,因此計算速度很快(2000 句/秒);
4. Nbest 輸出:其 CRF 結構支持輸出 top-n 個最優 label 序列,并給出對應的序列概率。
▲?結構設計
項目鏈接
https://github.com/jiesutd/NCRFpp
#IBM開源對抗機器學習庫
Adversarial Robustness Toolbox 是由 IBM 團隊開源的對抗機器學習庫,其主要用于檢測模型及對抗攻擊,為開發人員加強 AI 模型被誤導的防御性,讓 AI 系統變得更加安全。
本項目實現了以下分類器攻防方法:
攻擊:
Deep Fool (Moosavi-Dezfooli et al., 2015)?
Fast Gradient Method (Goodfellow et al., 2014)?
Jacobian Saliency Map (Papernot et al., 2016)?
Universal Perturbation (Moosavi-Dezfooli et al., 2016)?
Virtual Adversarial Method (Moosavi-Dezfooli et al., 2015)?
C&W Attack (Carlini and Wagner, 2016)?
NewtonFool (Jang et al., 2017)
防御:
Feature squeezing (Xu et al., 2017)
Spatial smoothing (Xu et al., 2017)
Label smoothing (Warde-Farley and Goodfellow, 2016)
Adversarial training (Szegedy et al., 2013)
Virtual adversarial training (Miyato et al., 2017)
項目鏈接
https://github.com/IBM/adversarial-robustness-toolbox
#可以進行訓練的聊天機器人
本項目是一個可以自己進行訓練的聊天機器人,可以根據自己的語料訓練出想要的對話機器人。本次訓練的語料是從互聯網上找到的 shooter 訓練語料,語料質量很差勁,僅作為演示代碼來用,大家可以使用自己的語料。
項目鏈接
https://github.com/zhaoyingjun/chatbot
SparkFlow
#基于Spark平臺的TensorFlow實現
SparkFlow 是一個基于 Spark 平臺的 TensorFlow 實現,讓用戶更方便在 Spark 上部署 TensorFlow 程序,更好地利用分布式平臺進行深度學習模型的訓練。
▲?MNIST深度學習示例
項目鏈接
https://github.com/lifeomic/sparkflow
#模擬任何Twitter用戶發推文
Tweet Generator 是一個模擬 Twitter 用戶風格生成推文的工具。本項目基于 textgenrnn,并使用上下文標簽對網絡進行訓練以獲得更好的推文合成。
textgenrnn 是一個基于 Keras 和 TensorFlow 的 Python 3 模塊,只需幾行代碼即可訓練文本生成網絡。
▲?效果展示
項目鏈接
https://github.com/minimaxir/tweet-generator
DL Project Template
#深度學習工程模板
本項目是由美圖云事業部開源的深度學習工程模板,簡化加載數據、構建網絡、訓練模型和預測樣本的流程。
▲?框架圖
▲?文件夾結構
項目鏈接
https://github.com/SpikeKing/DL-Project-Template
#用于動作識別的大規模視頻數據集
STAIR Actions 是一個用于動作識別的大規模視頻數據集,包含 100 類諸如吃飯、喝水、洗手、扔垃圾等人類日常行為,每一類動作有 1000 個左右的視頻。作者保留了 10% 的數據用于后續比賽。
▲?數據集規模
▲?100種行為列表
項目鏈接
https://github.com/STAIR-Lab-CIT/STAIR-actions
#基于TensorFlow的光學樂譜識別工具
本項目是一個基于 TensorFlow 的光學樂譜識別工具,它通過讀取包含樂譜的 PNG 圖像來輸出 MusicXML 格式樂譜或 NoteSequence 消息。
項目鏈接
https://github.com/tensorflow/moonlight
點擊以下標題查看往期推薦:?
多款超贊AI開源項目,等你來Star!
好看的論文千篇一律,有趣的項目萬里挑一
Github 最新 AI 開源項目了解一下?
11 款 Github 最新「機器學習」開源項目
#答 題 時 間#
▼
?那!就!是!
好書送給社會人~
以下是簡單粗暴送福利環節
PaperWeekly?× 圖靈教育?
深入理解TensorFlow?
架構設計與實現原理
<5本>
圖靈原創√大牛推薦√火熱預售√
作者:彭靖田,林健 ,白小龍?
自 TensorFlow 開源以來,不斷有人撰寫圖書或博客解釋其各組件的實現與原理。但遺憾的是,能夠深入剖析 TensorFlow 內部實現細節與設計思想的資料少之又少,而本書則嘗試彌補這一缺憾。?
TensorFlow 進階不二之選?
才云科技技術總監?
華為深度學習團隊系統工程師?
華為公司深度學習云服務技術負責人?
? ? ? ? 聯合編寫?
中國科學院計算技術研究所副研究員查禮?
浙江大學計算機學院院長陳剛?
才云科技創始人兼 CEO 張鑫?
Google Brain?資深工程師周玥楓?
云賬戶聯合創始人兼 CTO 鄒永強?
博拉科技創始人兼 CEO 周公爽?
微軟亞洲研究院助理研究員王錦鵬?
才云科技首席大數據科學家鄭澤宇?
? ? ? ? 聯合推薦?
深入解析 TensorFlow 系統本身的設計與實現原理?
本書以 TensorFlow 1.2 為基礎,從基本概念、內部實現和最佳實踐等方面深入剖析 TensorFlow。不僅由淺入深地全面介紹 TensorFlow 的使用方法,還結合源代碼進行深入剖析,使讀者可以快速、系統地學習 TensorFlow 的架構設計與實現原理。
?
?參與方式?
請在文末留言分享
本期你最喜歡的Github項目
小編將隨機抽取5位同學
送出圖靈教育新書
截止時間:5月1日(周二)20:00
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
▽ 點擊 |?閱讀原文?| 預購《深入理解TensorFlow》
總結
以上是生活随笔為你收集整理的本周 Github 精选:13 款炼丹利器,有开源工具包也有超大数据集的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 从无监督构建词库看「最小熵原理」,套路是
- 下一篇: 如何实现少样本学习?先让神经网络get√