Github 数据洞察之复杂信息网络
摘要:開源協作是數字化時代的必備技能,而背后的開發行為分析,能夠讓你看到一幅開源世界的全景圖;2020年2月,X-lab 開放實驗室聯合InfoQ發布了《GitHub 2019 數字年報》,收到了業界的一致好評。數據科學與工程能夠讓你領略這種數據洞見的魅力,你會看到,無論是我們熟悉的 TensorFlow、VS Code,還是阿里百度這樣的明星企業,都只是這片海洋中的滄海一粟;這份數字報告背后的數據基礎設施是什么?用的什么分析方法?如何建立合理的模型?最終結果如何展示能讓各個大廠信服?后續還能繼續做些什么?本次課程將給你帶來這些回答。本報告為第二部分,第一部分參加上一篇文章《Github 大數據行為分析簡介》。
報告PPT:
:
重磅 | GitHub 2019 數字年報全文正式發布
摘要:在開源日益重要的今天,我們需要一份建立在全域大數據基礎上的相對完整、可以反復進行推演的數據報告(報告、數據、算法均需開源)。本項目為X-lab 開放實驗室團隊發起,旨在通過分析Github全網的開發者行為日志,通過數據的視角,來觀察全球范圍內的開源現狀、進展趨勢、演化特征、以及未來挑戰等問題,除了展現目前開源世界全貌之外,我們特別關注中國的開發者和企業組織在整個開源產業中的表現。本報告中使用 2019 年全年 GitHub 日志進行統計,總日志條數約 5.46 億條。
關鍵詞:開源、行為數據、開發者行為、Github、數字年報
總結
以上是生活随笔為你收集整理的Github 数据洞察之复杂信息网络的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度解读Microsoft Build
- 下一篇: 2020年,.NET Core起飞在即,