对 2018 年 AI 发展预言全中,他们又立了 2019 的 Flag
By 超神經
「對于 2019 年數據科學、機器學習和人工智能,我們做出了 5 個預測。同時還回顧一下去年做的預測,看看有哪些是真的發生了。 」
作者:William Vorhies
DataScienceCentral 編輯部主任; Data-Magnum 總裁兼首席數據科學家; EB5C 主席
對去年預測的快速回顧
預測 1:模型制作和數據準備將變的更加自動化。更大的數據科學運營會集成到一個平臺上。只需少量的數據科學家就能勝任許多工作。
這個猜對了,隨著高級分析平臺上端到端的集成,無代碼的數據科學正在崛起。
預測 2:數據科學會朝著專業化方向發展,而「全棧」的數據科學家將不復存在。
同樣猜對?,F在人們對數據工程師的關注度要高于數據科學家。因為數據工程師更加的實用。
預測 3:非數據科學家比數據科學家更能勝任大量而復雜的分析。
事實如此。從 Data Viz 和 Visual Analytics 的流行,就可以看出,非數據科學家從復雜的數據科學工具中獲得了更多的價值。
預測 4:深度學習困難重重。沒有多少數據科學家熟練能掌握這一領域,這會限制人工智能的應用,除非深度學習平臺更加簡潔化和產品化。
微軟和谷歌都推出了自動深度學習平臺,它們從遷移學習開始,朝著完整的 AutoDL (自動機器學習)發展。此外還有一些集成的 AutoDL 平臺。比如 one clicks. ai,就有的完整的 AutoML 和 AutoDL 平臺。Gartner 最近提名擁有 AutoDL 平臺的 DimensionalMechanics 為「五大潮流公司」。
預測 5:盡管被大肆炒作,但人工智能及深入學習的滲透,以及對市場的影響的廣度和深度都不盡人意。
除了聊天機器人的快速發展, AI 的應用其實很有限。AI 被吹的有些高了,在實際的公司中,真正用到 AI 和機器學習的比例也很小。
預測 6:公眾(和政府)將開始認真研究 AI 的社會和隱私影響。
看看美國政府以及歐盟即的一些動作,就知道這些問題正在受到重視,如加利福尼亞州即將生效的隱私規范,以及澳大利亞的反加密聲明。
沒有懸念的,我們在去年的 6 個預測全都正確。雖然一些看法在今年依然如此,但我們還是嘗試做出更具體一些預測分析。
對 2019 做的預測
預測 1:數據將會比算法更重要
深度學習和經典機器學習算法方面,已有一年多沒有較大突破了。使用的是稍作改進時間卷積網(TCNs),代替掉了 RNN 以減少 NLP 的延遲,但絲毫沒有創新。好的算法要么早有名氣,要么就是能用自動機器學習弄出來。
目前這個時期,擁有大量優質數據是公司實現數字化轉型的關鍵,這同時也衍生出了數據提供方案的競爭和機會,大致有下面幾個方向。
第一個方向是如何獲得準確標記的訓練數據。像 Figure Eight 之類從事標簽數據的公司,正在推廣具有成本效益的智能策略。比如主動學習就能在標記數據和確保模型精度之間作出最佳選擇。
第二個方向是訪問第三方數據。像 DymstData 這樣的服務公司,已經進入該領域作為數百種附加數據提供清算所。他們還承擔著保護敏感 PII 的作用,他們的用戶可以強制執行角色訪問某些敏感信息,這對金融和醫療服務中尤為重要。
第三個方向是自動跟蹤并記錄模型中數據的來源。特別是由多個來源的流數據被集成,而且實時變化時,知道數據來源以及如何使用它,是很重要的一個方面。Tibco 和其他一些分析平臺正在整合此項功能。
預測2:隨著 AI / ML 將分析平臺移至行業或流程特定程序,一切將變得更容易。
縱覽 AI / ML 的創業公司,可以看出競爭正在轉向行業或特定的程序。這些程序或迷你平臺,是專注于解決各種業務中的行業特定問題,如營銷,B2B 銷售,醫療保健,金融科技以及其他定義的分組。
這些新應用程序專注于嵌入 AI / ML ,從而在企業更新時,不需要大型內部數據科學家組的支持,只依賴這些開發人員。
有人稱這為AI / ML的商品化,但更準確地說,這是 AI / ML 的專業化。
這樣的轉型,就像是 90 年代后期 ,從流程改造(Reengineering) 到企業資源規劃( ERPs )的轉變。當時 Reengineering 呼吁公司使用復雜的定制開發 IT 解決方案來改進流程,這為 Oracle,PeopleSoft,SAP 等主要集成 ERP 以及 CRM 等企業打開了大門。
新的供應商都致力于在他們的特定市場中提供廣泛的解決方案,但不可避免地最終得出 ERP 規模較小的平臺。
另外還要關注那些沒有大型數據科學團隊,或完全依賴定制開發模型的中型和小型公司,注意它們加快 AI / ML 采用率的問題。
預測3:數據工程師和數據分析師的崛起
這不是說世界已經放棄了數據科學家。還需要一個過程。但當你缺乏某些技能時,市場會以不同的方式填補這種空白。
一種方法是通過上面討論過的行業和流程特定的智能應用,這些應用程序不需要大量的內部數據科學家。
第二種方法是迅速出現的自動機器學習( AML )平臺。這在數據科學中更高效,意味著更少的數據科學家可以完成許多工作。
由于模型的數量沒有減少,反而增加了,這會將工作擔子轉移給那些具備兩方面技能的數據工程師。
首先,他能夠創建數據科學所需的基礎架構,如數據湖和 Spark 實例。
其次是采用模型,并確保它們在操作系統中實現,并跟蹤準確性和刷新。
有一些數據工程師還要負責數據操作 ,確保數據流的清潔和預處理。
分析平臺的另一個趨勢是視覺分析和數據可視化工具的發展。現在,這些工具大部分與數據科學工具集完全集成,能讓數據分析師和 LOB 經理提取更多價值,甚至指導分析工作。他們不會取代數據科學家,但強化了高級分析正在團隊里的作用。
預測4:神經形態芯片:AI 與物聯網走向前沿
這兩種不同的技術同時都處于半成熟狀態,以解決長期存在的問題——延遲。
例如,考慮當您想要使用移動設備,將文本或圖像的單詞進行翻譯時,您的設備會將該信號發送回發生到翻譯云中的應用程序,然后再返回到你的設備。
谷歌和其它即時翻譯服務,已經從 RNN 轉移到專門的 CNN 結構,也就是時間卷積網絡,因為 RNN 不能很好適應 MPP,但 CNN 卻可以。這個轉換減少了延遲,但信號還是完整的。
解決此問題的一種技術是 5G 網絡。大家都知道 5G 會很快,但它真正的好處在于可以承載更大的流量。
第二個解決方案是引入新的神經形態芯片(也叫脈沖神經網絡)。這種神經網絡架構可能是實現通用人工智能( AGI )的關鍵。但還需要些時日。
當前主要的芯片制造商和一些初創公司,正在研發脈沖神經網絡的專用芯片,針對 CNN 和 RNN 的進行了優化,其中一些還針對極低功耗做了優化。
這些功能結合在一起,會將深度學習轉移到網絡邊緣的芯片上。從今年開始,對于物聯網和其他流媒體數據應用,會怎樣被點燃,就拭目以待吧。
預測5:不同的 AI 框架將相互融合
目前文本,語音,圖像和視頻模型已發展成了主流,但發展還是遇到了很大的障礙。因為在一個框架(如Caffe2,PyTorch,Apache MXNet,Microsoft Cognitive Toolkit 和 TensorFlow )上構建的模型,無法輕松移植到另一個框架。
幸運的是,這也推動了一些創新之舉。比如 AWS,Facebook 和 Microsoft 合作構建的開放式神經網絡交換平臺( ONNX ),使模型可以在不同的框架上實現互操作。
隨著開發人員,應用程序和設備之間共享的模型數量增多,ONNX 將會是今年的一項關鍵技術。
這就是對今年情況的一個預測。就等著明年的時候回過頭來,看看這個領域和所想的有什么不同。
總結
以上是生活随笔為你收集整理的对 2018 年 AI 发展预言全中,他们又立了 2019 的 Flag的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一次线上内存报警的研究
- 下一篇: 设置Grid某列的Title样式和列内数