企业如何采用机器学习
摘要:?向機器學習專家學習如何理解機器學習開發生命周期,以及如何建立一個團隊通過機器學習來解決他們的業務問題。
毫無疑問,任何企業都可以利用機器學習的優勢將機器學習應用到他們的業務過程中。而機器學習的意義將取決于它是如何被應用的,以及你要用它來解決什么樣的問題。最終的結果還取決于你的數據科學家和軟件工程師的經驗,以及技術的應用。
在這篇文章中,我們將了解機器學習開發生命周期的真正面貌,看看企業如何建立一個團隊并利用機器學習來解決他們的業務問題。讓我們從下面的圖片開始:
正如你在上面看到的,機器學習過程是一個連續的過程,從各種來源提取數據,然后輸入到生成模型的機器學習引擎中。這些模型被插入到業務流程中以產生結果,而模型的結果被輸入到解決業務問題的過程中。這些模型可以獨立地在邊緣產生結果,這取決于它們的用法。
在這一點上,最關鍵的問題是要了解機器學習的開發生命周期。需要什么樣的技術才可以成功?團隊在構建和應用機器學習時需要做什么?
隨著我們的進一步深入,我們將得到上述問題的答案。看看下面的機器學習開發生命周期圖,得到以下范例:
? ? 1.從各種資源收集數據。
? ? 2.收集數據后,使機器學習就緒。
? ? 3.機器學習就緒,數據進入“構建機器學習”過程,數據科學團隊從中獲取結果。
從下圖中可以看出,“構建機器學習”過程的最終結果是企業最終產品的模型。該模型可以根據需要生成結果。
這個模型可應用于各種消費者、企業和工業用例,以提供邊緣級智能或過程智能,其中模型結果被輸入到另一個過程中。有時,該模型被輸入到另一個機器學習過程中,以產生進一步的結果。
另外,我們需要了解關鍵人員在端到端機器學習過程中的重要性,因此下一個問題是,關鍵人員在日常過程中做了什么?他們如何真正參與建立機器學習的過程?他們采用或創建什么樣的工具和技術來解決企業的業務問題?
要理解數據科學家在構建機器學習時所做的工作,我們應該知道他們主要是在需要時應用機器學習引擎,并使用各種算法來解決特定的問題。有時候,他們創造了一些全新的解決方案,因為沒有可用的方案,有時候,他們只需要改進可用的解決方案。
上面的圖片將各種引擎的概念思想匯總在一起,可供數據科學家團隊用來完成他們的任務。
軟件工程師對整個機器學習至關重要。他們在應用數據科學家的軟件工程方法的同時幫助加快和改進數據科學的過程,以更快地產生結果。
下圖解釋了軟件工程師如何通過創建完全自動化的機器學習系統來加速數據科學家的工作,該系統以全自動方式執行數據科學家的重復任務。在這一點上,數據科學家可以利用這些來解決新問題,只需要關注自動化系統以確保其工作正常。
谷歌(CloudML)和H2O(AutoML)等各種組織已經創建了可供任何企業使用的自動化機器學習軟件。也有開源軟件包,即Auto-SKLearn??和??TPOT?。
任何企業都可以遵循上述細節,將機器學習應用到他們的工作中。
可參考的文章:
自動機器學習的現狀
H2O在Python和Scala中進行自動化機器學習
?以上為譯文。
文章原標題《machine-learning-adoption-for-any-organization》,
譯者:黃小凡,審校:袁虎。
原文鏈接
干貨好文,請關注掃描以下二維碼:
總結
以上是生活随笔為你收集整理的企业如何采用机器学习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 修改HBase的rowkey设计把应用的
- 下一篇: 开放分布式追踪(OpenTracing)