日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

如何成为一位数据科学家(图灵访谈)

發(fā)布時間:2023/12/19 编程问答 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 如何成为一位数据科学家(图灵访谈) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

學習筆記,僅供參考,有錯必糾
摘自:《機器學習實戰(zhàn)》作者Peter Harrington:如何成為一位數(shù)據(jù)科學家
訪談對象:Peter Harrington


  • 機器學習似乎比其他計算機科學學科都要難,特別是對于數(shù)學不太好的程序員而言。你對這些程序員有什么樣的建議呢?

我建議應該先自學基本的概率、統(tǒng)計,以及線性代數(shù)。你不需要學一個學期那么長的課,這些基礎(chǔ)知識就會讓你有很大收獲。有很多在線資源,比如Kahn academy視頻。(我在56.com和Kahn academy找了一下有很多英文的,也有一些中文的。)也有一些比較容易起步的書,我比較熟悉有美國英文版的“teach yourself”(自學)系列, “statistics for dummies”(傻瓜統(tǒng)計), “probability refresher”(概率補習),“statistics demystified”(統(tǒng)計解惑)等等。

我其實認為這里面其實很有商機。Kahn academy視頻很不錯,因為它們都很短,但遺憾的是這些視頻都是英文的。我看見的中文線性代數(shù)視頻都很長。如果你能做出像Kahn academy那樣的中文視頻,我覺得是會非常受歡迎的。


  • 如何進階學習機器學習?對于初學者是否有一個類似于路線圖的東西?你有什么推薦書單嗎?

我會讀Witten 和 Frank所著的《數(shù)據(jù)挖掘:實用機器學習工具與技術(shù)》,這里面涉及的數(shù)學很少,但是又對普通算法做了很好的介紹。我覺得緊接著就該讀Tan, Steinbach, 以及Kumar的《數(shù)據(jù)挖掘?qū)д摗贰?/p>

當然,這些書都很厚,如果你想馬上就搞明白一些東西,估計就不想讀這些大部頭了。如果要把某個算法弄明白,我會在網(wǎng)上找很多教程。比如Adboost算法,我認為多讀一些不同的教程比只讀一個,深入鉆研要好很多。

最后我覺得應該多動手玩玩實例。問問你自己:如果我改變這個數(shù)據(jù),結(jié)果會是怎么樣的呢?


  • 對于有些人來說“算法”才是機器學習真正有趣的地方,但是機器學習里面總有一些苦活累活不那么有意思,比如數(shù)據(jù)預處理。你是怎么完成這些“不那么有趣”的工作的?

當然,肯定有無聊的工作,所以你一定要把這部分工作自動化,這樣你就不需要重復做這些無聊的工作了。這樣做也會讓你變成一個更好的軟件開發(fā)者。


  • 數(shù)據(jù)科學家被評為世界上最火的工作之一,你認同嗎?您本人作為一個數(shù)據(jù)科學家,有什么可以和我們分享的經(jīng)驗嗎?要成為一個數(shù)據(jù)科學家需要有什么條件?

我認為數(shù)據(jù)科學家現(xiàn)在確實很好找工作。什么是數(shù)據(jù)科學家呢?我認為數(shù)據(jù)科學家是介于統(tǒng)計學家和軟件工程師中間的一種工作。公司、個人、NPO,甚至運動隊都需要根據(jù)數(shù)據(jù)來做決策。他們需要可以分析數(shù)據(jù)的人。這需要我之前提過的兩種條件。人們不需要單純的統(tǒng)計學家,這些人可能對于爭論自己到底用不用貝葉斯定理更感興趣,人們需要的是真正能做實事的人。

所以我也建議大家多動手做一些東西。這是什么意思呢?創(chuàng)造一些項目,收集數(shù)據(jù),預處理數(shù)據(jù),然后做一些數(shù)據(jù)分析,展示數(shù)據(jù),最后向公眾展示這些數(shù)據(jù)。如果你做了很多這樣的事情,那么你就有一個可以用來向你未來老板或者其他人展示的檔案夾。幾乎我書里的每個例子都可以用來做成一個網(wǎng)站或者智能電話app,這些都是你可以示人的資本。


  • 很多大(數(shù)據(jù))公司,比如Google, Facebook 和 Baidu都投入很多精力在深度學習上。你認為深度學習會在未來取代“人工特性+機器學習”的方法嗎?

不,我不認為深度學習會取代人工特性+機器學習。有很多領(lǐng)域,深度學習確實很擅長,比如識別圖片。但是仍然有很多領(lǐng)域現(xiàn)存算法的表現(xiàn)更勝一籌。

總結(jié)

以上是生活随笔為你收集整理的如何成为一位数据科学家(图灵访谈)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。