日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

别再搜集面经啦!小夕教你斩下NLP算法岗offer!

發(fā)布時(shí)間:2024/7/5 编程问答 39 豆豆
生活随笔 收集整理的這篇文章主要介紹了 别再搜集面经啦!小夕教你斩下NLP算法岗offer! 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

推完上一篇文章,訂閱號(hào)和知乎后臺(tái)有好多小伙伴跟小夕要面經(jīng)(還有個(gè)要買(mǎi)簡(jiǎn)歷的是什么鬼),然鵝小夕真的沒(méi)有整理面經(jīng)呀,真的木有時(shí)間(。 ?︿ ?。)。不過(guò)話說(shuō)回來(lái),面經(jīng)有多大用呢?最起碼對(duì)于NLP崗位的面試來(lái)說(shuō),小夕發(fā)現(xiàn)根本不是面經(jīng)中說(shuō)的樣子。。。

其實(shí)今年參加NLP算法崗秋招的小伙伴可能有感慨,

“照著別人的面經(jīng)去準(zhǔn)備了辣么多,輪到自己面試時(shí)內(nèi)容怎么這么不一樣?!”

“說(shuō)好的要做到熟練推導(dǎo)SVM呢?怎么從來(lái)沒(méi)人讓我推導(dǎo)SVM?”

“整場(chǎng)面試都在聊前沿論文啊什么鬼?從來(lái)沒(méi)見(jiàn)這樣的面經(jīng)呀!”
“為什么面試官只問(wèn)他簡(jiǎn)歷內(nèi)容,輪到我時(shí)一點(diǎn)簡(jiǎn)歷內(nèi)容都不問(wèn)?“

不止今年,將來(lái)的面試肯定更趨向于千人千面,畢竟AI行業(yè)也將越來(lái)越細(xì)化嘛。所以小夕精心準(zhǔn)備了這篇“萬(wàn)能”文章給你們,希望大家將來(lái)都能收割到自己想要的offer~

這篇文章不是面經(jīng)集合,也不是裝X和販賣(mài)焦慮的曬offer貼,也不是堆砌可能問(wèn)到的知識(shí)點(diǎn),而是希望給還在迷茫的小伙伴提供一些系統(tǒng)的指導(dǎo)和建議。當(dāng)然,這些建議可能不適合每個(gè)人,因此希望大家從這篇文章里汲取到適合自己的養(yǎng)分,千萬(wàn)不要邯鄲學(xué)步哦m(——)m

目標(biāo)觀眾

首先,本文的討論范圍僅限自然語(yǔ)言處理(NLP)相關(guān)崗位!親測(cè)NLP崗的套路跟數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)崗還是有明顯差異的,所以千萬(wàn)不要按本文的套路去準(zhǔn)備DM、ML的面試!

然后說(shuō)一下本文的目標(biāo)群體。想去拿Google AI中心、FAIR、MSRA offer的大佬請(qǐng)放過(guò)小夕(。 ?︿ ?。)真的木有經(jīng)驗(yàn)可以分享。還有那些已經(jīng)一大把頂會(huì)的小伙伴,求給小夕指導(dǎo)好么!

其實(shí)之前小夕也曾想著去外企的研究院(雖然菜的一無(wú)所有),然而很扎心的一次次打聽(tīng)到外企的研究院基本只招PhD。雖然外企的業(yè)務(wù)部門(mén)也有NLP崗位,而且碩士也能進(jìn),但是進(jìn)一步打聽(tīng)了一下,聽(tīng)說(shuō)碩士進(jìn)去很少有research相關(guān)的工作,最多做做模型優(yōu)化,弄不好就是爬數(shù)據(jù)、清洗數(shù)據(jù)了。后來(lái)拿了一家的offer后發(fā)現(xiàn)確實(shí)如此,加上后來(lái)沒(méi)什么面試的狀態(tài)了,也就放棄這一塊了。不過(guò)有條件的同學(xué)可以在外企研究院或業(yè)務(wù)部門(mén)做做intern,這方面對(duì)碩士友好的多,而且聽(tīng)說(shuō)很多業(yè)務(wù)部門(mén)的research工作也會(huì)讓intern來(lái)做。

言歸正傳,對(duì)于想拿國(guó)內(nèi)一線大廠的核心研究部門(mén)和核心業(yè)務(wù)部門(mén)NLP算法崗/研究崗offer的童鞋,轉(zhuǎn)發(fā)本文,你就收獲了半個(gè)offer!打賞本文,你就收獲了0.75個(gè)offer!(等等,文風(fēng)好像越來(lái)越像傳銷(xiāo)了。。。)

國(guó)內(nèi)的NLP方向的崗位一般叫做NLP研究員/算法工程師/工程師,如果你的目標(biāo)是跟下面小夕的戰(zhàn)績(jī)一樣,那么本文或許可以給你提供點(diǎn)啟發(fā)。

按流程來(lái)說(shuō)吧。首先簡(jiǎn)歷投了一圈都很幸運(yùn)的木有沉(算了算差不多十來(lái)家,很多沒(méi)內(nèi)推);筆試參加了網(wǎng)易、網(wǎng)易游戲和今日頭條,都很幸運(yùn)的木有掛(雖然做完后都感覺(jué)要掛);面試過(guò)程中跪掉了騰訊和頭條(小夕辣么可愛(ài),怎么能忍心拒絕(。 ?︿ ?。)),最后拿了下面幾個(gè)offer:

百度和阿里的SP offer或以上(某廠offer我不確定是不是該叫SSP),還有網(wǎng)易游戲等幾個(gè)第二三梯隊(duì)、快手等startup公司的offer(出了等級(jí)的也都給了SP及以上)。

ps:其他公司都是各種原因沒(méi)去筆試或面試(記錯(cuò)了時(shí)間或者時(shí)間沖突,HR又不給調(diào)時(shí)間m(_ _)m)

好了,如果確定你是本文的目標(biāo)讀者,歡迎往下看。

Research or Product ?

首先,要搞懂自己想要什么。粗略的看,如果想做research,比如發(fā)發(fā)paper,打打國(guó)際比賽,做做通用技術(shù)平臺(tái),為現(xiàn)在或?qū)?lái)的產(chǎn)品孵化算法接口,就去偏research的部門(mén);如果想直接優(yōu)化產(chǎn)品的算法指標(biāo),看到自己的成果快速反映在產(chǎn)品的用戶體驗(yàn)和經(jīng)濟(jì)效益上,那就去偏業(yè)務(wù)的部門(mén)。這兩種不同導(dǎo)向的部門(mén)在面試的時(shí)候的關(guān)注點(diǎn)會(huì)存在一定差異。

當(dāng)然,再偏research的部門(mén)也會(huì)把成果直接或間接的輸出到各個(gè)產(chǎn)品線上(否則養(yǎng)你干嘛),再偏業(yè)務(wù)的部門(mén)也會(huì)有做research的團(tuán)隊(duì),畢竟NLP本身還沒(méi)有成熟嘛。

不過(guò)總的來(lái)說(shuō),比如你想做research,有不錯(cuò)的論文或比賽經(jīng)歷,對(duì)某個(gè)方向研究的比較深入,但做系統(tǒng)的經(jīng)歷相對(duì)匱乏,則偏research的部門(mén)可能更賞識(shí)你;如果你想做產(chǎn)品,并且做系統(tǒng)、啪代碼的能力不錯(cuò),論文也刷了不少但是科研熱情不高,則你可能跟業(yè)務(wù)部門(mén)更match。

說(shuō)了這么多,到底該怎么判斷一個(gè)部門(mén)偏research還是偏業(yè)務(wù)呢?最靠譜的還是跟HR或者該部門(mén)的師兄師姐聊,如果沒(méi)有,可以根據(jù)名字猜測(cè)一下,比如下面給出幾個(gè)case:

ps:以下case跟人家真正的定位沒(méi)有半毛錢(qián)關(guān)系,信息多總結(jié)自小夕和小伙伴的面試主觀感受,注意是主觀感受

偏research/通用平臺(tái)的:

  • 百度:自然語(yǔ)言處理部

  • 阿里:達(dá)摩院的數(shù)據(jù)科學(xué)研究院(IDST)

  • 騰訊:AI lab

  • 網(wǎng)易游戲:伏羲AI實(shí)驗(yàn)室

  • 京東:AI lab

  • 滴滴:AI lab

  • 商湯:研究院(沒(méi)錯(cuò),商湯研究院也有NLP)

偏業(yè)務(wù)/產(chǎn)品的:

  • 百度:度秘事業(yè)部、智能客服部

  • 阿里:智能服務(wù)部(阿里小蜜)、達(dá)摩院的AI labs(天貓精靈等)

  • 網(wǎng)易:有道事業(yè)部

好了,搞懂了自己想做什么,瞄準(zhǔn)一兩個(gè)目標(biāo)部門(mén)立個(gè)flag,后續(xù)就要圍繞這根主線來(lái)哦。有條件的童鞋可以找?guī)熜謳熃闾崆按蚵?tīng)一下意向部門(mén)的研究方向或者業(yè)務(wù)方向,免得準(zhǔn)備了一年后發(fā)現(xiàn)人家根本不做這個(gè)。。。如果實(shí)在打聽(tīng)不到,可以搜羅一下該部門(mén)近幾年的頂會(huì)paper、專(zhuān)利、宣傳文章之類(lèi)的,結(jié)合官網(wǎng)上的宣傳,基本可以摸個(gè)差不多。

啰嗦了好多,下面就分享經(jīng)驗(yàn)啦。內(nèi)容分私貨篇和干貨篇,私貨篇主要講前期的準(zhǔn)備(筆試、簡(jiǎn)歷、論文、比賽、實(shí)習(xí)等,沒(méi)耐心的同學(xué)可以只看加粗的內(nèi)容),干貨篇看似是對(duì)小夕幾十場(chǎng)面試的面經(jīng)的知識(shí)點(diǎn)濃縮,實(shí)際上只是為了說(shuō)明一個(gè)trick,即別人的面經(jīng)不重要,去為自己的關(guān)鍵詞去量身定做復(fù)習(xí)計(jì)劃吧。文末給出一些超級(jí)有信息量的tips。

私貨篇

1. 筆試與面試中的筆試的準(zhǔn)備

這方面小夕走了不少?gòu)澛?#xff0c;其實(shí)提前批(7月下旬到8月底)基本不會(huì)有筆試(今日頭條、網(wǎng)易、網(wǎng)易游戲這三家有),因此大可把主要精力放在簡(jiǎn)歷及延伸內(nèi)容里。但是!解基本編程題的能力還是要鍛煉出來(lái)的,這是紅線。

面試中的白板編程題一般都超級(jí)簡(jiǎn)單,基本都是leetcode簡(jiǎn)單級(jí)別的或者劍指offer上的原題,偶爾出個(gè)leetcode中等難度的題。小夕把劍指offer刷了不到一半,leetcode刷了30來(lái)道題(按類(lèi)別和top review過(guò)濾后刷,先刷簡(jiǎn)單的),發(fā)現(xiàn)應(yīng)付提前批面試中的編程題基本都可以應(yīng)付了。當(dāng)然,精力允許的話還是多刷點(diǎn),畢竟解題解得快,別留邊界問(wèn)題,會(huì)給面試官印象好一些。

哦對(duì)了,編程語(yǔ)言的話,放心的用python就好,小夕實(shí)在沒(méi)時(shí)間復(fù)習(xí)C/C++/Java了,所以leetcode還有各家的筆試面試都是用python寫(xiě)的,親測(cè)沒(méi)毛病。

至于計(jì)算機(jī)網(wǎng)絡(luò)、操作系統(tǒng)、計(jì)算機(jī)組成原理、數(shù)據(jù)庫(kù)、編程語(yǔ)言、設(shè)計(jì)模式之類(lèi)的基礎(chǔ)課,閑暇時(shí)翻一翻吧,全都從頭復(fù)習(xí)一遍太費(fèi)精力了,這些一般只出現(xiàn)在筆試的選擇題中。面試過(guò)程中除了今日頭條,其他家從來(lái)沒(méi)考過(guò)。

另外,矩陣論、概率統(tǒng)計(jì)這些數(shù)學(xué)課也記得順手復(fù)習(xí)哦,聽(tīng)后來(lái)參加正式校招的小伙伴說(shuō),有的大廠的算法崗試題不怎么考計(jì)算機(jī)基礎(chǔ),本科的數(shù)學(xué)課倒是考了很多。不過(guò)小夕親測(cè)碩士階段的數(shù)學(xué)課像最優(yōu)化之類(lèi)的,考的非常非常淺,科普級(jí)別的深度就夠應(yīng)付了。(感覺(jué)最優(yōu)化白學(xué)了(′Д` ))

最后小夕不靠譜的猜測(cè)有的廠的筆試刷人可能不全看總分。因?yàn)樾∠υ诰W(wǎng)易的筆試的選擇題部分瞎蒙了好多題,最后40分的問(wèn)答題也完全空著沒(méi)做,就中間30分的編程題磕磕絆絆的基本AC了(也掛了幾個(gè)case),但是最后筆試竟然過(guò)了。

2. 簡(jiǎn)歷的準(zhǔn)備

翻了一下,發(fā)現(xiàn)自己的簡(jiǎn)歷前前后后改了23版。。。回看7月份的簡(jiǎn)歷,簡(jiǎn)直辣眼睛╮( ̄▽ ̄””)╭

毫無(wú)疑問(wèn)簡(jiǎn)歷是最最最重要的東西,它不僅是面試的敲門(mén)磚,而且基本貫穿了整個(gè)面試過(guò)程!從小夕的經(jīng)歷看,不加面試中的白板編程時(shí)間,簡(jiǎn)歷內(nèi)容一般會(huì)占據(jù)每輪面試80%-100%的時(shí)間(今日頭條除外),其中占到100%時(shí)間的面試能占到50%以上。

做簡(jiǎn)歷的最基本也是最關(guān)鍵也是最容易被忽視的一條原則是,整體內(nèi)容一定要跟崗位需求match!其實(shí)做簡(jiǎn)歷跟寫(xiě)文章很像,要圍繞一根主線展開(kāi),如果發(fā)現(xiàn)電路也做,視覺(jué)也做,推薦也做,NLP也做的話,很容易被打上“跟崗位不match”或者“這孩子做事浮躁”的tag。(身邊一小伙伴就這樣被某二梯隊(duì)廠以“NLP經(jīng)歷不足”為理由掛掉)

對(duì)于已經(jīng)一串paper的那種簡(jiǎn)歷來(lái)說(shuō),就不做建議了。但是如果對(duì)于比賽、論文、項(xiàng)目、專(zhuān)利都只有幾條的童鞋來(lái)說(shuō),完全可以把簡(jiǎn)歷做的有的放矢,match的內(nèi)容展開(kāi)寫(xiě),不match的一筆帶過(guò)或者直接不寫(xiě),這樣面試官也省的一條條甄別信息量,面試過(guò)程也會(huì)變得更加主題明確。

小夕的一個(gè)小trick是,可以嘗試把最有信心在面試中談起的經(jīng)歷所在的板塊寫(xiě)在最前面(僅次于教育經(jīng)歷),并用配色突出這條經(jīng)歷。小夕親測(cè)這樣的第一條經(jīng)歷可以聚焦非常多的面試火力,甚至有15%的面試是全部面試時(shí)間都在死磕這條經(jīng)歷!而且小夕神奇的發(fā)現(xiàn),各輪面試很少有第一輪面試官問(wèn)第一條,第二輪面試官問(wèn)第二條這種,倒是經(jīng)常有面試官覺(jué)得你第一條經(jīng)歷很亮,于是告訴下一輪面試官這條很亮,然后下一輪面試官出于好奇就深入問(wèn)這條經(jīng)歷,如果他也覺(jué)得很亮,就會(huì)轉(zhuǎn)述再下一輪面試官,于是再下一輪面試官又會(huì)主要問(wèn)你這條經(jīng)歷╮( ̄▽ ̄””)╭,然后offer就到手了。當(dāng)然,這樣的副作用就是,如果對(duì)面試官來(lái)說(shuō)這條經(jīng)歷不亮,那面試基本掛掉一半了。

另外,除非你碩士期間對(duì)一個(gè)方向鉆的很深、已經(jīng)可以駕馭這個(gè)方向的絕大部分問(wèn)題了,否則小夕墻裂建議單獨(dú)設(shè)置一個(gè)板塊列一下自己研究過(guò)的算法問(wèn)題。比如分兩級(jí),第一級(jí)講方向(比如對(duì)話系統(tǒng)),第二級(jí)講具體研究的子問(wèn)題(比如聊天的一致性問(wèn)題),這樣可以避免面試官對(duì)你進(jìn)行天馬行空式的考察,畢竟碩士時(shí)間有限,哪怕只做NLP中的一個(gè)方向,也難以研究的面面俱到。該板塊會(huì)貢獻(xiàn)大量的關(guān)鍵詞,這些關(guān)鍵詞基本可以決定面試官對(duì)你的考察范圍,詳見(jiàn)后面的干貨篇。

還有一個(gè)trick,簡(jiǎn)歷內(nèi)容太多,做到兩頁(yè)后,難免最后要塞一些無(wú)關(guān)痛癢的榮譽(yù)(比如獎(jiǎng)學(xué)金啥的)還有一些主觀內(nèi)容(比如算法研究、IT技能、自我評(píng)價(jià)之類(lèi)的),這樣面試官看到后面發(fā)現(xiàn)沒(méi)營(yíng)養(yǎng)了反而容易忘掉前面的亮點(diǎn),所以小夕是把一條亮點(diǎn)經(jīng)歷放在簡(jiǎn)歷最后點(diǎn)個(gè)題(記得顏色突出一下,否則真被忽略了就哭了),這樣會(huì)讓面試官覺(jué)得整個(gè)簡(jiǎn)歷“干貨滿滿,這么亮的經(jīng)歷都只能排到最后面了”。

最后,對(duì)小夕簡(jiǎn)歷好奇的小伙伴也不要好奇了,除了性別沒(méi)什么亮點(diǎn)╮( ̄▽ ̄””)╭各種被HR指控填錯(cuò)了性別,最后無(wú)奈之下把性別加粗了。嗯,是加粗了,不是改了。

3. 論文的準(zhǔn)備

首先diss一下很多人把收不到NLP算法崗offer歸結(jié)于沒(méi)有頂會(huì)論文,實(shí)際上碩士期間出一篇頂會(huì)論文對(duì)于絕大部分碩士來(lái)說(shuō)還是非常難的,更何況AAAI這類(lèi)頂會(huì)自帶灌水嫌疑,如果面試過(guò)程中也給人感覺(jué)是水文的話更不算什么加分項(xiàng)了。一般來(lái)說(shuō),碩士期間出一篇有意義的頂會(huì)最少意味著:

  • 研一下學(xué)期之前把所有基礎(chǔ)打好(不然別人刷paper的時(shí)候你刷教材么

  • 有很負(fù)責(zé)且很有經(jīng)驗(yàn)的導(dǎo)師/高年級(jí)博士帶(純靠自己摸索的話基本洗洗睡了

  • 方向沒(méi)偏(有些導(dǎo)師做的方向?qū)嵲陔y出paper

  • 數(shù)學(xué)、coding能力過(guò)關(guān)(學(xué)個(gè)numpy、tensorflow要花大半年的話可以轉(zhuǎn)行了

  • 運(yùn)氣好(不是說(shuō)觀點(diǎn)新,實(shí)驗(yàn)效果好,寫(xiě)的也ok就能中的,你要相信神馬審稿人都會(huì)有的

  • 一般來(lái)說(shuō)研二那一年的最后能投的頂會(huì)是在4月之前的,再往后的會(huì)議出來(lái)錄取結(jié)果的時(shí)候基本校招提前批進(jìn)行一大半了,簡(jiǎn)歷能丟的都丟出去了,所以真正可以好好做科研的時(shí)間基本只有研一下學(xué)期+研二上學(xué)期。(本科出頂會(huì)的大佬忽略)

    而對(duì)于大部分人來(lái)說(shuō),很難一下子就有一個(gè)idea,然后一下子就做出來(lái)了好實(shí)驗(yàn)效果,一下子論文寫(xiě)的也很漂亮,一下子就中了頂會(huì)的,基本都要從水會(huì)投起,摸索套路,所以一無(wú)所有的情況下非頂會(huì)不投幾乎等同于作死(當(dāng)然水某些A類(lèi)頂會(huì)的話另說(shuō))。但!是!盡自己的努力去水一篇非頂會(huì)還是不難的(比如CCF C類(lèi)的水會(huì),EI檢索之類(lèi)的)。水完水會(huì)之后,想進(jìn)一步水頂會(huì)的小伙伴們可以根據(jù)這個(gè)ddl時(shí)間表規(guī)劃一下自己的時(shí)間
    -> https://aideadlin.es/?sub=NLP,ML

    4. 比賽的準(zhǔn)備

    除了論文,另一個(gè)有吸引力而且性價(jià)比更高的活動(dòng)就是打比賽了。個(gè)人英雄主義在大課題、大項(xiàng)目里很難體現(xiàn),但是在一個(gè)比賽中卻是有了充足的show的機(jī)會(huì)。但是注意那些小企業(yè)小機(jī)構(gòu)辦的幾十個(gè)隊(duì)伍參賽的小比賽就不要水了,提交個(gè)baseline模型就能水個(gè)top3挺沒(méi)意思的,掛簡(jiǎn)歷上會(huì)“很掉身價(jià)”的。

    除了NLP各大頂會(huì)和kaggle的比賽,還可以多多關(guān)注各個(gè)互聯(lián)網(wǎng)大廠舉辦的NLP比賽,比如微軟的編程之美挑戰(zhàn)賽(去年是問(wèn)答bot)、百度的機(jī)器閱讀理解大賽、阿里的天池系列比賽等,親測(cè)在各大廠的面試中很有效(非舉辦方的互聯(lián)網(wǎng)公司一般也都會(huì)關(guān)注友商的比賽的)。

    另外,一定一定要打跟目標(biāo)崗位match的比賽,底線是NLP比賽。比如你想做chatbot,卻光打一些數(shù)據(jù)挖掘類(lèi)的比賽,哪怕top 5也意義不大,但是這時(shí)文本匹配、生成、問(wèn)答相關(guān)的比賽哪怕排名一般(差不多容忍到隊(duì)伍數(shù)的10%)也完全可以強(qiáng)行寫(xiě)上去。已經(jīng)有名次很好但是match程度不高的比賽了怎么辦?簡(jiǎn)歷上一句話帶過(guò)吧,突出強(qiáng)調(diào)和大寫(xiě)特寫(xiě)只會(huì)讓人覺(jué)得你跟崗位不match。

    具體到比賽過(guò)程中,如果你要做NLP,千萬(wàn)不要靠堆開(kāi)源模型做ensemble上分,這樣雖然能為你爭(zhēng)取到面試機(jī)會(huì),但是這樣基本沒(méi)有任何創(chuàng)新,只會(huì)讓面試官覺(jué)得你是個(gè)優(yōu)秀的搬磚工程師和調(diào)參小能手,如果簡(jiǎn)歷上也沒(méi)有亮點(diǎn),很容易被掛(身邊有活體例子)。對(duì)于面試來(lái)說(shuō),優(yōu)秀的單模型超級(jí)好用!另外最好把頂會(huì)SOTA也拿到比賽數(shù)據(jù)集上跑一下,這樣面試時(shí)更有說(shuō)服力。

    5. 實(shí)習(xí)與項(xiàng)目的準(zhǔn)備

    一份兒好的實(shí)習(xí)經(jīng)歷確實(shí)可以加分,比如MSRA、百度自然語(yǔ)言處理部、阿里idst、騰訊AI lab這些部門(mén)的research經(jīng)歷或者大廠match的業(yè)務(wù)部門(mén)的出色工作都會(huì)讓面試難度降低不少,然鵝小夕親測(cè)這并不是必須的(心疼的抱抱導(dǎo)師不放實(shí)習(xí)的自己(。 ?︿ ?。))。同時(shí),小夕也親測(cè)實(shí)驗(yàn)室的大項(xiàng)目一般木有多少吸引力,遠(yuǎn)不如上面那幾個(gè)地方的實(shí)習(xí)經(jīng)歷值錢(qián),所以抱怨自己實(shí)驗(yàn)室沒(méi)項(xiàng)目的童鞋可以stop了,去找實(shí)習(xí)機(jī)會(huì)吧。

    6. 其他

    最后啰嗦一下,頂會(huì)paper、top比賽、大廠研究院實(shí)習(xí)都不是必須的,但是最好它們?nèi)』蜻\(yùn)算后為真。從小夕身邊的小伙伴的情況看,只要取或運(yùn)算后為真,一般BAT的核心研究部門(mén)或者核心業(yè)務(wù)部門(mén)最少也能拿一個(gè)offer。

    如果很不幸成為了“三無(wú)人員”,那么一定要保證扎實(shí)的數(shù)學(xué)、NLP、coding能力和最少一個(gè)研究方向的專(zhuān)精,能夠在面試時(shí)表現(xiàn)出超出簡(jiǎn)歷描述的能力,這樣也會(huì)非常打動(dòng)面試官的,畢竟誰(shuí)都想招一個(gè)潛力股嘛。

    干貨篇

    1. 面試中的基礎(chǔ)知識(shí)

    這一篇說(shuō)起來(lái)都是淚,小夕曾經(jīng)努力擠出時(shí)間復(fù)習(xí),手?jǐn)]了一遍邏輯回歸、最大熵、決策樹(shù)、樸素貝葉斯、SVM、Adaboost、EM、HMM、CRF的推導(dǎo),結(jié)果發(fā)現(xiàn)從來(lái)沒(méi)被問(wèn)到過(guò)。。。從來(lái)沒(méi)被問(wèn)到過(guò)。。。從來(lái)沒(méi)。。。

    然后很奇葩的竟然被問(wèn)到過(guò)TCP三次握手,hadoop中的shuffle機(jī)制,linux的find命令怎么用。。。(from 今日頭條)

    雖然實(shí)現(xiàn)NLP的方法基本離不開(kāi)機(jī)器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò),但是如果按照前面簡(jiǎn)歷篇講的準(zhǔn)備簡(jiǎn)歷內(nèi)容,其實(shí)在NLP崗的面試中很少直接考察ML和NN的理論知識(shí)。那考察什么呢?當(dāng)然是考察關(guān)鍵詞呀!所以總結(jié)一下自己簡(jiǎn)歷的關(guān)鍵詞,然后展開(kāi)復(fù)習(xí)吧!

    下面小夕拿自己舉個(gè)例子。小夕簡(jiǎn)歷上出現(xiàn)的NLP關(guān)鍵字如

    問(wèn)答、MRC、對(duì)話、匹配、詞向量、遷移、分類(lèi)、分詞、POS、NER等

    下面是面試中考過(guò)的基礎(chǔ)知識(shí)舉例

    trick:方向不match的面試官喜歡考察詞向量和文本分類(lèi)相關(guān)的知識(shí)

    模型篇

    • SGNS/cBoW、FastText、ELMo等(從詞向量引出)

    • DSSM、DecAtt、ESIM等(從問(wèn)答&匹配引出)

    • HAN、DPCNN等(從分類(lèi)引出)

    • BiDAF、DrQA、QANet等(從MRC引出)

    • CoVe、InferSent等(從遷移引出)

    • MM、N-shortest等(從分詞引出)

    • Bi-LSTM-CRF等(從NER引出)

    • LDA等主題模型(從文本表示引出)

    訓(xùn)練篇

    • point-wise、pair-wise和list-wise(匹配、ranking模型)

    • 負(fù)采樣、NCE

    • 層級(jí)softmax方法,哈夫曼樹(shù)的構(gòu)建

    • 不均衡問(wèn)題的處理

    • KL散度與交叉熵loss函數(shù)

    評(píng)價(jià)指標(biāo)篇

    • F1-score

    • PPL

    • MRR、MAP

    可以看出,其實(shí)面試考察的基礎(chǔ)知識(shí)的內(nèi)容跟簡(jiǎn)歷中的關(guān)鍵字高度相關(guān)有木有。雖然偶爾也會(huì)問(wèn)到一些超出關(guān)鍵字限制的范圍,但是非常非常少,而且基本都是些跟研究方向無(wú)關(guān)的基礎(chǔ)知識(shí)。當(dāng)然,這個(gè)前提是按照前面簡(jiǎn)歷篇的建議來(lái)認(rèn)真構(gòu)造“算法研究”的板塊吶。身邊不少小伙伴吐槽面試官問(wèn)的問(wèn)題很偏,跟自己的方向差別大,然而都木有反思過(guò)自己的簡(jiǎn)歷到底有沒(méi)有告訴面試官自己擅長(zhǎng)什么,遇到不match的面試官的話肯定被問(wèn)成狗哇。(當(dāng)然,遇到完全不看簡(jiǎn)歷,方向又跟自己不match的面試官的話可以善意的提醒“抱歉我不是做這個(gè)方向的”)

    2. 面試中的設(shè)計(jì)/方案題

    除了基礎(chǔ)知識(shí),有的公司還會(huì)出一些開(kāi)放性的設(shè)計(jì)題(尤其在最后一兩輪面試或者是為SP、SSP設(shè)置的加面時(shí)),解這些設(shè)計(jì)題主要還是靠項(xiàng)目和比賽的經(jīng)驗(yàn)積累,切忌不要只拿論文說(shuō)事兒,要站在以最小代價(jià)來(lái)解決問(wèn)題的角度出方案,而不是非要用上最新的論文

    解這類(lèi)題的一條基本原則是,能用規(guī)則解決就不要用數(shù)據(jù),能用簡(jiǎn)單特征工程解決就不要上大型神經(jīng)網(wǎng)絡(luò),上大型網(wǎng)絡(luò)時(shí)盡量不要使用深度LSTM這類(lèi)推理復(fù)雜度太高的東西。

    最后總結(jié)一下,精心的準(zhǔn)備好簡(jiǎn)歷,那么從巨頭到startup的面試其實(shí)都大同小異(個(gè)別奇葩面試套路的公司除外)。hold住自己的簡(jiǎn)歷和研究方向,白板編程別太差,面試基本都能過(guò)。另外,小夕參加的都是提前批,不太清楚正式批會(huì)不會(huì)有變化。不過(guò)貌似正式批的NLP崗少得多,盡量不要把重心放正式批哦

    TIPS篇

  • 一定不要錯(cuò)過(guò)提前批!一定不要錯(cuò)過(guò)提前批!一定不要錯(cuò)過(guò)提前批!不要相信錯(cuò)過(guò)提前批還有正式批的鬼話,很多核心部門(mén)的NLP崗的hc在提前批就用光了!

  • 提前批不要拖到末尾!尤其百度自然語(yǔ)言處理部的坑,面試當(dāng)天就給口頭offer,先占先得!

  • 阿里基本是遠(yuǎn)程面試,6輪面試都沒(méi)編程題!簡(jiǎn)歷內(nèi)容準(zhǔn)備好就可以直接投阿里了!

  • 內(nèi)推之前千萬(wàn)不要把簡(jiǎn)歷掛到騰訊校招系統(tǒng),填上意向部門(mén)都沒(méi)用,不match的其他部門(mén)很可能以迅雷不及掩耳之勢(shì)強(qiáng)行撈起你的簡(jiǎn)歷,然后你的騰訊之旅就舉步維艱了(我跟另外倆小伙伴血的教訓(xùn)。。。)

  • 如果只是想找算法崗,但沒(méi)有研究方向,沒(méi)刷幾篇paper,不過(guò)研發(fā)能力強(qiáng),基礎(chǔ)編程題解的快,工具用的熟,那就去投頭條吧。(親測(cè)它提前批的三輪技術(shù)面都沒(méi)學(xué)術(shù)味兒,所以優(yōu)勢(shì)在對(duì)立面的小伙伴謹(jǐn)慎)

  • 網(wǎng)易游戲可能是國(guó)內(nèi)唯一一家不用在性別欄2選1的企業(yè)(測(cè)評(píng)界面),無(wú)償點(diǎn)個(gè)贊(其他大廠能不能效仿一下啊喂,優(yōu)秀的跨性別小姐姐小哥哥那么多,照顧一下嘛\(//?//)\)

  • 謹(jǐn)慎投遞跟第三方招聘網(wǎng)站合作的企業(yè),除非你想換手機(jī)號(hào)了╮(╯▽╰)╭

  • 總結(jié)

    以上是生活随笔為你收集整理的别再搜集面经啦!小夕教你斩下NLP算法岗offer!的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。