螞蟻 網(wǎng)銀 NLP算法面經(jīng)
4.21 投簡歷
4.23 約后天一面
4.25 一面
無手撕,上來先拷打論文,其中有個(gè)地方用了rag,面試官問我這里是怎么把文本轉(zhuǎn)換成向量儲(chǔ)存的。(我以為是問我工程上的實(shí)現(xiàn),這是去年做的一個(gè)小模塊,回憶了半天細(xì)節(jié),答得支支吾吾,面完了之后結(jié)合下一個(gè)問我才意識到其實(shí)是問我embedding過程)
看我支支吾吾就直接問transformer是怎么把token處理成向量的。
transformer的self-attention和cross self-attention區(qū)別在哪里。
pre-norm和post-norm的區(qū)別?進(jìn)一步,為什么現(xiàn)在主流大模型都用post-norm。
lora的實(shí)現(xiàn)過程。
大模型用的Loss函數(shù)是什么(交叉熵)?進(jìn)一步,使用teaching forcing訓(xùn)練時(shí)使用真實(shí)標(biāo)簽作為輸入,而推理時(shí)則是使用模型的輸出作為輸入,這導(dǎo)致了訓(xùn)練階段和推理階段之間的不一致性,為什么會(huì)用這個(gè)gap。(我在想不是都把原因說出來了嗎...這個(gè)問題也答得不太好)
然后開始介紹業(yè)務(wù),大概是做網(wǎng)上銀行的客服機(jī)器人。
反問:
如果我有幸能進(jìn)入你們部門,大概會(huì)分配給我什么樣的工作:不確定,要等來了之后才知道。
從今天的面試來看,你覺得我有什么地方需要改進(jìn)的嗎:去熟悉熟悉自己的論文和項(xiàng)目吧(因?yàn)橐婚_始被問到那個(gè)確實(shí)答得不太好。)
面試官全程給的壓力有點(diǎn)大,本來都以為涼了,結(jié)果居然五分鐘后約二面。
4.27 二面
無手撕,直接拷打兩篇論文,期間問了一點(diǎn)點(diǎn)八股。
簡述DPO、PPO、GRPO的區(qū)別。
問我在讀研期間學(xué)習(xí)后最擅長的技能是什么,我回答數(shù)據(jù)集構(gòu)造和強(qiáng)化學(xué)習(xí),于是出了一道場景題:如果部門上線的客服機(jī)器人,和人工相比不僅語氣僵硬而且可能會(huì)有不安全回復(fù)或者幻覺,如何解決?(感覺答得也不太好,一面之后稍微了解了下客服機(jī)器人的內(nèi)容,但是答得太淺了)
反問:
作為行業(yè)中的前輩,你能給一些我為了之后工作可以學(xué)習(xí)的內(nèi)容的建議嗎:這得看你自己,基礎(chǔ)知識要你自己學(xué),針對性的技術(shù)要看你之后的業(yè)務(wù),不能給一個(gè)寬泛的建議。
總共有幾面:就兩個(gè)技術(shù)面,這輪面試我就會(huì)決定結(jié)果。
一小時(shí)后公眾號顯示二面過,目前等約hr面。
--------------------------------------
5.7更新,約了明天下午hr面
總結(jié):螞蟻效率真的快,投簡歷到二面過不到一個(gè)星期,第一位面試官雖然有點(diǎn)嚴(yán)肅但也沒為難我,第二位面試官人也很好。全程除了筆試沒有手撕,八股文問的不多也比較簡單,有點(diǎn)白準(zhǔn)備了。由于暑期實(shí)習(xí)開始準(zhǔn)備的很晚還以為和大廠無緣了,要是能去螞蟻我以后只用支付寶。