螞蟻網(wǎng)銀 NLP算法面經(jīng)

4.21 投簡歷

4.23 約后天一面

4.25 一面

無手撕，上來先拷打論文，其中有個(gè)地方用了rag，面試官問我這里是怎么把文本轉(zhuǎn)換成向量儲(chǔ)存的。(我以為是問我工程上的實(shí)現(xiàn)，這是去年做的一個(gè)小模塊，回憶了半天細(xì)節(jié)，答得支支吾吾，面完了之后結(jié)合下一個(gè)問我才意識到其實(shí)是問我embedding過程)

看我支支吾吾就直接問transformer是怎么把token處理成向量的。

transformer的self-attention和cross self-attention區(qū)別在哪里。

pre-norm和post-norm的區(qū)別？進(jìn)一步，為什么現(xiàn)在主流大模型都用post-norm。

lora的實(shí)現(xiàn)過程。

大模型用的Loss函數(shù)是什么(交叉熵)？進(jìn)一步，使用teaching forcing訓(xùn)練時(shí)使用真實(shí)標(biāo)簽作為輸入，而推理時(shí)則是使用模型的輸出作為輸入，這導(dǎo)致了訓(xùn)練階段和推理階段之間的不一致性，為什么會(huì)用這個(gè)gap。(我在想不是都把原因說出來了嗎...這個(gè)問題也答得不太好)

然后開始介紹業(yè)務(wù)，大概是做網(wǎng)上銀行的客服機(jī)器人。

反問：

如果我有幸能進(jìn)入你們部門，大概會(huì)分配給我什么樣的工作：不確定，要等來了之后才知道。

從今天的面試來看，你覺得我有什么地方需要改進(jìn)的嗎：去熟悉熟悉自己的論文和項(xiàng)目吧(因?yàn)橐婚_始被問到那個(gè)確實(shí)答得不太好。)

面試官全程給的壓力有點(diǎn)大，本來都以為涼了，結(jié)果居然五分鐘后約二面。

4.27 二面

無手撕，直接拷打兩篇論文，期間問了一點(diǎn)點(diǎn)八股。

簡述DPO、PPO、GRPO的區(qū)別。

問我在讀研期間學(xué)習(xí)后最擅長的技能是什么，我回答數(shù)據(jù)集構(gòu)造和強(qiáng)化學(xué)習(xí)，于是出了一道場景題：如果部門上線的客服機(jī)器人，和人工相比不僅語氣僵硬而且可能會(huì)有不安全回復(fù)或者幻覺，如何解決？(感覺答得也不太好，一面之后稍微了解了下客服機(jī)器人的內(nèi)容，但是答得太淺了)

反問：

作為行業(yè)中的前輩，你能給一些我為了之后工作可以學(xué)習(xí)的內(nèi)容的建議嗎：這得看你自己，基礎(chǔ)知識要你自己學(xué)，針對性的技術(shù)要看你之后的業(yè)務(wù)，不能給一個(gè)寬泛的建議。

總共有幾面：就兩個(gè)技術(shù)面，這輪面試我就會(huì)決定結(jié)果。

一小時(shí)后公眾號顯示二面過，目前等約hr面。

--------------------------------------

5.7更新，約了明天下午hr面

總結(jié)：螞蟻效率真的快，投簡歷到二面過不到一個(gè)星期，第一位面試官雖然有點(diǎn)嚴(yán)肅但也沒為難我，第二位面試官人也很好。全程除了筆試沒有手撕，八股文問的不多也比較簡單，有點(diǎn)白準(zhǔn)備了。由于暑期實(shí)習(xí)開始準(zhǔn)備的很晚還以為和大廠無緣了，要是能去螞蟻我以后只用支付寶。