欧美1区2区3区激情无套,两个女人互添下身视频在线观看,久久av无码精品人妻系列,久久精品噜噜噜成人,末发育娇小性色xxxx

騰訊大模型(技術(shù)研究-自然語言處理)面經(jīng)

補(bǔ)發(fā)一下之前面試騰訊的面經(jīng),具體timeline可以參考前面的帖子。

一面(約30mins):
自我介紹,挑一個(gè)簡歷里最好的一個(gè)項(xiàng)目詳細(xì)介紹下
項(xiàng)目中遇到了什么挑戰(zhàn),怎么解決的
了解DeepSeek嗎,為什么DeepSeek現(xiàn)在這么火?
說一下DeepSeek里的MLA和GRPO
GRPO和DPO,PPO,RLHF的區(qū)別
看你之前有LoRA微調(diào)DeepSeek的項(xiàng)目,簡單說說微調(diào)經(jīng)驗(yàn),效果如何
RAG在檢索階段能有哪些優(yōu)化?(sub-query,HyDE等)

二面(約1h10mins):
自我介紹,拷打簡歷。
寫一下GRPO的公式
先屏幕共享從頭到尾walk through講一下DeepSeek技術(shù)報(bào)告論文。面試官中間會(huì)穿插提問
DeepSeek-v3/r1/r1-zero有什么區(qū)別
DeepSeek-r1-zero的冷啟動(dòng)數(shù)據(jù)是怎么組成的
DeepSeek-r1-zero解決了DeepSeek-r1的哪些問題
如何解決大模型的幻覺
Embedding如何微調(diào)(講了對(duì)比學(xué)習(xí)啥的)
RAG的評(píng)測指標(biāo)有哪些
業(yè)界現(xiàn)在function call的做法和水平
場景題:大致是RAG中檢索結(jié)果遇到張冠李戴的問題該如何解決
舉幾個(gè)例子能夠體現(xiàn)你的研究能力

三面(約30mins)
拷打LoRA微調(diào)項(xiàng)目,問了實(shí)驗(yàn)的數(shù)據(jù)集,參數(shù)設(shè)置,結(jié)果如何等等
你目前的研究方向主要是什么?
講一下ReRanker的目的,做法有哪些
場景題:我現(xiàn)在運(yùn)用RAG來檢索回答,目標(biāo)是檢索四個(gè)季度的表格數(shù)據(jù),但是經(jīng)過檢索+ReRanker后只出現(xiàn)了三個(gè)季度的數(shù)據(jù),該如何解決

hr面(約15mins)
比較常規(guī),大致如下:
用三個(gè)詞語描述下你為何能勝任這份工作
你的優(yōu)缺點(diǎn)都說一下
你過往實(shí)習(xí)項(xiàng)目中遇到過的最大困難是什么,怎么解決的
最早實(shí)習(xí)時(shí)間,實(shí)習(xí)時(shí)常

引流:騰訊字節(jié)阿里淘天美團(tuán)拼多多

#暑期實(shí)習(xí)##騰訊##大模型#
全部評(píng)論
接好運(yùn)
2 回復(fù) 分享
發(fā)布于 04-21 15:47 廣東
算法也看看我們這里呀,急招崗
點(diǎn)贊 回復(fù) 分享
發(fā)布于 04-21 18:41 天津

相關(guān)推薦

??面試問題:#找實(shí)習(xí)#(4.9)Q1:簡單介紹一下在研究生期間的科研和實(shí)習(xí)經(jīng)歷。Q2:介紹一下簡歷上那個(gè)完整的大模型項(xiàng)目。Q3:做這個(gè)項(xiàng)目的背景,做項(xiàng)目的動(dòng)機(jī)。Q4:第三個(gè)項(xiàng)目是實(shí)習(xí)項(xiàng)目嗎?Q5:對(duì)第1個(gè)項(xiàng)目有用NER的方法嗎?微調(diào)前base模型的準(zhǔn)確率是多少?Q6:第2個(gè)項(xiàng)目的數(shù)據(jù)集構(gòu)造是不是有問題?這些數(shù)據(jù)的判斷是不是對(duì)大模型來說太簡單了?Q7:有用傳統(tǒng)方法來測你構(gòu)造數(shù)據(jù)集的有效性嗎?比如用BERTQ8:介紹一下Lora的原理。Q9:LORA基于什么問題,什么樣的模型可以用LORA進(jìn)行微調(diào)?什么是低秩分解?Q10:LORA的初始化方法。Q11:兩個(gè)權(quán)重矩陣的初始化。Q12:項(xiàng)目中的可解釋性模塊是什么?Q13:介紹一下Int8和FP32的區(qū)別是什么?Q14:Int8的表示范圍。Q15:Int8和FP32前向計(jì)算的區(qū)別。Q16:除了大模型,你對(duì)推薦系統(tǒng),CV模型有了解嗎?手撕代碼:lc82. 刪除排序鏈表中的重復(fù)元素 II反問:做什么業(yè)務(wù)(淘寶直播生態(tài)和主播智能手卡)進(jìn)組后做什么業(yè)務(wù)(預(yù)訓(xùn)練)??面試體驗(yàn):挺好的,注重業(yè)務(wù),八股并不多。
查看16道真題和解析
點(diǎn)贊 評(píng)論 收藏
分享
結(jié)合最近輔助修改的簡歷及項(xiàng)目,老師總結(jié)了部分大模型微調(diào)簡歷的踩雷點(diǎn)。???♂?錯(cuò)誤示范:在 x任務(wù)中,獲取 xxx 條數(shù)據(jù),通過規(guī)則 or 腳本清洗出 x 條數(shù)據(jù),然后微調(diào) y 大模型,在業(yè)務(wù)上提升 x 個(gè)點(diǎn)。???原因:大模型微調(diào)的平臺(tái)是現(xiàn)成的,基模是現(xiàn)成的,體現(xiàn)不出核心能力。?應(yīng)該怎么寫?首先介紹業(yè)務(wù)背景:業(yè)務(wù)是一個(gè)銷售對(duì)話業(yè)務(wù),機(jī)器人是銷售,代替真人,直接面對(duì)用戶。我們會(huì)給模型設(shè)定任務(wù),任務(wù)是 prompt 。步驟1??.提取訓(xùn)練數(shù)據(jù)問題:1.真人通話每通電話任務(wù)是未知的,我們訓(xùn)練數(shù)據(jù)是任務(wù)+通話的 pair 對(duì)。2.真人通話很亂,與客戶的對(duì)話是各種交叉的,導(dǎo)致 asr 后并不是一人一輪。解決方案:1.首先通過大模型 prompt 對(duì)該通電話提取任務(wù),得到任務(wù)+ pair 對(duì)。需要用到 cot + reflection +多 Ilm 一致性+ debating 的模式。2.使用大模型根據(jù)以上任務(wù)和真人對(duì)話,讓大模型編寫出通話內(nèi)容。提問,為什么要編寫而不是直接用?步驟2??.制定訓(xùn)練數(shù)據(jù)集問題:1、正常的對(duì)話內(nèi)容,前面幾句和后面幾句基本上一致的。都是問候和拜拜,但是也有一些差異。2、因?yàn)槎际窍嗨茍鼍?,雖然任務(wù)不同,但是很多場景語義很相似。解決方案:1、基于輪次的權(quán)重采樣:通過輪次設(shè)定權(quán)重進(jìn)行 weighting sample 。解決問候和拜拜的高占比問題。2、基于語義的采樣:使用 bert 對(duì)對(duì)話內(nèi)容進(jìn)行 embedding ,然后使用層次聚類通過調(diào)節(jié)閾值聚類出相似語義的類。對(duì)一個(gè)類里的樣本進(jìn)行隨機(jī)采樣,提問,為什么要對(duì)重復(fù)語義的數(shù)據(jù)進(jìn)行下采樣?3、基于客戶類型和產(chǎn)品的采樣,因?yàn)楹芏喈a(chǎn)品是熱品,導(dǎo)致對(duì)話內(nèi)容有偏,用戶類型一樣,需按照類型調(diào)整整體比例采樣。提問,為什么要這么采樣?步驟3??.制定訓(xùn)練數(shù)據(jù)集我們直接把輸出當(dāng)作 target 進(jìn)行訓(xùn)練。使用的 lora 訓(xùn)練,但是 lora alpha 設(shè)定成為4倍的時(shí)候達(dá)到了比較好的效果,經(jīng)驗(yàn)值不同任務(wù)不一樣,提問,在各種情況下要怎么調(diào)?步驟4??.dpo訓(xùn)練問題:v1版本訓(xùn)練時(shí),很多輸出內(nèi)容是對(duì)的,但是輸出的語氣不太像真人,機(jī)器人味還是很嚴(yán)重。解決方案:由于訓(xùn)練本身是有 ground truth 的,因此使用v1訓(xùn)練的模型,預(yù)測訓(xùn)練集,使用大模型對(duì)比兩者語氣不符合訓(xùn)練集的拿出來,使用訓(xùn)練集的 ground truth 和模型的預(yù)測數(shù)據(jù)作為 dpo 訓(xùn)練對(duì),對(duì)v1版本模型重新訓(xùn)練。??這里老師只是簡要進(jìn)行概括解答,具體情況和詳細(xì)解答可以咨詢輔導(dǎo),如果想了解項(xiàng)目輔導(dǎo),提升面試能力,歡迎后臺(tái)聯(lián)系。#算法# #簡歷中的項(xiàng)目經(jīng)歷要怎么寫# #算法崗面試# #互聯(lián)網(wǎng)大廠招聘#
點(diǎn)贊 評(píng)論 收藏
分享
評(píng)論
5
27
分享

創(chuàng)作者周榜

更多
??途W(wǎng)
??推髽I(yè)服務(wù)