NLP算法面經(jīng)14
10.15 攜程 NLP(2+1)
1. 項(xiàng)目+實(shí)習(xí)
2. Lora原理以及初始化
3. Lora參數(shù)含義
4. Deepspeed三階段
5. 強(qiáng)化學(xué)習(xí)框架
6. PPO,DPO,GRPO
7. PPO的critic model作用
8. 大模型溫度系數(shù)作用,topk和p的區(qū)別
9. bert的位置編碼以及ROPE
10. 深入探討Deepseek的技術(shù)
11. 深入探討MOE和Dense模型
12. 代碼題:接雨水
#大模型# #多模態(tài)人工智能# #nlp# #互聯(lián)網(wǎng)大廠# #互聯(lián)網(wǎng)大廠實(shí)習(xí)# #面經(jīng)# #攜程#
1. 項(xiàng)目+實(shí)習(xí)
2. Lora原理以及初始化
3. Lora參數(shù)含義
4. Deepspeed三階段
5. 強(qiáng)化學(xué)習(xí)框架
6. PPO,DPO,GRPO
7. PPO的critic model作用
8. 大模型溫度系數(shù)作用,topk和p的區(qū)別
9. bert的位置編碼以及ROPE
10. 深入探討Deepseek的技術(shù)
11. 深入探討MOE和Dense模型
12. 代碼題:接雨水
#大模型# #多模態(tài)人工智能# #nlp# #互聯(lián)網(wǎng)大廠# #互聯(lián)網(wǎng)大廠實(shí)習(xí)# #面經(jīng)# #攜程#
全部評(píng)論
Lora參數(shù)詳解下
相關(guān)推薦