1.DPO的loss,dpo相比于ppo的不同,dpo為什么容易過擬合,dpo后續(xù)的改進(jìn)方面有哪些,
2.大模型在垂直領(lǐng)域應(yīng)用時(shí),怎么緩解模型的遺忘問題。
暫無評(píng)論,快來?yè)屖自u(píng)~
相關(guān)推薦