因為??蜕衔疫€有一毛錢的激勵計劃獎金所以我決定繼續(xù)更新。
ok,那么正式開坑吧,個人而言因為Java實在競爭太激烈,(在月薪3k的小廠,有十幾個人去面試競爭,甚至有個天津大學(xué)的985碩士和我搶飯碗,我決定直接跳車,不卷了)所以投入大模型的學(xué)習(xí)之中。那么目標(biāo)自然是做agent開發(fā)或者大模型開發(fā)了,
這里很多人會問,現(xiàn)在去找大模型好找嗎?我明確的說,我不知道,但我要all in,因為大模型工資實習(xí)工資比java開發(fā)更高,而且它更新,這是為什么我要學(xué)它。
然后很多人就是說這個東西是不是現(xiàn)在沒有什么成體系的學(xué)習(xí)資料,我明確的說,是的,以我自身就是純按照興趣+boss招聘信息去學(xué),因為很多公司自己也沒整明白,有非常多小公司初創(chuàng)公司招這個,競爭激烈程度大概是56個人搶一個崗位,要比java動不動幾十份簡歷好的太多,同時公司自己也不太會,因為沒有體系化的八股文而且能夠?qū)崿F(xiàn)自身想法。這是非常大的優(yōu)勢。
那么問題來了,你想問大模型怎么學(xué),然后大模型有哪些方向。
這里首先大模型應(yīng)該是分成prompt工程師,agent開發(fā),算法底層開發(fā),pytorch/transflow框架開發(fā)這幾種,
基本上很多公司自己沒搞明白,可能你進(jìn)去就是天天接入接口,然后無腦問ai,也可能上來直接干論文實現(xiàn),或者使用cursor/trae這種接入ai問答模型的工具開始愉快的一行代碼不寫debug一天,也可能直接加入項目去參加meatgpt/hugging face等開源項目。
但是無一例外,實習(xí)工作是沒有傳統(tǒng)開發(fā)那樣枯燥的,不管你是用什么語言,基本上都逃不過crud,重復(fù)造輪子,而大模型不會,
每一天都有所收獲,每一天都能夠?qū)崿F(xiàn)新東西。
這里基本上分為幾種agent開發(fā),一部分是使用dify/coze上面的這種預(yù)訓(xùn)練模型(這兩個本質(zhì)上類似于開發(fā)者倉庫,你可以把實現(xiàn)的東西放上去但是收費,并且能夠在上面用拖拉拽實現(xiàn)小型agent),另一種則是調(diào)用pytorch這種框架或者下載幾十G的知識庫自己手搓出全新的agent,
這里不得不提到RAG的概念,現(xiàn)在大部分使用的對話大模型類似于deepseek/qwen基本上都是接入到10月份的知識庫,由于法律明確的干涉所以暫停ai接入實事,也能夠減少ai造假的情況,那么我們想要實現(xiàn)接入最新知識或者發(fā)表的論文怎么辦,這里就要用到檢索增強模型(RAG),它本質(zhì)上是一個向量模型數(shù)據(jù)庫,說白了,就是個高階數(shù)據(jù)庫,大體工作流程為拆包,(切小塊的數(shù)據(jù)),加載數(shù)據(jù),錄入數(shù)據(jù),調(diào)用數(shù)據(jù),最新的數(shù)據(jù)會作為知識庫的一部分。
寫了不少東西了,看看有沒有人看吧,大伙感興趣我就更新下一期,打一把dota先。
#??徒鈶n鋪##牛友故事會##??图钣媱?#??蛣?chuàng)作賞金賽#