??【AI界的新星】DeepSeek:一鳴驚人的背后故事
?? 在AI領(lǐng)域,DeepSeek的名字如同一顆耀眼的新星,自發(fā)布以來便引起廣泛關(guān)注。但你是否好奇,這個團隊成功的秘訣是什么?讓我們一起揭開DeepSeek背后的故事。
年輕化的研發(fā)團隊
一、應(yīng)屆在讀生的活力注入
DeepSeek團隊的一大特色就是年輕。在這個團隊中,應(yīng)屆生和在讀生占據(jù)了相當大的比例。他們思維敏捷、充滿活力,對新技術(shù)有著敏銳的洞察力和強烈的探索欲望,為DeepSeek的發(fā)展注入了源源不斷的動力和創(chuàng)新活力。
二、清北應(yīng)屆生的關(guān)鍵貢獻
在DeepSeek團隊中,來自清華大學和北京大學的應(yīng)屆生尤其突出。他們不僅在學術(shù)上有著扎實的功底,而且在實際工作中也展現(xiàn)出了卓越的能力。這些清北應(yīng)屆生的加入,為DeepSeek帶來了許多關(guān)鍵的技術(shù)創(chuàng)新和項目成果。
技術(shù)創(chuàng)新與突破
一、GRPO算法的突破
DeepSeek的突破之一,是通過名為GRPO的算法,創(chuàng)新訓練方法,大大降低了成本。這一成果離不開團隊成員曾旺丁的研究和開發(fā)工作,他的貢獻為DeepSeek-Math項目和整個強化學習領(lǐng)域的發(fā)展帶來了新突破。
二、MLA架構(gòu)的創(chuàng)新
北京大學的高華佐是MLA架構(gòu)的關(guān)鍵創(chuàng)新者之一。他的創(chuàng)新思維和嚴謹態(tài)度,為DeepSeek的技術(shù)進步提供了有力的支持。此外,他的名字也出現(xiàn)在“大模型創(chuàng)業(yè)六小強”之一的階躍星辰的專利信息中,顯示了他在AI領(lǐng)域的影響力和活躍度。
人才濟濟的團隊
一、羅福莉:算法創(chuàng)新的領(lǐng)軍者
出生于四川的95后羅福莉,從北京師范大學計算機專業(yè)本科畢業(yè)后,又在北大計算語言學專業(yè)深造。這位才華橫溢的學者在2019年國際頂級會議ACL上發(fā)表8篇論文,其中2篇為第一作者。她的職業(yè)生涯始于阿里巴巴達摩院,主導開發(fā)了多語言預訓練模型VECO,并推動了AliceMind的開源工作。2022年,羅福莉加入DeepSeek,參與了MoE大模型DeepSeek-V2的研發(fā)。2024年,她被傳聞將以千萬年薪加入小米,擔任AI實驗室大模型團隊負責人。12月31日,羅福莉的高中班主任告訴紅星新聞記者,羅福莉還沒決定去小米,還在考慮。
二、高華佐:MLA架構(gòu)的幕后推手
低調(diào)的北大物理系畢業(yè)生高華佐,在DeepSeek團隊中憑借扎實的物理基礎(chǔ)和對AI技術(shù)的深刻理解,為MLA架構(gòu)的提出和發(fā)展做出了重要貢獻。他的創(chuàng)新思維和嚴謹態(tài)度,為DeepSeek的技術(shù)進步提供了有力支持。在“大模型創(chuàng)業(yè)六小強”之一階躍星辰的專利信息中也能看到他的名字,雖然暫不確定是否是同一人,但從側(cè)面顯示出他在AI領(lǐng)域的影響力。
三、曾旺丁:強化學習的突破者
北郵人工智能與網(wǎng)絡(luò)搜索教研中心主任張洪剛的得意門生曾旺丁,主導了GRPO算法的研究和開發(fā)工作。他深入分析了強化學習中的關(guān)鍵問題和難點,提出了GRPO算法,為DeepSeek-Math項目和整個強化學習領(lǐng)域的發(fā)展做出了突出貢獻。
四、邵智宏:AI系統(tǒng)構(gòu)建的探索者
清華交互式人工智能課題組的博士生邵智宏,研究領(lǐng)域包括自然語言處理、深度學習等。他在DeepSeek團隊中參與了多個項目,為公司在自然語言處理和AI系統(tǒng)構(gòu)建方面的發(fā)展做出了重要貢獻。他的研究成果在國際頂級會議上多次亮相,并在微軟研究院積累了豐富的研究和實踐經(jīng)驗。
五、朱琪豪:深度代碼學習的先鋒
北大的朱琪豪校友,研究方向為深度代碼學習技術(shù)。他在國際頂級會議上發(fā)表了16篇CCF-A類論文,并憑借基于語法制導的程序修復技術(shù)獲得ESEC/FSE 2021杰出論文提名獎。他主導開發(fā)的DeepSeek-Coder-V1達到國際領(lǐng)先水平,廣泛應(yīng)用于反編譯、代碼分析、代碼修復等領(lǐng)域。
六、代達勱與王炳宣:DeepSeek的元老級成員
北大的代達勱和王炳宣,從DeepSeek-V1開始就加入了團隊。他們參與了DeepSeek LLM v1到v3的一系列重要工作,為DeepSeek的發(fā)展貢獻了自己的力量。
七、梁文鋒:AI領(lǐng)域的夢想家
出生于廣東的梁文鋒,從小就成績優(yōu)異。他在浙江大學電子信息工程專業(yè)本科畢業(yè)后,繼續(xù)攻讀信息與通信工程專業(yè)研究生。2015年,他與同學共同創(chuàng)立了量化對沖基金公司幻方量化,幾年時間管理規(guī)模迅速超百億。2023年,他正式進軍通用人工智能領(lǐng)域,創(chuàng)立了DeepSeek,并發(fā)布了DeepSeek-V2開源MoE模型,引發(fā)了大模型“價格戰(zhàn)”。
DeepSeek團隊的成功,不僅為公司帶來了巨大的價值和聲譽,也為整個AI行業(yè)提供了寶貴的經(jīng)驗和啟示。年輕化的團隊結(jié)構(gòu)、技術(shù)創(chuàng)新的突破,以及人才的濟濟一堂,都為AI行業(yè)的發(fā)展注入了新的活力和希望。