??【AI界的新星】DeepSeek：一鳴驚人的背后故事

?? 在AI領(lǐng)域，DeepSeek的名字如同一顆耀眼的新星，自發(fā)布以來便引起廣泛關(guān)注。但你是否好奇，這個團隊成功的秘訣是什么？讓我們一起揭開DeepSeek背后的故事。

年輕化的研發(fā)團隊

一、應(yīng)屆在讀生的活力注入

DeepSeek團隊的一大特色就是年輕。在這個團隊中，應(yīng)屆生和在讀生占據(jù)了相當大的比例。他們思維敏捷、充滿活力，對新技術(shù)有著敏銳的洞察力和強烈的探索欲望，為DeepSeek的發(fā)展注入了源源不斷的動力和創(chuàng)新活力。

二、清北應(yīng)屆生的關(guān)鍵貢獻

在DeepSeek團隊中，來自清華大學和北京大學的應(yīng)屆生尤其突出。他們不僅在學術(shù)上有著扎實的功底，而且在實際工作中也展現(xiàn)出了卓越的能力。這些清北應(yīng)屆生的加入，為DeepSeek帶來了許多關(guān)鍵的技術(shù)創(chuàng)新和項目成果。

技術(shù)創(chuàng)新與突破

一、GRPO算法的突破

DeepSeek的突破之一，是通過名為GRPO的算法，創(chuàng)新訓練方法，大大降低了成本。這一成果離不開團隊成員曾旺丁的研究和開發(fā)工作，他的貢獻為DeepSeek-Math項目和整個強化學習領(lǐng)域的發(fā)展帶來了新突破。

二、MLA架構(gòu)的創(chuàng)新

北京大學的高華佐是MLA架構(gòu)的關(guān)鍵創(chuàng)新者之一。他的創(chuàng)新思維和嚴謹態(tài)度，為DeepSeek的技術(shù)進步提供了有力的支持。此外，他的名字也出現(xiàn)在“大模型創(chuàng)業(yè)六小強”之一的階躍星辰的專利信息中，顯示了他在AI領(lǐng)域的影響力和活躍度。

人才濟濟的團隊

一、羅福莉：算法創(chuàng)新的領(lǐng)軍者

出生于四川的95后羅福莉，從北京師范大學計算機專業(yè)本科畢業(yè)后，又在北大計算語言學專業(yè)深造。這位才華橫溢的學者在2019年國際頂級會議ACL上發(fā)表8篇論文，其中2篇為第一作者。她的職業(yè)生涯始于阿里巴巴達摩院，主導開發(fā)了多語言預訓練模型VECO，并推動了AliceMind的開源工作。2022年，羅福莉加入DeepSeek，參與了MoE大模型DeepSeek-V2的研發(fā)。2024年，她被傳聞將以千萬年薪加入小米，擔任AI實驗室大模型團隊負責人。12月31日，羅福莉的高中班主任告訴紅星新聞記者，羅福莉還沒決定去小米，還在考慮。

二、高華佐：MLA架構(gòu)的幕后推手

低調(diào)的北大物理系畢業(yè)生高華佐，在DeepSeek團隊中憑借扎實的物理基礎(chǔ)和對AI技術(shù)的深刻理解，為MLA架構(gòu)的提出和發(fā)展做出了重要貢獻。他的創(chuàng)新思維和嚴謹態(tài)度，為DeepSeek的技術(shù)進步提供了有力支持。在“大模型創(chuàng)業(yè)六小強”之一階躍星辰的專利信息中也能看到他的名字，雖然暫不確定是否是同一人，但從側(cè)面顯示出他在AI領(lǐng)域的影響力。

三、曾旺丁：強化學習的突破者

北郵人工智能與網(wǎng)絡(luò)搜索教研中心主任張洪剛的得意門生曾旺丁，主導了GRPO算法的研究和開發(fā)工作。他深入分析了強化學習中的關(guān)鍵問題和難點，提出了GRPO算法，為DeepSeek-Math項目和整個強化學習領(lǐng)域的發(fā)展做出了突出貢獻。

四、邵智宏：AI系統(tǒng)構(gòu)建的探索者

清華交互式人工智能課題組的博士生邵智宏，研究領(lǐng)域包括自然語言處理、深度學習等。他在DeepSeek團隊中參與了多個項目，為公司在自然語言處理和AI系統(tǒng)構(gòu)建方面的發(fā)展做出了重要貢獻。他的研究成果在國際頂級會議上多次亮相，并在微軟研究院積累了豐富的研究和實踐經(jīng)驗。

五、朱琪豪：深度代碼學習的先鋒

北大的朱琪豪校友，研究方向為深度代碼學習技術(shù)。他在國際頂級會議上發(fā)表了16篇CCF-A類論文，并憑借基于語法制導的程序修復技術(shù)獲得ESEC/FSE 2021杰出論文提名獎。他主導開發(fā)的DeepSeek-Coder-V1達到國際領(lǐng)先水平，廣泛應(yīng)用于反編譯、代碼分析、代碼修復等領(lǐng)域。

六、代達勱與王炳宣：DeepSeek的元老級成員

北大的代達勱和王炳宣，從DeepSeek-V1開始就加入了團隊。他們參與了DeepSeek LLM v1到v3的一系列重要工作，為DeepSeek的發(fā)展貢獻了自己的力量。

七、梁文鋒：AI領(lǐng)域的夢想家

出生于廣東的梁文鋒，從小就成績優(yōu)異。他在浙江大學電子信息工程專業(yè)本科畢業(yè)后，繼續(xù)攻讀信息與通信工程專業(yè)研究生。2015年，他與同學共同創(chuàng)立了量化對沖基金公司幻方量化，幾年時間管理規(guī)模迅速超百億。2023年，他正式進軍通用人工智能領(lǐng)域，創(chuàng)立了DeepSeek，并發(fā)布了DeepSeek-V2開源MoE模型，引發(fā)了大模型“價格戰(zhàn)”。

DeepSeek團隊的成功，不僅為公司帶來了巨大的價值和聲譽，也為整個AI行業(yè)提供了寶貴的經(jīng)驗和啟示。年輕化的團隊結(jié)構(gòu)、技術(shù)創(chuàng)新的突破，以及人才的濟濟一堂，都為AI行業(yè)的發(fā)展注入了新的活力和希望。