男男19禁啪啪无遮挡免费,久久精品国产99久久久古代

發(fā)布(32) 評論刷題收藏

昨天 10:40

中山大學算法工程師

0 點贊評論收藏

05-09 19:12

中山大學算法工程師

投遞阿里云等公司10個崗位簡歷中的項目經歷要怎么寫

0 點贊評論收藏

05-08 07:49

中山大學算法工程師

為什么現(xiàn)在 LLM 很少使用 Dropout了？

翻遍各種大模型的實現(xiàn)，雖然結構上可能保留了 dropout 的實現(xiàn)，但是采樣概率都設置為 0 了。唯一一個比較新的，還用 Dropout 的模型是 Meta 訓練的 Galactica 模型。那為什么現(xiàn)在不用了呢？核心還是要弄清楚 Dropout 的使用場景。Dropout 之前在深度學習當中是一個特別好用的方法，可以防止過擬合，提高泛化。所以說，當模型較大，數(shù)據(jù)較少的時候，使用 Dropout 是比較合適的?，F(xiàn)在大模型處在什么狀態(tài)呢？?預訓練在預訓練階段，目前可能還是處于欠擬合的狀態(tài)。之所以說可能，是基于目前公開的一些論文的出的結論。但是現(xiàn)在閉源的公司在采用大量數(shù)據(jù)合成的情況下，已經訓練足夠充分或者接近充分也說不定。以 llama 一系列論文為例，訓練 llama 1 的時候，龍貓 Scaling law 里面提到 GPT3 是一個訓練很不充分的模型。然后給出的數(shù)據(jù)配比的建議是，10B 的模型要采用 200B 的 token 來訓練。但是 llama 1 采用了 7B 的模型，訓練量 1T 的 token 發(fā)現(xiàn)性能依然有提升。而且預訓練所有的語料一般只過一個 epoch，某些特定的領域可能過 2個 epoch，可以認為樣本的重復率很低。所以，在數(shù)據(jù)足夠多，多樣性足夠而且沒有太多重復的情況下，大模型在預訓練階段仍然沒有過擬合的風險。也就完全不需要采用 dropout。?Dropout 就完全不需要了么？如果上面的條件不能滿足，Dropout 還是有用武之地的。比如前面提到的 Galactica 模型。這個模型和其他大模型不太一樣的地方是訓練了 4.25 個 epoch，因為他們認為高質量的數(shù)據(jù)更重要一些，但是又沒有那么多，所以就 repeat 數(shù)據(jù)了。在論文《To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis》 中，詳細列舉了數(shù)據(jù) Repeat 對訓練 LLM 的影響，并且證明了 Dropout 可以緩解數(shù)據(jù)重復帶來的性能損失。在文章《Can LLMs learn from a single example?》中，也提到了在 SFT 的時候，少量的重復數(shù)據(jù)就會降低模型的性能。這也符合常理，SFT 的數(shù)據(jù)分布和預訓練的通常是不太一樣的，重復的數(shù)據(jù)會讓模型擬合新的分布，從而忘掉舊的分布。文中同樣也提到 Dropout 可以緩解數(shù)據(jù)重復帶來的影響。所以 Dropout 在數(shù)據(jù)量較少，多樣性不高，需要 repeat 的場景下，依然是一個減少過擬合的很方便的手段。比如現(xiàn)在已經有一些在 LoRA 微調的時候采用 Dropout 的研究了。

0 點贊評論收藏

05-07 12:50

已編輯

中山大學算法工程師

Beam Search 的時間復雜度是多少？

對于想求職算法崗的同學，如果想參加高質量項目輔導，提升面試能力，歡迎后臺聯(lián)系。

0 點贊評論收藏

05-06 11:43

中山大學算法工程師

大模型快速入門路徑

今天老師整理了大模型入門的幾個學習步驟、目標和需要掌握的基礎知識，供初學者快速掌握基本路徑。1??前置知識： Python 基礎、 Linux 基礎??學習內容1.熟練掌握 Python 語言，熟悉常用的Python 庫和工具，如 NumPy 、 Pandas 、  Scikit - learn 、 PyTorch 等。2.具備 NLP 相關的基礎知識，包括文本預處理、分詞、詞性標注等。3.對大模型有一定了解，包括Transformer 模型的結構和原理、基于注意力機制的自然語言處理技術等。2??Step1:NLP相關基礎知識??學習內容1.了解文本預處理、分詞、詞性標注、命名實體識別、詞向量表示等基礎知識。2.掌握機器學習中的數(shù)據(jù)預處理、特征提取、分類、回歸等基礎算法，并了解其在 NLP 領域的應用。3.了解大規(guī)模 NLP 任務中的常用技術和方法，如深度學習中的 Transformer 模型、 BERT 、 GPT 等。3??Step2:GPT API 調用及 Prompt 設計??學習內容了解 GPT API 的調用方式和基本操作，熟悉 Prompt 設計技巧和要點，能夠結合自己的任務調用 API 實現(xiàn)對應的任務代碼。4??Step3:模型微調（ Fine - tuning )??學習內容了解常見的微調模型的基本流程和原理，熟悉數(shù)據(jù)集的構造、訓練、評估等過程，能夠獨立構建 QA 對，在服務器上對模型進行微調。5??Step4: RAG （外掛數(shù)據(jù)庫）??學習內容RAG 作為目前最火的一個 LLM 落地方向，可以結合私有數(shù)據(jù)（表格、 word 、 txt 、 pdf 、數(shù)據(jù)庫皆可）實現(xiàn)本地問答，且訓練成本較低，可以快速實現(xiàn)效果。??有需要提升面試能力和輔導項目的同學可以后臺聯(lián)系我～

0 點贊評論收藏

05-05 11:43

中山大學算法工程師

鵝廠不同職級薪資待遇一覽表

今天老師給大家梳理了鵝廠不同職級薪資，供各位同學參考學習。??對于想求職算法崗的同學，如果想參加高質量項目輔導，提升面試能力，歡迎后臺聯(lián)系。

0 點贊評論收藏

05-04 17:51

中山大學算法工程師

查看9道真題和解析簡歷中的項目經歷要怎么寫

0 點贊評論收藏

05-03 12:13

中山大學算法工程師

大廠算法工程師的五年心得

今天老師給大家分享一個真實的大廠算法工程師，工作五年的心得。0??入行：大廠的篩選標準很高，其實有點超過工作本身的要求。1??有時候運氣比努力重要，如果有好的項目和機會，就可以在2-3年快速上升。如果沒有好的機會，可以選擇跳槽漲薪升職級。2??大廠很多工作其實都是follow學術界，思路不追求復雜，但是要解決實際問題，核心是數(shù)據(jù)和多階段的算法pipeline，要拿到實際結果，其次才是創(chuàng)新。3??需求的變化很多，比如老板的要求或者部門的調整，一個做CV的同學有可能因為部門調整去做搜廣推。4??學習能力好，很有優(yōu)勢。5??懂匯報和會做事是晉升的關鍵。6??部門之間差距很大，比如工作氛圍。崗位之間差距也不小，比如搜廣推的業(yè)務壓力一般都比其他算法高。7??薪資確實比同齡人高，不少同事都有能力在一線或者新一線買房。對于家庭一般的同學，做算法也算快速積累財富的方法。??有意向入行算法崗的同學，如有可以咨詢本人輔導，幫助麻煩大廠offer。

0 點贊評論收藏

05-02 18:58

中山大學算法工程師

面試題：L1正則化和L2正則化有什么區(qū)別？

??對于想求職算法崗的同學，如果想參加高質量項目輔導，提升面試能力，歡迎后臺聯(lián)系。#互聯(lián)網大廠招聘# #大模型面經# #算法崗面試#

0 點贊評論收藏

05-01 19:10

中山大學算法工程師

為什么現(xiàn)在 LLM 很少使用 Dropout了？

簡歷中的項目經歷要怎么寫

0 點贊評論收藏

04-29 19:04

中山大學算法工程師

LLama1, LLama2和LLama3的區(qū)別有哪些？

在大廠面試題中經常圍繞LLama1, LLama2和LLama3的區(qū)別進行出題，今天老師圍繞這一知識點進行詳細闡釋，供各位同學參考學習。??對于想求職算法崗的同學，如果想提升簡歷和面試能力，歡迎后臺聯(lián)系。

0 點贊評論收藏

04-29 07:46

已編輯

中山大學算法工程師

你怎么解決Moe訓練的不均衡現(xiàn)象

0 點贊評論收藏

04-27 12:27

中山大學算法工程師

算法求職簡歷該怎么寫大模型微調

結合最近輔助修改的簡歷及項目，老師總結了部分大模型微調簡歷的踩雷點。???♂?錯誤示范：在 x任務中，獲取 xxx 條數(shù)據(jù)，通過規(guī)則 or 腳本清洗出 x 條數(shù)據(jù)，然后微調 y 大模型，在業(yè)務上提升 x 個點。???原因:大模型微調的平臺是現(xiàn)成的，基模是現(xiàn)成的，體現(xiàn)不出核心能力。?應該怎么寫？首先介紹業(yè)務背景：業(yè)務是一個銷售對話業(yè)務，機器人是銷售，代替真人，直接面對用戶。我們會給模型設定任務，任務是 prompt 。步驟1??．提取訓練數(shù)據(jù)問題：1.真人通話每通電話任務是未知的，我們訓練數(shù)據(jù)是任務＋通話的 pair 對。2.真人通話很亂，與客戶的對話是各種交叉的，導致 asr 后并不是一人一輪。解決方案：1.首先通過大模型 prompt 對該通電話提取任務，得到任務＋ pair 對。需要用到 cot + reflection ＋多 Ilm 一致性+ debating 的模式。2.使用大模型根據(jù)以上任務和真人對話，讓大模型編寫出通話內容。提問，為什么要編寫而不是直接用？步驟2??．制定訓練數(shù)據(jù)集問題：1、正常的對話內容，前面幾句和后面幾句基本上一致的。都是問候和拜拜，但是也有一些差異。2、因為都是相似場景，雖然任務不同，但是很多場景語義很相似。解決方案：1、基于輪次的權重采樣：通過輪次設定權重進行 weighting sample 。解決問候和拜拜的高占比問題。2、基于語義的采樣：使用 bert 對對話內容進行 embedding ，然后使用層次聚類通過調節(jié)閾值聚類出相似語義的類。對一個類里的樣本進行隨機采樣，提問，為什么要對重復語義的數(shù)據(jù)進行下采樣？3、基于客戶類型和產品的采樣，因為很多產品是熱品，導致對話內容有偏，用戶類型一樣，需按照類型調整整體比例采樣。提問，為什么要這么采樣？步驟3??．制定訓練數(shù)據(jù)集我們直接把輸出當作 target 進行訓練。使用的 lora 訓練，但是 lora alpha 設定成為4倍的時候達到了比較好的效果，經驗值不同任務不一樣，提問，在各種情況下要怎么調？步驟4??.dpo訓練問題：v1版本訓練時，很多輸出內容是對的，但是輸出的語氣不太像真人，機器人味還是很嚴重。解決方案：由于訓練本身是有 ground truth 的，因此使用v1訓練的模型，預測訓練集，使用大模型對比兩者語氣不符合訓練集的拿出來，使用訓練集的 ground truth 和模型的預測數(shù)據(jù)作為 dpo 訓練對，對v1版本模型重新訓練。??這里老師只是簡要進行概括解答，具體情況和詳細解答可以咨詢輔導，如果想了解項目輔導，提升面試能力，歡迎后臺聯(lián)系。#算法# #簡歷中的項目經歷要怎么寫# #算法崗面試# #互聯(lián)網大廠招聘#

簡歷中的項目經歷要怎么寫

0 點贊評論收藏

04-26 15:28

中山大學算法工程師

算法崗：如何豐富項目經歷

今天老師結合輔導經驗，分享一些豐富項目經歷的方法，供各位同學參考學習。?關于怎么找項目這個問題，其實來源可以是很多的，比如數(shù)據(jù)競賽： Kaggle 、百度 AlStudio 、阿里天池等?Github 高 Star 項目?項目輔導:在輔導中老師會帶各位同學接觸實際大廠的高級別項目，能夠滿足技術棧和大廠契合，有應用場景，有可以發(fā)布論文的創(chuàng)新點或者能解決業(yè)務問題的整體Pipeline，并且有明確的優(yōu)化思路（比如版本迭代）。也很重要的是??你能否把你的項目完整且精彩的寫在簡歷上并且講述給你的面試官聽。??過程分為三步:1??明確想做的任務和方法:任務：拿 NLP 舉例，主要分為四大任務：分類任務、生成任務、序列標注、句子關系判斷方法：主流方法 or 前沿方法。還是拿 NLP 舉例，主流方法可以是 BERT ，前沿方法當然就是大模型微調啦2??找到相關代碼＋多迭代明確任務和方法之后，就可以找找 Github 先跑通一個 Version 1了。接下來比較關鍵的一步就是如何優(yōu)化你的 Version 1了。比如你可以從數(shù)據(jù)預處理、加入小 trick 、對比不同模型性能等多種角度來以此嘗試，試圖能否提升性能與效果。其實這就是面試官想看到的，因為大家可以想想互聯(lián)網的一個最重要的特點不就是飛速的迭代嘛，很多的算法崗業(yè)務也是如此：要不就是開辟新業(yè)務，要不就是用新方法重新做一遍舊業(yè)務，一旦優(yōu)化成功了，你的新模型就成功上線了。3??寫好故事＋講好故事簡歷書寫（這一篇筆記先不具體展開了）,但大致可以按照下面一部分的幾個角度來切入講好故事：面試前提前準備好下面幾個問題，數(shù)據(jù)是什么，方法是什么（對應八股要準備好），項目的目的是什么﹣﹣讓面試官有個總體了解是怎么迭代算法與模型的，性能對比情況如何﹣﹣體現(xiàn)你的工程能力與優(yōu)化能力，遇到過什么困難，是如何解決的﹣﹣提升真實性，讓面試官直觀的感受到你是自己做的，還有什么改進空間﹣﹣體現(xiàn)你的思考與沉淀。??如果想進行更加詳細具體的項目輔導，提升面試能力，歡迎后臺聯(lián)系。#算法# #簡歷中的項目經歷要怎么寫#

簡歷中的項目經歷要怎么寫

0 點贊評論收藏

04-25 08:40

中山大學算法工程師

搜廣推算法崗面經

今天老師給大家梳理了部分大廠搜廣推算法崗面試真題，供各位同學參考學習。1.PPNet的核心思想是什么？為什么要 stop gradient ？什么時候不需要這樣操作？2.多目標模型很容易遇到蹺蹺板問題或者兩個 loss 數(shù)量級相差很大，優(yōu)化速度差異太大，你知道有什么優(yōu)化方法嗎？3.NEG loss 和 NCE loss 有什么區(qū)別？ infonce loss 公式是什么4.召回業(yè)務一般怎么定義負樣本？ bce loss 的公式是什么？簡述一下 Pointwise , pairwise 和 listwise 的區(qū)別是什么？召回一般用什么 loss ?5.粗排的作用？怎么驗證粗排精排的鏈路一致性？用什么指標可以衡量鏈路一致性？6.大模型了解嗎？怎么在推薦中應用？比如怎么在召回中用？大模型訓練分成哪幾個階段？簡述一下各個階段在干什么7.千萬級別的整型數(shù)組，怎么獲取其中出現(xiàn)次數(shù)最多的前 N 個數(shù)？（考數(shù)據(jù)結構）8.講一下你知道的機器學習里面的算法，比如 AdaBoost , GBDT , XGBoost 這些。 Bagging 和 Boosting 的區(qū)別？隨機森林是什么9.講一下Word2vec是怎么做的？怎么降低計算復雜度？10.你知道的中心極限定理有哪些？11.雙塔模型優(yōu)勢和缺點，怎么改進？12.粗排的目的是什么？有哪些指標，粗排應該向精排看齊嗎？13.說一下 BN 的公式，哪幾個參數(shù)是在訓練時更新，在推理時還更新嗎？簡述一下測試過程中的 BN 怎么算。 BN 和 LN 的區(qū)別？14.當神經網絡的權重初始化為0時，會遇到什么問題？15.你能抽象地歸納出序列建模發(fā)展的脈絡嗎？以及它的最終形態(tài)應該是什么樣子？??對于想求職算法崗的同學，如果想參加高質量項目輔導，提升面試能力，歡迎后臺聯(lián)系。

查看15道真題和解析

0 點贊評論收藏

創(chuàng)作者周榜

關注他的用戶也關注了：

欧美1区2区3区激情无套,两个女人互添下身视频在线观看,久久av无码精品人妻系列,久久精品噜噜噜成人,末发育娇小性色xxxx

創(chuàng)作者周榜