騰訊 一面 1. Tensorrt-LLM, AGI , VLLM源代碼區(qū)別 2. 為什么要有continue batch 3. fastllm.cpp 的源代碼 4. yolo加速 5. Python 計(jì)算密集型使用多進(jìn)程還是多線程 6. C++繼承怎么實(shí)現(xiàn)的 7. 最大子數(shù)組之和 二面 1. 求比特位中1個(gè)個(gè)數(shù) 2. 編譯時(shí)運(yùn)行 3. VLLM ,PageAttention 4. Cuda 內(nèi)存模型介紹 5. 使用triton 實(shí)現(xiàn) PageAttention 二面掛#金三銀四,你有感覺到嗎##春招提前批,你開始投了嗎#