链世界
网站首页
网站导航
文章列表
AI 模型榜
实用工具
像素广场
设置
联系我们RSS友情链接提交网站
隐私政策·免责声明
陕ICP备2025083618号-2

热门频道

AI 工具开发工具效率工具安全工具设计资源
导航文章工具
← 返回导航列表
tiny-vllm
「tiny-vllm」网站图标

tiny-vllm

AI 工具

用 C++ 和 CUDA 从零实现的 LLM 推理引擎教学项目
https://github.com/jmaczan/tiny-vllm
https://github.com/jmaczan/tiny-vllm

tiny-vllm 是 vLLM 的教学版,用纯 C++ 和 CUDA 实现了完整的 LLM 前向推理(Llama 3.2 1B),包含 KV Cache、连续批处理、GQA、RoPE 等核心机制,适合想深入理解 GPU 推理底层原理的开发者。