大模型推理引擎实习生(A24073)
250-400/天
大模型推理引擎实习生(A24073) 250-400/天
北京
本科
5天/周
3个月
发布于 9月4日
职位描述
PythonC++硬件
职责描述: 1. 负责大模型算法在手机、平板等移动设备平台部署,打造业界领先的全平台推理引擎 2. 分析性能瓶颈,提出系统性优化方案,将算法落地到汽车、手机、小爱等集团业务线 3. 设计先进的推理引擎架构,极致优化高性能算子与推理流水线 4. 了解移动端硬件特性,分析推理性能瓶颈,提出系统性解决方案 5. 充分挖掘硬件平台异构算力,优化资源占用 6. 负责AI项目交付、算法库开发、升级优化、技术文档撰写等工作 任职要求: 1. 本科及以上学历,计算机/电子/信息/通信/自动化/软件等相关专业 2. 掌握Python、C、C++等编程语言,精通数据结构算法,具备优秀的编程习惯 3. 了解CNN、LLM、Transformer、ViT等算法原理 4. 熟悉常见深度学习或LLM推理框架,如:TensorRT、ncnn、mnn、llama、cpp、vllm等 5. 对模型量化、定点化、低比特表示有深入研究和理解 6. 有CUDA、NEON、SIMD指令编程经验 7. 加分项:阅读过任意一种推理框架源码、对高性能计算感兴趣者优先
工作地址
北京市/北京市/海淀区