APP
超级简历 APP
扫码下载APP,随时随地改简历
登录
注册
开通超级会员,尊享6大特权
立即开通
账号设置
超级会员
我的订单
问题反馈
我要招人
退出登录
下载 APP
扫码下载 APP,随时随地和 HR 沟通
大模型推理框架开发工程师-(A61290)
薪资面议
收藏
大模型推理框架开发工程师-(A61290)
薪资面议
收藏
北京
本科
0
发布于 8月7日
职位描述
Python
C++
工作内容: 1.负责基于 vLLM、SGLang 等技术的大模型推理框架的开发工作,包括但不限于设计和实现高效的推理引擎架构,优化推理过程中的计算流程,提高推理性能,以满足不同规模大模型的实时推理需求; 2.复杂大模型框架性能评估和调优工作,构建并完善性能监控体系,通过实时监测训练指标,定位性能瓶颈,提出优化方案,确保在不同硬件上达到最优性能; 3.负责Cuda Kernel优化,开发高性能的GPU算子, 提升大模型推理性能。 任职要求: 1.硕士及以上学历,计算机、软件工程、数学等相关专业,具备扎实计算机理论基础和丰富编程经验; 2.熟悉 C++ / Python,掌握至少一种深度学习框架(如 PyTorch),理解Transformer系统深度学习原理算法; 3.熟悉 GPU 和其他加速硬件的使用,有基本的性能调优经验,有FastTransformer、CUDA优化、TensorRT、Triton经验优先; 4.熟悉大模型推理框架的基本原理和流程,了解 vLLM、SGLang 等大模型推理框架的核心技术和实现优先; 5.有良好团队协作与沟通能力,有强烈的上进心和自我驱动,学习适应能力强,乐观自信,能挑战自我不断追求卓越。
工作地址
北京/北京/海淀区 西二旗中路33号小米移动互联网产业园
相似职位推荐
NPU编译器开发工程师-(A89504A)
薪资面议
北京
本科
0天/周
0
C++
小米科技
互联网
10000人以上
服务端研发工程师-(A73376)
薪资面议
北京
本科
0天/周
0
小米科技
互联网
10000人以上
BMS开发工程师-汽车-(A24477)
薪资面议
北京
本科
0天/周
0
Python
C++
数据分析
大数据
小米科技
互联网
10000人以上
虚拟机和编译器优化工程师-(A95637)
薪资面议
北京
本科
0天/周
0
C++
Linux
小米科技
互联网
10000人以上
资源开发工程师-(A96544)
薪资面议
北京
本科
0天/周
0
小米科技
互联网
10000人以上
内控实习生
薪资面议
北京
学历不限
5天/周
6个月及以上
Python
SQL
数据分析
小红书
互联网
1000-9999人
线上技术顾问
150-180/天
北京
学历不限
5天/周
12个月及以上
Python
Java
Go
Linux
基调网络
消费品/零售/贸易
100-499人
Agent 服务端开发实习生(AI Agent / AI App 北京)-MiniMax-高瓴联合校招
500/天
北京
本科
4天/周
4个月
高瓴
500-999人
上一个:有机农业运营管培生
下一个:蔚来hrbp实习生——南通先锋
张女士
本周活跃
小米科技 - 人力资源主管
张女士 - 人力资源主管
Hi~对我发布的职位感兴趣吗?打开App和我聊聊吧~
匹配度分析
立即分析
三个月内共 87 位应聘者投递了该职位,您的简历与该职位的匹配度为:
323
较低
一般
较为匹配
非常匹配
公司信息
小米科技
互联网
民企
10000人以上
北京小米科技有限责任公司成立2010年4月,是一家专注于智能硬件和电子产品研发的移动互联网公司。“为发烧而生”是小米的产品概念。小米公司创造了用互联网模式开发手机操作系统、发烧友参与开发改进的模式。小米还是继苹果、三星、华为之后第四家拥有手机芯片自研能力的科技公司。 “让每个人都能享受科技的乐趣”是小米公司的愿景。小米公司应用了互联网开发模式开发产品的模式,用极客精神做产品,用互联网模式干掉中间环节,致力让全球每个人,都能享用来自中国的优质科技产品。
公司在招职位
查看全部
算法工程师-(A153745)
薪资面议
北京
经验不限
本科
OTA测试工程师-(A199078)
薪资面议
上海
经验不限
本科
EHS工程师-汽车-(A111901)
薪资面议
北京
经验不限
本科
车联网业务项目经理-(A70811)
薪资面议
北京
经验不限
本科
容器运维工程师-(A135639)
薪资面议
武汉
经验不限
本科
使用微信扫码登录
其他注册方式
使用模板
提示
取消
确定