面向海量异构大模型的AI Infra高维性能优化-A Star-杭州
薪资面议
面向海量异构大模型的AI Infra高维性能优化-A Star-杭州 薪资面议
杭州
本科
26届
发布于 8月5日
职位描述
通过算法-系统-硬件协同优化,负责设计、实现、维护面向离散扩散模型的高效AI Infra推理框架,支撑AI Infra面向新推理范式的可能性
1、研发高效解码策略(如动态掩码调度、混合AR-Diffusion解码),提升生成速度与质量平衡;
2、设计面向dLLMs/dMLLMs的KV-Cache优化方案(如dKV-Cache、跨模态缓存复用),降低内存占用;
3、实现低比特量化(INT4)与算子融合,提升硬件利用率。


职位要求
1、熟练掌握PyTorch,有大模型推理优化(如sglang、vllm等)经验;
2、精通CUDA/OpenCL,具备高性能计算(算子优化、内存管理)或编译器开发能力;
3、熟悉扩散模型(如 Diffusion, flux)或自回归模型(如dpsk,qwen)的推理架构;
4、对计算机体系结构(GPU内存 hierarchy、NVLink)有深入理解;
5、发表过AI系统(OSDI/NSDI/SOSP)或机器学习(NeurIPS/ICML)顶会论文;
6、有KV-Cache优化、低比特量化或多模态模型部署实战经验,熟悉离散扩散模型(如D3PM、LLaDA、Dimple)或相关开源项目(如Diffusers库);
7、前沿技术研究:跟踪AI Infra领域的最新研究进展,探索新的硬件架构、算法和系统优化技术。
李童今日活跃
阿里云 - 校园招聘经理

李童 - 校园招聘经理

Hi~对我发布的职位感兴趣吗?打开App和我聊聊吧~
匹配度分析 立即分析

三个月内共 87 位应聘者投递了该职位,您的简历与该职位的匹配度为:323

较低
一般
较为匹配
非常匹配
公司信息
阿里云
互联网
民企
10000人以上
阿里云创立于2009年,是全球领先的云计算及人工智能科技公司。基于自研的飞天云计算操作系统,阿里云向全球客户提供基于基础设施即服务(IaaS)、平台即服务(PaaS)和模型即服务(MaaS)三层架构的全方位云服务。目前,阿里云是亚太第一、中国最大的公共云服务提供商。 凭借在IaaS和PaaS的庞大规模和强大基础,阿里云为企业提供高性能和低成本的计算资源,以及用于大模型训练、微调和推理的工具平台服务,致力于打造一朵“AI时代最开放的云”。 阿里巴巴自研大模型通义千问是全球領先的大模型之一,目前已开源多个尺寸的系列模型,以支持更多企业客户实现AI创新。
公司在招职位 查看全部