APP
超级简历 APP
扫码下载APP,随时随地改简历
登录
注册
开通超级会员,尊享6大特权
立即开通
账号设置
超级会员
我的订单
问题反馈
我要招人
退出登录
使用微信扫码登录
其他注册方式
下载 APP
扫码下载 APP,随时随地和 HR 沟通
面向大语言/多模态模型的KVCache显存和IO/bit位优化推理-A Star-杭州
薪资面议
收藏
面向大语言/多模态模型的KVCache显存和IO/bit位优化推理-A Star-杭州
薪资面议
收藏
杭州
本科
26届
发布于 8月5日
职位描述
1、负责研发软硬件协同的优化能力,提升阿里云训推场景在异构资源上计算性能,进一步提高资源利用率;
2、负责设计、实现、维护 AI 和高性能计算所需要的大模型推理场景的性能优化,聚焦模型通信场景的能力建设,完善集合通信、点对点通信等通信方式与推理框架的联合方案设计,推动提升推理性能。
职位要求
1、分布式系统、计算机体系结构、编译优化或通信与计算协同设计方向的博士研究生;
2、具备AI训推/推理计算性能分析与优化的经验,能深入分析AI模型在GPU平台上的性能瓶颈,提出并实施优化方案;针对分布式训练和推理系统,进行性能调优,提升系统的吞吐量和效率;
3、熟悉业界常见的优化栈(cuda/rocm/cutlass/ck/triton等),在高效的内存管理、通信优化(NvLink/Infiniband/RoCEv2等)关键技术上有实操经验;
4、分布式系统研发经验是加分项:设计和实现高效的分布式训练和推理框架,解决大规模分布式系统中的通信、同步和负载均衡问题;探索新型的分布式架构,提升系统的可扩展性和容错性;
5、前沿技术研究:跟踪AI Infra领域的最新研究进展,探索新的硬件架构、算法和系统优化技术;发表高水平学术论文,参与国际顶级会议(如ISCA、MICRO、OSDI、SOSP、ATC、NSDI等)。
李童
今日活跃
阿里云 - 校园招聘经理
李童 - 校园招聘经理
Hi~对我发布的职位感兴趣吗?打开App和我聊聊吧~
匹配度分析
立即分析
三个月内共 87 位应聘者投递了该职位,您的简历与该职位的匹配度为:
323
较低
一般
较为匹配
非常匹配
公司信息
阿里云
互联网
民企
10000人以上
阿里云创立于2009年,是全球领先的云计算及人工智能科技公司。基于自研的飞天云计算操作系统,阿里云向全球客户提供基于基础设施即服务(IaaS)、平台即服务(PaaS)和模型即服务(MaaS)三层架构的全方位云服务。目前,阿里云是亚太第一、中国最大的公共云服务提供商。 凭借在IaaS和PaaS的庞大规模和强大基础,阿里云为企业提供高性能和低成本的计算资源,以及用于大模型训练、微调和推理的工具平台服务,致力于打造一朵“AI时代最开放的云”。 阿里巴巴自研大模型通义千问是全球領先的大模型之一,目前已开源多个尺寸的系列模型,以支持更多企业客户实现AI创新。
公司在招职位
查看全部
下一代大模型智能体自进化技术研究-A Star-杭州
薪资面议
杭州
经验不限
本科
客户端开发工程师C++-北京
薪资面议
北京
经验不限
本科
安全工程师-北京
薪资面议
北京
经验不限
本科
安全工程师-上海
薪资面议
上海
经验不限
本科
安全工程师-杭州
薪资面议
杭州
经验不限
本科
使用微信扫码登录
其他注册方式
使用模板
提示
取消
确定