大语言模型异构和虚拟化-A Star-北京
薪资面议
大语言模型异构和虚拟化-A Star-北京 薪资面议
北京
本科
26届
发布于 8月5日
职位描述
1、优化单服务实例的性能和成本:
•配合前沿模型压缩算法探索高性能算子的前沿方向、创新注意力算子(Attention)实现方式、通过编译优化等手段提升模型推理性能;
•结合大语言模型服务的场景特性,创新请求调度算法,优化用户体验和系统吞吐;
•结合算法创新,采用上下文稀疏、投机采样等方法加速解码(Decoding)过程;
2、异构硬件适配:以编译技术为基础,探索统一的跨平台优化方法,能敏捷地完成主流的GPU/CPU/NPU等硬件的适配,并在各个平台提供较高的性能;
3、探索云上单租户多服务、多租场景下的混合部署方法,将不同尺寸、不同访问频度、不同优先级的模型混合部署在异构资源池中,并保证SLA。通过请求调度方法的创新、资源共享方法创新,降低总体部署成本、提升资源利用率和弹性。


职位要求
1、具备扎实的计算机基础知识、C++/Python编程能力,熟悉常见数据结构和设计模式;
2、具有很强的学习能力、复杂问题归纳梳理能力、沟通和团队协作能力,具备能够深度钻研技术的耐心;
3、有很强的学术研究能力和优秀的学术成果(AI领域顶会/顶刊论文)。
李童刚刚活跃
阿里云 - 校园招聘经理

李童 - 校园招聘经理

Hi~对我发布的职位感兴趣吗?打开App和我聊聊吧~
匹配度分析 立即分析

三个月内共 87 位应聘者投递了该职位,您的简历与该职位的匹配度为:323

较低
一般
较为匹配
非常匹配
公司信息
阿里云
互联网
民企
10000人以上
阿里云创立于2009年,是全球领先的云计算及人工智能科技公司。基于自研的飞天云计算操作系统,阿里云向全球客户提供基于基础设施即服务(IaaS)、平台即服务(PaaS)和模型即服务(MaaS)三层架构的全方位云服务。目前,阿里云是亚太第一、中国最大的公共云服务提供商。 凭借在IaaS和PaaS的庞大规模和强大基础,阿里云为企业提供高性能和低成本的计算资源,以及用于大模型训练、微调和推理的工具平台服务,致力于打造一朵“AI时代最开放的云”。 阿里巴巴自研大模型通义千问是全球領先的大模型之一,目前已开源多个尺寸的系列模型,以支持更多企业客户实现AI创新。
公司在招职位 查看全部