大模型训练数据处理的文本去重和分类性能优化-A Star-杭州
薪资面议
大模型训练数据处理的文本去重和分类性能优化-A Star-杭州 薪资面议
杭州
本科
26届
发布于 8月5日
职位描述
团队介绍:
寻找顶尖的Data&AI复合人才,加入国际一流国内领先的阿里云自研大数据平台MaxCompute团队,共同构建和完善MaxCompute下一代AI原生的计算引擎。在这个团队,您将会和我们一同解决业界面临的超大规模网页文本数据的处理、去重、分类等计算任务的优化,从系统层面到算法实现层面,全面挑战和拓展业界在该领域计算效率的极限指标。
该职位会在MaxCompute Data+AI团队,基于分布式原生Python计算框架MaxFrame,进行大规模离线LLM推理在大规模文本处理场景中的研究和开发。
岗位职责:
1、大模型的量化调优,在较低内存和CPU算力的环境中,依然可以达到较高的token处理和生成速率;
2、常用推理框架(e.g. vLLM, Llama.cpp),在网页文本处理任务上的性能调优,特别是针对质量分计算或者打标场景的调优;
3、中低端GPU对于小参数LLM(1.5B/3B/7B/14B等规格)的推理性能调优。


职位要求
1、计算机科学、人工智能、数学或相关领域的博士学历;
2、具备扎实的工程能力,优良的编程风格,熟悉C++/Python等面向对象编程语言,以及常用设计模式;
3、具备一定的性能分析和调优经验;
4、有过PB级网页文本的数据和清洗经验;
5、在OSDI/SIGMOD/VLDB等顶级系统领域/大数据领域的会议上发表过论文;
6、熟悉vLLM推理框架,并在开源社区有贡献。
李童今日活跃
阿里云 - 校园招聘经理

李童 - 校园招聘经理

Hi~对我发布的职位感兴趣吗?打开App和我聊聊吧~
匹配度分析 立即分析

三个月内共 87 位应聘者投递了该职位,您的简历与该职位的匹配度为:323

较低
一般
较为匹配
非常匹配
公司信息
阿里云
互联网
民企
10000人以上
阿里云创立于2009年,是全球领先的云计算及人工智能科技公司。基于自研的飞天云计算操作系统,阿里云向全球客户提供基于基础设施即服务(IaaS)、平台即服务(PaaS)和模型即服务(MaaS)三层架构的全方位云服务。目前,阿里云是亚太第一、中国最大的公共云服务提供商。 凭借在IaaS和PaaS的庞大规模和强大基础,阿里云为企业提供高性能和低成本的计算资源,以及用于大模型训练、微调和推理的工具平台服务,致力于打造一朵“AI时代最开放的云”。 阿里巴巴自研大模型通义千问是全球領先的大模型之一,目前已开源多个尺寸的系列模型,以支持更多企业客户实现AI创新。
公司在招职位 查看全部