Steam 部门设立于2025年1月,正如蒸汽机(Steam Engine)在工业革命 1.0 中所象征的创新开端,我们也希望以此之名,积极探索云与 AI 结合的产品方向。
在当前大模型能力日新月异的情况下,唯有坚持自己的核心价值主张和对未来的判断,且面向半年至一年后的大模型能力打造应用产品,才有一战的可能。对于大模型领域的未来进展,我们相信:
1、大模型的智商会快速接近乃至与人类齐平;
2、大模型的多模态理解能力,特别是视觉能力将得到长足发展;
3、在1和2前提下,信息处理类工作将最终被 AI 接管,大量替代真人员工。
对于阿里云如何做到云+ AI,我们认为"云的最大客户会是 AI",我们的行动路径是让更多现实世界的工作量从“人类脑力劳动”转移到“云端 AI 消耗的计算资源”。
在这些认知下,我们确定了“高效完成重复任务,完整替代人类工作”的产品目标,如果你也相信这个未来,欢迎上船。
当前,Agent 技术被视为通往 AGI 的关键路径,但其在可靠性、长程记忆、多模态理解和工具自适应性等方面的瓶颈,限制了其真正价值的释放。你的核心使命,是作为算法工程师,寻找解决这些难题的克星路径,赋予Steam团队AI产品超凡的“智慧”与“能力”。
你将能够参与:
1、前沿算法探索与实现:针对 Agent 在复杂任务规划、推理、及 Tool Use 上的核心障碍,研究、落地、优化以及超越 SFT, RLHF/RLAIF, DPO/IPO 等现有的模型对齐与后训练算法;
2、长程记忆与推理突破:攻坚大模型长上下文处理的极限,研发创新的记忆机制与推理架构,使 Agent 能够处理并记忆横跨数天、数周乃至数月的复杂任务信息;
3、多模态能力融合:主导将顶尖的视觉理解及生成能力融入 Agent 核心,使其能像人一样“看懂”屏幕、图表和现实世界,并进行操作;
4、终极效率与成本优化:探索模型结构、训练范式、推理过程中的极致优化算法,在保证甚至提升智能水平的前提下,实现计算成本的压缩。
职位要求1、NLP、CV、大模型、强化学习相关方向;
2、具备扎实的机器学习基础知识和编码能力,精通Python和深度学习框架,对大模型训练框架有一定的了解;
3、大模型相关的国际顶级会议/期刊论文3篇及以上,或国际顶级会议/期刊论文共5篇及以上;
4、有参与行业头部大模型的经验,或影响力大的开源项目者优先;
5、有国际大学生计算机/数学/物理竞赛世界级奖项经历者优先。