下一代大模型智能体自进化技术研究-A Star-杭州
薪资面议
下一代大模型智能体自进化技术研究-A Star-杭州 薪资面议
杭州
本科
26届
发布于 8月5日
职位描述
1、负责面向政企场景的大模型智能体自进化技术研究,构建基于业务反馈数据的强化学习闭环系统,实现智能体能力的持续自动化提升;
2、设计并实现高性能“训推一体”框架,支持智能体在业务流程中中实时吸收业务反馈信号,进行低延迟、高安全性的策略更新;
3、推动自进化智能体在电力、政务、金融等多个行业的落地验证,持续优化业务指标;
4、主导或参与开源智能体自进化工具链的研发与推广,提升技术影响力。


职位要求
1、计算机科学、人工智能、机器学习等相关学历背景,研究方向聚焦强化学习、持续学习、智能体系统;
2、精通Python/PyTorch,有极强的动手和代码能力,具备开发高并发推理服务与分布式训练系统的能力,熟悉Ray、vLLM、DeepSpeed等框架者优先;
3、熟悉大模型智能体主流框架和项目,并具有扎实掌握深度强化学习(DRL)、离线强化学习(Offline RL)、人类反馈强化学习(RLHF)等核心技术,具备算法创新与调优能力;
4、前沿技术研究:跟踪大模型智能体领域的最新研究进展,探索Agent关键技术,在顶级会议(NeurIPS, ICML, ICLR, ACL)发表相关论文。