1、负责设计并实现 LLM-based Agent 的评估指标与评估工具,对不同智能体模型进行全面、深入的性能评估,分析评估结果,为优化方向提供数据支持;
2、研究并开发参数驱动的优化算法,包括但不限于Pre-training、CPT、Test-Time Learning、监督微调、强化学习算法的应用与改进,构建高质量的训练数据,优化智能体的决策与推理能力;
3、探索参数无关的优化策略,如提示工程的创新推理范式、Context Engineering、外部工具的高效集成、知识检索机制的优化等,提升智能体在复杂环境中的适应能力与任务执行能力;
4、与工程伙伴紧密合作,了解实际业务需求,将优化算法应用于具体业务场景,推动智能体技术的产业化落地。
职位要求1、计算机科学、人工智能、机器学习等相关专业的博士研究生;
2、深入理解大语言模型的原理与架构,熟悉智能体技术的基本概念与应用场景,掌握深度学习、强化学习的基本理论与方法;
3、具备丰富的模型评估与优化经验,熟悉常见的评估指标与优化算法,有 LLM 微调、智能体开发项目经验者优先;
4、具备良好的团队协作能力与沟通能力,能够与跨学科团队紧密合作,共同推动项目进展;
5、前沿技术研究:跟踪领域内的最新研究进展,发表高水平学术论文,参与国际顶级会议(如NeurIPS, ICML, CVPR, ACL, ICLR等)。