强化学习AI实习生-星海图-高瓴联合校招
300-350/天
强化学习AI实习生-星海图-高瓴联合校招 300-350/天
北京
本科
5天/周
6个月及以上
发布于 7月10日
职位描述
PythonTensorFlowPyTorch数据分析人工智能机器人
岗位描述: 作为强化学习算法实习生,你将参与前沿的强化学习算法研究和应用开发工作。你将协助团队开发、优化和测试强化学习模型,并将其应用于机器人控制、自动驾驶、游戏AI等领域。该岗位将为你提供深入了解强化学习理论与实践的机会,并在实际项目中积累经验。 主要职责: 算法开发与优化: 协助设计和实现强化学习算法(如DQN、PPO、A3C等),优化模型的性能和稳定性。 实验设计与执行: 设计并执行强化学习算法的实验,评估不同算法在特定任务上的表现,收集和分析实验数据。 模型训练与调优: 参与大规模模型的训练和调优过程,优化模型参数,提高训练效率和收敛速度。 仿真环境构建: 构建和维护强化学习实验的仿真环境,创建任务场景和模拟数据。 文献调研: 进行相关领域的文献调研,跟踪最新的研究进展,应用新的技术和方法改进现有模型。 技术文档编写: 编写算法设计、实验流程和结果分析的技术文档,帮助团队成员理解和复现工作成果。 任职要求: 教育背景: 计算机科学、人工智能、电子工程、应用数学或相关专业的本科或研究生在读学生。 编程技能: 精通Python编程语言,熟悉TensorFlow、PyTorch等深度学习框架。 强化学习基础: 具备扎实的强化学习理论基础,了解基本的强化学习算法和相关数学原理(如马尔可夫决策过程、策略梯度等)。 数值计算能力: 具有良好的数学和数值计算能力,能够处理复杂的优化问题。 数据分析能力: 熟悉常用的数据分析工具和方法,能够对实验数据进行有效的分析和解读。 学习能力: 具备较强的自学能力和对新技术的敏感度,对强化学习和人工智能领域充满热情。 加分项: 具有机器人控制、游戏AI、自动驾驶等领域的强化学习应用经验。 熟悉OpenAI Gym、DeepMind Lab等强化学习仿真平台的使用。 具备一定的科研经历,曾在相关领域发表过学术论文者优先。
工作地址
北京/北京 东升大厦A座601B
相似职位推荐