职位描述
自然语言处理PythonTensorFlowPyTorch人工智能硬件
工作职责:
- 研究与探索大型语言模型(LLM)在智能硬件语音对话系统中的应用与创新方案。
- 专注于利用**强化学习(RL)** 等算法优化LLM的对话策略、上下文理解与个性化交互能力。
- 参与基于人类反馈的强化学习(**RLHF**)等相关技术的实验、评测与迭代优化。
- 撰写技术报告与算法原型实现。
职位要求:
- 硕士或博士在读,计算机、人工智能、自然语言处理等相关专业。
- 具备扎实的Python编程能力,熟悉PyTorch/TensorFlow等深度学习框架。
- 对LLM(如GPT、LLaMA等)有浓厚兴趣,有Prompt Engineering、微调或相关项目经验者优先。
- 具备强化学习(RL)基础,了解常见算法(如PPO, DQN, REINFORCE等),有RLHF项目经验者优先。
- 具备良好的逻辑思维、学习能力和团队协作精神。
- 可实习6个月以上者优先。
工作地址
北京市/北京市/朝阳区 北京万东医疗科技股份有限公司(酒仙桥东路)