职位描述
PythonPyTorch
端到端语音交互大模型核心算法(涉及多个方向:多模态、语音语义、副语言理解、音频生成)
岗位职责:
使用Pytorch训练框架,利用LLM和Diffusion等算法框架上设计或复现语音交互大模型相关实验;
深度参与多模态理解、语音语义理解、副语言理解、音频生成任务中的一项或多项算法研究和探索工作;
产出高质量实验成果,鼓励和允许把成果转化落地或发表论文;
岗位需求:
熟练掌握Python编程,熟练使用Pytorch,对大模型算法高度感兴趣;
熟悉大模型相关算法,有模型训练和大模型训练、调参相关经验优先;
熟悉python开发,熟练掌握:numpy, pytorch,transformers,LLM, Diffusion等;
实习期3-6个月,每周实习时间保证4天以上;
任职资格:
相关专业,硕士或者博士研究生优先;
对语音多模态的大模型感兴趣,做过大模型相关项目优先;
具备优秀的学习能力和良好的沟通合作精神;