职责描述:
方向一、负责大模型方向技术的研究和应用,构建大规模通用智能系统,包括但不限于语言、多模态、行业大模型等,具体工作内容如下:
a. 负责开发和优化最先进的大模型算法,打造行业领先的大模型;
b. 负责根据业务场景,抽象技术问题,预研和实现大模型技术,打造卓越的用户体验。
方向二、针对语言大模型方向,工作方向包括但不限于:
a. 模型架构、预训练方法、高效微调、模型评估及迭代;
b. 知识增强、工具增强、AI Agent;
c. 幻觉、安全、时效性等问题解决;
任职要求:
1. 计算机相关专业硕士及以上学历在读, 发表过大模型相关研究AI顶会论文优先;
2. 掌握机器学习和深度学习基础知识,熟悉Pytorch、Tensorflow等至少一种深度学习框架;语言方向,对NLP主流大模型如:GPT3/chatGPT/T5/PaLM/LLaMA/GLM等的原理和差异有深入的理解
3. 有大模型研究或者应用项目经验的优先
4. 能找到关键研究问题和设计研究路径;能和公司内的各个团队中协作、自主跟进研究进展、把握研究风险的优先。