职位描述
视频
【职位描述】
我们是小红书应用算法部/内容理解算法组,目前专注于内容理解场景的技术落地和产品预研。我们希望寻求优秀在读硕士生/博士生共同突破多模态/视觉大模型理解和生成算法在多模态内容理解行业落地的技术挑战,作为实习生,你将有机会与产品、工程紧密合作,将研究算法应用到实际问题中,并解决有难度有价值的问题,促进领域前沿技术的发展。欢迎投递简历。该岗位的核心研究方向包括但不限于:
1. 计算机视觉:解决视觉理解中指代关系特征归一化和识别研究;
2. 多模态表征:多源数据中多模态表征技术,包括局部/全局匹配、视频表征、多模态表征、对抗性和泛化性等问题。
3. 通用多模态大模型:通用多模态大模型在安全领域理解相关研究,包括强化微调、逻辑推理、多模态理解、幻觉消除及评价机制等。
我们希望在一个和多个方向做出有意义的、创新性的工作。
【职位要求】
1. 熟练掌握深度学习、机器学习、计算机视觉的基础知识,熟悉常用模型的原理、特点及应用,能够结合需要解决的问题选择适当的模型,并设计合理的技术方案;
2. 良好的科研能力,有成果发表在ICLR、CVPR、ICCV、ECCV、NeurIPS、ICML、TPAMI等国际顶级会议、期刊者优先;
3. 动手实现能力强,代码基本功扎实,精通基于Python的算法开发;熟练掌握pytorch/tensorflow/mxnet等至少一项深度学习框架;
5. 能够获得导师许可同时可以保证4个月以上的实习。