负责面向安全业务场景的大模型能力建设,包括但不限于以下方向:
1. AI for security,利用AI技术增强网络安全和数据保护等领域的防御能力。在自动化威胁检测、分析和响应、DevSecOps等场景提升效率和攻防对抗能力;
2. Security for AI,保护AI应用系统安全,保护其免受攻击和滥用。
职位要求【必备项】
1. 熟悉大模型的Parameter-Efficient Fine-tuning及Knowledge Distillation的常见方案及算法原理,熟悉使用常见微调工具箱,如Hugging Face Transformers、LLama-Factory、Unsloth等;
2. 熟悉大模型应用开发框架,如LangChain、LangGraph、LlamaIndex等,具备COT、Agent等大模型应用形态的开发经验;
3. 熟悉大模型推理服务部署框架的原理和使用,如vLLM、SGLang等;
4. 了解常用机器学习算法,具备优秀的工程实现能力,精通Rust、Java、Python等至少一门编程语言;
5. 了解安全攻防场景,对网络安全和大模型安全具有一定的了解;
6. 有良好的数据敏感能力、较强的逻辑分析能力;
7. 有良好的自我学习能力及自驱力,对前沿领域有强探索欲,富有想象力和创造力;
8. 有良好的沟通能力和团队协同能力,能与他人合作,共同完成目标。
【加分项】
1. 具备大模型攻防经验及大模型安全项目经验者优先;
2. 具有混合检索系统及复杂RAG模块开发经验者优先;
3. 熟练掌握tensorflow、pytorch等至少一种主流深度学习框架,能够独立实现前沿模型者优先;
4. 有高质量论文、开源项目、ACM竞赛经历、相关学术会议组织的权威比赛获奖经历或落地项目产出者优先;
5. 有数理分析方面良好的素养以及数理统计基础者优先。