数据清洗方向上海外高桥-种子计划B-研发-2026届
180-200/天
数据清洗方向上海外高桥-种子计划B-研发-2026届 180-200/天
上海
本科
5天/周
6个月及以上
发布于 9月18日
职位描述
制药
工作地点:上海 岗位要求:2026届本科/硕士毕业生,生物、药学、化学、医学、食品或其他与岗位相符的专业优先,认同公司文化并对生物制药行业充满热情 实习内容和基本要求: 【阶段1】 【实习时间】:3-6个月 【实习待遇】:实习薪资+住宿/班车/补贴+工作餐/补贴 【基本要求】:不低于3个月的实习期,每个月出勤率不低于90% 【实习内容】: 1. 数据清洗与整合 • 深入理解业务需求,从多源异构数据中识别关键业务关系,完成复杂数据清洗、转换与整合。 • 设计高效的数据清洗流程,解决脏数据、缺失值、冗余字段等问题,确保数据质量符合分析要求。 2. 大语言模型处理、开发与部署支持 • 参与大语言模型的部署、调优及落地应用,解决模型推理中的性能瓶颈。 • 基于Dify/Coze/煎蛋/Fast GPT等平台搭建企业级知识库,实现非结构化数据的清洗、向量化存储与高效检索; • 设计并开发自动化工作流(Workflow),集成LLM能力完成复杂任务编排; • 开发智能体(Bot),优化对话逻辑与多轮交互体验; • 编写高质量Prompt模板,结合业务场景优化LLM输出效果; • 参与模型微调与评估,提升任务准确率与响应效率; • 协助完成技术文档编写、测试与部署工作。 • 探索大模型在业务场景的适配性,设计数据驱动的模型改进方案。 • 跟踪大模型领域最新技术动态(如数据增强、RLHF等),推动技术落地。 • 与算法、产品团队紧密协作,提供数据侧的技术支持与解决方案。 3. 跨团队协作 与业务部门紧密合作,将模糊需求转化为可落地的数据解决方案。 任职要求 1. 基础要求 • 硕士及以上学历,机器学习/AI/数据科学/CS /统计等相关专业 • 实习时间至少半年以上,实习时间长且稳定的优先 • 有海外学习、工作或科研经历优先 2. 硬性技能 • 数据处理与编程 1. 掌握Python基础语法与自定义函数开发 2. 熟悉JSON/YAML数据格式解析及API交互 3. 精通SQL/Python编程,熟练使用Pandas/NumPy/Spark工具链 4. 具备数据增删改查、多表关联查询、复杂数据清洗等实战经验,能够清洗并同步实时数据 • AI应用开发平台实战 1. 精通Dify/Coze等平台全流程开发,涵盖知识库构建、工作流设计、Bot开发 2. 具备通过配置化方式快速实现AI应用原型落地的能力 • Prompt工程 1. 掌握角色定义/思维链(CoT)/Few-shot等提示词设计技巧 2. 擅长输出格式优化(JSON结构化/Markdown排版等业务适配) • LLM认知体系 1. 熟悉GPT/Claude/GLM等主流模型特性及场景适配 2. 深入理解GPT/Deepseek/LLaMA等技术原理,具备模型部署调优经验 • 加分项 1. 熟悉AWS/Azure/阿里云等云平台 2. 知识图谱构建经验 3. 了解Docker/K8s容器化技术 4. RAG技术:掌握检索增强生成技术原理与实现方法 5. NLP技术深度:精通NLTK/spaCy/Transformers等技术栈,掌握词向量/序列标注/文本生成等核心技术,具有文本分类/信息抽取/对话系统等实战项目经验 3. 软性能力 • 业务翻译能力:能将业务问题转化为数据问题,例如通过数据关系梳理反推业务逻辑。 • 工程化思维:拒绝“一次性脚本”,具备设计可复用、可监控的数据处理流程的意识。 • 进度把控能力:能够规划自己所负责的模块进度,明确任务分工,确保按时交付。 • 沟通能力:逻辑清晰,对数据敏感,具备优秀的跨团队沟通能力。 【实习考核】: 考核人:带教老师/部门主管 考核规则及标准:由相关负责人制定,以培训效果检测为主 【考核结果应用】: 考核合格实习生: 可进入下一阶段实习,获得优先录用的机会 正式入职后,合同薪资为校招Offer薪资的102-104% 【阶段2】 【实习时间】:阶段1考核通过后 【实习待遇】:实习薪资高于阶段1+住宿/班车/补贴+工作餐/补贴 【基本要求】:每个月出勤率不低于90% 【实习内容】:在岗工作 【实习考核】: 考核人:带教老师/部门主管 考核规则及标准:入职后由相关负责人制定,以工作表现为主 【考核结果应用】: 考核合格实习生: 正式入职后,薪资为校园招聘Offer 102%-104% 可根据考核表现获得试用期免除的机会
工作地址
外高桥保税区荷丹路240号科创中心2、5层