职位描述
数据仓库ETL数据挖掘SQLJavaPythonScalaHadoop
岗位职责:
1、负责各产品线的量产数据的接入、开发。设计、开发和维护ETL流程,从各工厂和各数据源中采集、清洗和转换数据,串联集成和整合各个业务系统的数据,完成报表开发,并持续优化数据质量和查询效率;
2、负责设计、构建和维护核心产品数据库,存储和管理所有产品的关键性能指标、测试结果、批次信息及历史数据;
3、负责设计、构建和维护失效模式数据库,系统化归纳和存储各种失效类型、失效特征、发生频率及相关数据,为失效分析提供数据支撑。;
4、利用机器学习、统计分析、AI等技术,按业务需求开展良率分析、缺陷分析、趋势预警、失效建模等统计与算法任务,预测潜在失效风险,定位失效根本原因,缩短问题解决周期;
5、负责构建并优化关键指标的异常检测和告警系统,提前发现隐含问题,实现异常自动识别和即时预警;
6、负责追溯系统的开发和优化。持续提升产品量产全流程的数字化水平;
7、开发和维护数据API和数据数据推送服务,给其他系统赋能,并持续优化。
任职要求:
1、2026届硕士研究生学历,计算机科学、软件工程、数学、统计学等相关专业,通过CET-4;
2、 精通Java/Scala/SQL开发,熟悉Python开发;
3、熟悉Hadoop,Spark,Hive等大数据框架;
4、熟悉数据仓库建模、ETL 设计开发,有数据质量与数据治理相关经验;
5、熟悉常用数据统计和数据挖掘方法,扎实的数理统计基础,熟悉机器学习和深度学习中的经典算法;
6、有大数据开发和数据统计的相关项目和实习经验。