职位描述
洛神云网络是阿里云核心基础设施系统,服务200+阿里云产品,提供云计算连接的基石。阿里云AI优先战略背景下,洛神云网络通过软硬一体化、智能网络、高性能转发等核心技术,为阿里云产品的AI智能化升级提供超大规模、超高性能、极致弹性的网络服务。你将在需求对接、方案设计、项目落地等流程中,深度参与以下项目:
1、支持AI业务的网络接入需求,通过洛神云网络高性能、全域覆盖的能力,支持AI用户请求调度、模型与训练数据分发等关键网络路径;
2、为AI场景流量提供高性能低延时高可靠转发能力,同时服务于通用计算和GPU流量;
3、基于大数据以及大语言模型,研发超大规模数智一体的网络分析系统,提升网络研发、运营、运维、测试能力,支撑网络稳定高效运行;
4、参与设计AI scale up网络,突破AI基础设施性能瓶颈,同时提升AI训练和推理系统吞吐与时延,优化用户体验。
职位要求1、计算机以及相关领域博士;
2、深入了解计算机网络、计算机体系结构、可编程硬件、AI infra等领域的基础知识和前沿动向;
3、对于学术和科研具有热情和主动性,具备独自思考与解决问题能力;
4、至少熟练使用一种编程语言,如C/C++,Java,Python,Go等。