最近,ResNet 作者之一的张祥雨决定投身 AI 大模型领域,这一消息迅速引起了各方关注。张祥雨在学术界取得了显赫成就,并在工业界有着丰富经验。他曾是 ResNet 四位作者之一,在微软亚洲研究院工作期间,获得了未来科学大奖。据量子位透露,张祥雨现已被传出加入国产大模型公司阶跃星辰。不过,截至目前,阶跃星辰尚未对这一传闻作出明确回应。
2008 年,张祥雨考入西安交通大学,四年后获得软件工程学士学位。接着,他进入西安交通大学与微软亚洲研究院联合培养的博士项目,师从孙剑和何恺明,2017 年拿到博士学位。毕业之后,他加入了旷视,专注于高性能卷积网络设计和深度模型的裁剪与加速等研究方向。在微软亚洲研究院期间,张祥雨参与了 ResNet 的开发,并提出了残差学习的核心思想。ResNet 的论文在 2016 年获得了 CVPR 最佳论文奖,至今被引用超过 23 万次,成为深度学习领域的经典之作。ResNet,即残差网络,大幅提升了深度神经网络的训练效果。这个核心思想被广泛应用于现代深度学习模型,如 AlphaGo Zero 和 ChatGPT 等。
除了 ResNet,张祥雨在移动端高效卷积神经网络 ShuffleNet 和服务器端高效神经网络 RepVGG 方面也取得了重要成果。ShuffleNet 影响了像苹果 3D 人脸解锁等各种手机毫秒级人脸解锁技术,而 RepVGG 则在工业界广泛应用。
阶跃星辰是国产大模型领域的公司。公司专注于大模型的研发和应用,估值已超过 20 亿美元。此外,腾讯的俞刚和 MSRA 的段楠也已加入阶跃星辰团队。在 2024 年的世界人工智能大会(WAIC)上,阶跃星辰发布了 Step 系列通用大模型家族,包括 Step-1V 千亿参数多模态大模型和 Step-2 万亿参数 MoE 语言大模型。公司还宣布与《大闹天宫》进行跨界联动,展示了其在大模型应用方面的能力。阶跃星辰的产品在市场上也取得了一定成绩。比如,toC 产品跃问和 AI 开放世界已经投入市场,并得到了用户的好评。这些产品通过提供 API 接口让合作伙伴试用,推动了技术的实际应用。在大数据处理、高性能计算、大规模机器学习等领域,阶跃星辰展示了技术能力。他们在通用人工智能领域的进展,显示了追赶行业巨头 OpenAI 的实力和决心。
大模型的快速发展吸引了大量 AI 人才,形成了所谓的人才黑洞效应。行业内的顶级人才纷纷投奔大模型公司,推动技术创新。比如,ResNet 作者张祥雨的加盟,使得阶跃星辰的技术实力有所提升。这种人才流动不仅为大模型领域注入新血液,也加速了技术的发展和实际应用。除了张祥雨,其他 AI 人才如俞刚、段楠等也纷纷加入大模型公司,为行业带来了新的技术突破和创新思路。这些人才的加入,不仅提升了公司实力,也推动了整个行业的进步。俞刚在计算机视觉领域的研究成果,段楠在自然语言处理方面的成就,都为大模型技术的发展提供了基础。