推动AI技术扩散?中国正在做一件事

技术扩散能力在国家技术力量中非常重要,特别是在AI的背景下。有研究显示,与美国分散且更利于扩散的生态系统相比,中国的扩散能力远远落后于创新能力——比后者排名低近30位。目前,中国正在计划提高扩散能力,重要方式是对AI教育进行大规模投资,以培养中端、以工业为重点的AI劳动力。

 

美国最近在大型语言模型(LLM)和扩散模型方面取得了源源不断的突破。这些成功推动了美国风险投资对专注于科技和服务行业的生成式AI初创公司的激增,如HarveyAI、Jasper和Runway。美国的这种乐观情绪与中国相对较慢的AI创业公司形成了鲜明对比。例如,有分析称备受关注的阿里巴巴支持的初创公司零一万物(01.AI)的语言模型在很大程度上是基于Meta的开源LLaMA基金会模型。

 

然而,中国在生成式AI领域的迟缓,可以解释为政府将工业应用置于服务业和传统知识工作应用之上的战略优先地位。特别是,政府希望通过工业部门的AI投资来对抗工业生产力增长的下降,以期摆脱中等收入陷阱。

 

为此,政府已要求教育部在国内的工业部门推广尖端的机器学习技术。因此,中国各大学开设了2300多个AI本科生项目,其中大多数是专注于工业应用的应用AI项目。教育部的AI高等教育包括两个目标:

 

教育部对应用AI高等教育项目的空前投资在于政府认识到大多数专注于工业的AI公司面临的一个根本问题:构建特定行业的AI解决方案需要耗费大量时间和资金,通常无法通过横向商业模式实现。这个问题很普遍,因为除了回收等利基行业(AMP Robotics等成功的西方初创公司已经出现)之外,大多数工业部门都有特定于公司的数据基础设施。制造公司通常在称为制造执行系统(MES)和监控与数据采集(SCADA)的软件系统上运行。这些系统往往结合了内部工具和SAP或西门子等传统供应商构建的软件服务的混乱组合。

 

因此,为了构建一个可以实际部署的AI模型,这些不同的系统必须首先通过跨系统的数据通道进行统一。这项工作的大部分都是定制的,涉及在传统的、断开连接的系统之间构建强大的数据通道的繁琐过程,这些系统通常来自具有不同数据模式的不同提供商。只有完成了这项艰巨的工作,计算机视觉模型才能开始训练和部署。即使在这些复杂的数据通道建成后,对AI系统进行工业流程培训也会带来自身的挑战:

鉴于工业企业使用的产品和流程众多,每个模型都必须在公司或产品线的特定系统上进行培训。换言之,大规模、全行业的多样性限制了工业AI解决方案的可扩展性。

 

此外,每当一家公司改变流程或转向新产品时,该公司不仅必须建立新的制造流程,还必须重新培训其计算机视觉模型——如果这是一个没有大量现有培训数据的新产品或流程,这通常是一项艰巨的任务。因此,如果没有一个稳健的数据集来调整新过程的机器学习算法,制造商往往被迫手动测试和生成体能训练数据,直到模型变得足够可靠。

 

在工业AI领域,由于需要不断更新、客户规模有限以及高昂的前期成本,软件即服务(SaaS)公司利润丰厚的经济效益不再适用。李开复的AI产业初创公司创新奇智(AInnovation),为中钢国际和建筑巨头中铁四号等工业企业开发AI系统。随着创新奇智扩大其客户群,它被迫增加软件支出,部署更多专有的低利润硬件,导致毛利率从2018年的62.9%暴跌至2020年的29.1%。

 

由于工业部门的AI不能通过一刀切的横向解决方案来采用,该行业需要一大批新的中级AI人才——比一般的数据分析师更熟练,但比ML工程师和研究人员成本更低。中国的AI教育战略旨在填补这一应用AI人才的利基市场,以便每家工业公司都可以聘请内部团队来构建自己的机器学习基础设施。

 

下一篇:无下一篇
分享到: