是科技企业是否也应启动AI智能?日期:2021/11/17

对于多数有兴趣使用人工智能(AI)的企业来说,不存在可以效法的明确模式。

制造业、农业和医疗卫生等行业拥有的数据集通常相对较小,定制系统成本高昂,而且会被试点与生产之间长久的时间间隔吓退。



尽管AI的潜力巨大,但它尚未在大多数行业立足。当然,它已经改变了谷歌、百度和亚马逊等消费类互联网企业——所有这些公司规模都很庞大,拥有数亿用户的大量数据。

不过,要实现AI每年创造13万亿美元价值这一预测,制造业、农业和医疗卫生等行业仍然需要找到办法让这项技术为它们服务。问题在于:这些消费类互联网企业用来构建其AI系统的行动手册——一个一体万用的AI系统可以为大量用户服务——对其他这些行业不起作用。

相反,这些传统产业将需要大量定制的解决方案,以适应其众多不同的用例。然而,这并不意味着AI不适于这些行业。而只意味着他们需要采取不同的方法,那就是使用数据而不是代码进行编程。

企业应该专注于收集高质量数据,以数据为中心的方法来构建AI。

具体来说,他们在致力于构建AI系统目标时应该小心注意确保数据清楚地传达他们需要让AI学习的内容。这就需要专注于囊括重要案例、并进行了连贯标记的数据,以便AI能够从这些数据中学习它应该要做的事情。换言之,创建这些有价值的AI系统的关键是我们需要能够使用数据编程而不是代码编程的团队。

以数据为中心的AI开发

AI系统由软件——包括某种AI模型的计算机程序——和数据(用于培育模型的信息)组成。比如,为了构建一个用于制造业自动化检查的AI系统,AI工程师可能会创建可以执行深度学习算法的软件,然后向其显示一个包含优质零件和有缺陷零件图片的数据集,这样它可以学会区分这些零件。

在过去的十年中,许多AI研究都是由以软件为中心的开发(也称为以模型为中心的开发)所推动的,数据在这种开发中是固定的。团队试图优化或发明新的程序,以便好好地从现有数据中学习。许多科技企业拥有源自数百万消费者的大型数据集,他们利用这些数据来推动AI的大量创新。

然而,在AI目前的发展水平上,许多应用程序的瓶颈在于获得正确的数据提供给软件。我们已经听说了大数据的好处,但我们现在知道,对于许多应用程序而言,专注于确保我们拥有优质的数据会更富有成效——这些数据清楚地说明了我们需要让AI学习的概念。这意味着数据在对重要案例的覆盖面上应该适当全面并进行连贯标记。数据是AI的食粮,现代AI系统不仅需要卡路里,还需要高质量的营养。

将重点从软件转变到数据提供了一个重大好处:它依赖的是你的现有员工。在AI人才严重短缺的时代,以数据为中心的方法允许许多在各自行业拥有渊博知识的主题专家为AI系统的开发尽力。

比如,多数工厂的工人都非常擅长定义和识别什么才算缺陷(0.2mm的划痕是否是缺陷?还是说它小得无关紧要?)。如果我们期望每家工厂要求其工人发明新的AI软件,以此让工厂获得其所需的定制解决方案,那么进展会十分迟缓。但是,如果我们转而构建并提供工具,使这些领域专家能够设计数据——通过向AI提供数据、使他们能够表达自己在制造业方面的知识——他们成功的几率会高得多。

以下是企业现在可以做的一些事情:

1、不要只关注所收集数据的数量,也要关注质量,确保它清楚地说明了我们需要让AI学习的概念。

2、确保团队考虑采用以数据为中心的方法,而不是以软件为中心的方法。许多AI工程师,包括许多具有强大学术或研究背景的工程师,接受过的是以软件为中心的方法培训;要敦促他们也采用以数据为中心的技术。

3、对于打算应用于生产的任何AI项目,请确保对部署过程进行规划并提供MLOps工具予以支持。比如,即使在构建概念验证系统时,也要敦促团队开始制定长期计划进行数据管理、部署以及AI系统的监控和维护。

AI有可能成为数据丰富的消费类互联网企业之外的一项蓬勃发展的资产,但尚未在其他行业取得进展。

但正因为如此,AI尚未开发的最大机会可能在于将其带到其他行业。就像电力改变了每个行业一样,AI也走在同样的道路上。但这条道路上的下几个步骤将要求我们在行动手册中改变构建和部署AI系统的方式。

具体而言,新的以数据为中心的思维方式,加上允许行业领域专家参与AI系统创建、部署和维护的MLOps工具,将确保所有行业都能收获AI所能提供的回报。

文章观点摘录“哈佛商业评论”