我们雷达上的9种AI趋势
自动化、机器欺骗、硬件等诸多方面的新发展将如何塑造AI?
编者注:查看Strata Data人工智能系列会议,其中涵盖了本文中讨论的主题和关键问题。

以下是企业领导者和从业者应该在提前几个月关注的关键人工智能趋势。

我们将开始看到技术可以实现大量任务的部分自动化。

自动化分阶段进行。 虽然全自动化可能还有很长的路要走,但是有许多工作流程和任务可以实现部分自动化。 事实上, 麦肯锡估计“使用现有技术,只有不到5%的职业可以完全自动化。 但是,大约60%的职业可能有30%或更多的工作活动组分可以自动化。“

我们已经看到了一些依赖于计算机视觉和语音技术的有趣产品和服务,我们期望在2019年看到更多。寻找语言模型和机器人技术的进一步改进,将导致针对文本和物理世界任务的解决方案。 竞争将驱动企业实施部分自动化解决方案,而非等待完整的自动化模型出现,这些部分自动化项目的成功将促进进一步的发展。

企业中的AI将基于现有的分析应用程序搭建。

过去几年,公司一直在构建流程和基础架构来解锁分散的数据源,以改进对大多数关键任务的分析,比如业务分析,推荐系统和个性化定制服务,预测还是异常检测和监控。

除了使用视觉和语音技术的新系统之外,我们预期,早期进行深度学习、强化学习的公司存在于那些已经拥有数据和机器学习的领域。 例如,公司正在把深度学习注入时间和地理空间数据系统,从而产生更加可扩展、更准确的混合系统(即,将深度学习与其他机器学习方法相结合的系统)。

在部分自动化和“Human-In-The-Loop”(将人考虑进数据闭环)的时代,UX / UI设计将至关重要。

许多当前的AI解决方案与消费者、人类工作者和领域专家背靠背合作。 这些系统提高了用户的生产力,并且在许多情况下使他们能够以令人难以置信的规模和准确性执行任务。 正确的用户体验/用户界面设计不仅简化了这些任务,而且实际上,它在使用户信任并使用人工智能解决方案方面走过了很长的历史。

我们将看到用于传感器、模型训练和模型推理的专用硬件。

深度学习的复兴始于2011年左右,在语音和计算机视觉方面创造了创纪录的模式。 今天,确实有足够的规模来证明专业硬件的合理性 – 仅Facebook每天就可以进行数万亿的预测。 谷歌也有足够的规模来证明自己生产专用硬件的合理性:自去年以来,它一直在其云中使用其张量处理单元(TPU)。 2019应该看到更广泛的专用硬件选择开始出现。 中国和美国的许多公司和初创公司一直致力于在数据中心和边缘设备上开发针对模型构建和推理的硬件。

AI解决方案将继续依赖混合模型。

虽然深度学习继续推动许多有趣的研究,但大多数端到端解决方案都是混合系统。在2019年,我们将开始更多地了解其他组件和方法的重要作用 – 包括基于模型的方法,如贝叶斯推断,树搜索,进化算法,知识图谱,模拟平台等等。 我们可能会开始看到不基于神经网络的机器学习方法的令人兴奋的发展。

人工智能的成功将刺激对新工具和流程的投资。

我们处于一个高度经验化的机器学习时代。 ML开发工具需要考虑数据重要性、实验、模型搜索、模型部署和监控的重要性。 我们现在只做了一小步:模型构建。 公司开始研究数据血缘,元数据管理和分析,计算资源的有效利用,高效模型搜索和超参数调整等工具。 在2019年,期望许多新工具可以简化AI和ML在产品和服务上的开发和实际部署。

机器欺骗仍然是一个严峻的挑战。

尽管有一些“造假”的新闻,但我们仍然处于机器生成内容(假图像,视频,音频和文本)的早期阶段。 至少就目前而言,检测和取证技术已经能够发现虚假的视频和图像。 但是,用于生成虚假内容的工具正在迅速改进,因此美国和其他地方的融资机构已经启动了一些计划,以确保检测技术不断发展。

机器欺骗不只是指欺骗人类的机器; 欺骗机器的机器(机器人)和欺骗机器的人类(钓鱼部队和点击农场)可能同样难以处理。 信息传播方法论和点击农场将继续用于欺骗内容和零售平台上的排名系统,当新形式的机器欺骗发生时,我们要以最快的速度开发检测和解决这些问题的方法。

可靠性和安全性将成为焦点。

令人振奋的是,研究人员和从业人员对隐私,公平和道德问题产生了浓厚的兴趣并参与其中。 不过,随着人工智能系统部署在关键任务应用中 ,(甚至包括自动驾驶汽车或医疗保健等应用中存在的致命场景) 我们需要用自动化提高效率的同时,一样监控并保障安全性和可靠性。 在线平台上的机器欺骗行为的增加,以及最近涉及自动驾驶汽车的事故,已经让这个问题进入公众视野。 在2019年,我们期望更深入地讨论安全问题。

大型训练数据的访问权利民主化会让竞争更加公平

由于我们依赖的许多模型 – 包括深度学习和强化学习 – 都是需要使用大量的数据,因此,能够预期到的人工智能领域的获胜者是拥有大量数据的大公司或国家。 但是,用于生成标记数据集(特别是依赖人类标注者的公司)的服务开始使用机器学习工具来帮助他们的人类工作者扩展并提高其准确性。 在某些领域,生成对抗网络(GAN)和仿真平台等新工具能够提供真实的合成数据,可用于训练机器学习模型。 最后,一系列安全和隐私保护技术促进了各组织之间的数据共享,这有助于公司善加利用他们产生不了的数据。 总之,这些发展将帮助小型公司利用机器学习和人工智能进行竞争。

Ben Lorica

Ben Lorica是O'Reilly Media, Inc. 的首席数据科学家,也是Strata Data会议和人工智能会议的日程总监。 他在各种场景中应用了商业智能,数据挖掘,机器学习和统计分析,这些场景包括:直销,消费者和市场研究,精准广告,文本挖掘和金融工程。 他的背景涵盖了投资管理公司,互联网创业公司和金融服务公司。

阳台上的望远镜(来源:Pixabay上的Pexels