数据对于制造业的国际化影响
探讨工业化物联网数据分析的全球趋势的最新O'Reilly报告。
编者注:本文是即将发布的报告的节选——现在制造业的数据科学:全球趋势:工业物联网大数据分析,作者Li Ping Chu。敬请期待。

机器学习与制造业

人工智能在全球已经有数十年的发展历史,并且人们在深度学习领域也看到了巨大的进步(如IBM的Deep Blue和Google的Alpha Go)。但将人工智能应用到企业生产中仅仅是近十年来才发生的变化。过去几年中,整合了人工智能的的Bi应用呈现爆发式增长。
在制造业领域,机器学习主要用于发现工业生产数据中的异常模式识别以及预知性维护。异常监测并不只针对工业生产,但是应用到特定的工业生产就不一样了。

异常检测

监测异常的过程中,第一步就是建立起正常的基准线。已经有历史数据的机构在这个领域更胜一筹,因为这些数据可以直接灌进绝大部分的机器学习系统中,以建立起基准线。不幸的是,如果机构却少这类的数据,系统就需要一段时间来观察收集数据才能确定基准线。这个积累的时间可长可短,取决于组织本身的属性以及数据是否会随时间大幅度变化,如不同的季度之间。
工业生产者可以从异常检测中获益颇多。最典型的例子是,异常监测可以在生产线上更早的找到有缺陷的产品。早期的异常检测可以帮助机械操作员更早预警到生产流程中可能存在的宕机事件,从而使的事件可以被更快速的解决,甚至不需要关停流水线。

预知性维护

预知性维护是异常检测一个子集,它专注在机械本身的状态判断上。例如,是否一个机器即将接近它的维修窗口,或者即将发生故障。通过将当前传感器数据与历史数据做比对,系统可以使用预知性维护算法来更早的发现潜在的事件,使的公司可以更早的进行维护从而将潜在的影响降低到最小。预知性维护也可以帮助公司减少昂贵的计划外的维护,以及由于维护造成的利润下降。

机器学习应用

GE的Predix和Siemens的Sinalytics都将机器学习应用到了他们的平台中。Amazon的AWS机器学习平台Microsoft的Azure机器学习平台也都在为那些已经有大数据实践并且想应用机器学习的公司提供服务。还有很多同类的公司都在为工业界客户提供机器学习的服务,如AnodotPlat.one
现在,机器学习的使用环境也比以前更有好的多。大多数的机器学习工具都是基于规则的,甚至可以通过可视化界面帮助建模。这些模型,许多都是由Bi部门中知道如何编写脚本的普通员工或者数据科学家构建的,并且客户在线部署而无需其它定制代码。
更高级的机器学习功能还包括资产模拟。资产模拟可以将工业机械建模为软件,在不同的环境下模拟运行。这种模拟可以帮助企业找出优化资产的所有变量,最大化各种情况下的使用效率。GE的Predix中,这个功能叫做Digital Twin,虽然目前还没有能够模拟任何一种机械,但是GE声称它几乎可以通过软件模拟所有的设备。

自然语言处理

目前,分析工业机械数据的最大挑战在于了解数据中的含义(如错误代码和传感器数据)。数据格式(信息与其含义的对应)经常深藏在操作手册里,这意味着在利用这些数据之前,需要手工对这些数据进行映射。GE的Knowlege Discovery实验室的Lead,Steven Gustafson,解释道:
“(在一个工厂中)我们有许多不同生产商生产的不同类型的机器,他们经常使用一种很初级的方式连接到中控系统中,只是用来做报警,关机或者一些安全相关的事情。现在,我们想以一种全局性的方式来观察整体的运转情况,从而进行优化。在数据侧,机器学习已经成为了一种主要的分析手段。
因此,这里我们需要使用自然语言处理算法来分析提取机械故障报告,从而将数据结构化。因为如果你有一个运行着几十种机械的工厂,他们产生的报警信息往往是不同的格式,描述着报警的内容。而令人惊讶的是,自然语言处理可以将这些报警信息标准化,从而在数据回流的时候,这些报警信息将会是数字形式的——我更倾向于称之为“兼容格式”。这样我们就可以基于它们做出自动化的响应。 ”

Li Ping Chu

Li Ping Chu是硅谷高科技热潮中的老兵。15年的经验跨越从5个人的创业公司到为主要金融公司做咨询,比如Charles Schwab,以及像The Gap和Williams-Sonoma这样的电子商务公司。他参与过各种种类各种规模的项目。目前在台北主要帮助一家本地移动游戏公司构建分析引擎。他喜欢狗和猫。

High Tech Manufacturing in China. (source: Cory M. Grenier on Flickr).