智能数据平台推进智慧城市
运行在数据之上的智慧城市和智慧国家

根据联合国2014年的报告,全球54%的人口居住在城市,而未来的城市化进程则会进一步将这个数字在2050年提升到66%。这个人口城市化的浪潮已经鼓励全球的地方和中央政府的领导人来团结起来推进“智慧城市”,一个收集数字化信息技术的初创项目,设计来让城市更宜居、更灵活、更可持续发展。

智慧城市依赖于一系列基础技术,比如传感器、移动计算、社交媒体、高速通信网络和智能数据平台。这些在Strata+Hadoop World大会和我们O’Reilly出版物里都已经被多次强调。智慧城市技术的早期应用一般都出现在交通、物流、地方政府服务、电力、卫生保健和教育领域。之前Strata+Hadoop World大会的对话中已经描绘了使用机器学习和大数据技术理解和预测交通流量拥堵的模式,以及在大规模卫生保健数据平台上使用可穿戴设备。

在我们制定2015年Strata+Hadoop World新加坡大会的议题时,我们已经意识到了不少对于新加坡智慧国家项目的兴趣。更大范围内,我们更加注意到亚太地区大规模的信息基础设施的投资已经吸引了地方领导人参与智慧城市初创项目。对于那些已经熟悉大规模流计算平台的读者而言,推进智慧城市的很多关键技术应该已经不陌生了。这些技术有:

数据收集和传输

在智慧城市里,物联网和工业互联网应用、恰当的测量化和数据收集都依赖于传感器、移动设备和高速通信网络。很多的私有化的基础设施都属于大型电信公司,并由他们来运维。同样,很多的早期有趣的应用和平台也是由电信和网络设备供应商创建的。

数据处理、存储和实时报表

正如我之前的一篇文章里所表述的,分布式计算和硬件的高速发展已经带来了能够处理无穷数据和有穷数据工作的高吞吐处理引擎,如云计算平台(AWSGoogleMicrosoft等)和由开源工具搭建的私有数据平台。在这些平台的最基础层面上,他们都可以对于海量的数据流来提供近似实时的商业智能报表业务。

realtime-data-fusion-12c5edd5f6cd16f77b404c04f6f5c404

智慧的数据应用

不再是使用基本的累计和异常值检查,先进的机器学习和统计技术的使用已经打开了创新性实时计算应用(机器与机器间)的大门,这些应用不需要人参与决策循环的过程。这种应用比较流行的例子一般都包括一些系统,比如为数据中心、建筑物和公共空间、制造业(工业互联网)提供能源的系统。在意识到未来的智慧城市应用将会依赖于分散的数据,包括事件数据(从日志和时间序列数据中获得的指标)、非结构化的数据(图像、声音、文本)和地理位置信息数据源,我们已经在Strata+Hadoop World新加坡大会里设计了一些主题分会,主要关注面向这些数据类型的先进数据分析技术

智慧城市平台代表了实时和智能大数据系统的一些最令人激动和最有影响的应用。这些平台也会碰到很多同样的挑战,就如在商业、工业、人文和政府的应用所碰到的。在Strata+Hadoop World新加坡大会里,我们期待着能重点介绍那些能驱动我们未来城市的技术和社区的(思想和技术的)融合与碰撞。

相关内容

本·罗瑞卡(Ben Lorica)

本· 罗瑞卡是O'Reilly的首席数据科学家和关于数据方面的内容策略主管。在多个领域里(包括直销市场、消费者和市场研究、精准广告、文本挖掘和金融工程),他曾经进行了商业智能、数据挖掘、机器学习和统计分析的工作。他曾效力于投资管理公司、互联网创业企业和金融服务公司。

Marina Bay and the skyline of the Central Business District of Singapore at dusk, by William Cho. (source: Wikimedia Commons).