城市操作系统的概念
城市操作系统是物理世界与数字世界的连接器,是智能城市的数字基石,是城市数据获取、管理、分析、展现的中枢,也是沉淀城市中数据相关应用的公共组件的容器。城市操作系统搭载在云计算基础设施之上、智能城市应用之下,向下通过云基础设施来管理底层数据,并且连接和调度城市中的硬件设备;向上提供公共组件和接口,支持各类智能城市应用的开发、运行和协调联动,是各个智能城市应用和业务系统的底座。城市操作系统通过数字网关相互连接,实现数据在不同领域中的安全共享和协同计算。
我们可以用个人电脑作一个简单类比,来说明城市操作系统的定位和概念。最下面是硬件基础设施,当前的云基础设施就好比PC机,提供计算、存储和网络连接单元。在PC机之上,我们需要安装一个操作系统(如微软的Windows操作系统),作为硬件和应用软件之间的管理、协调层,向下管理和调度硬件设备和数据,向上为应用程序开发提供组件和接口,并协调不同应用程序对数据和硬件的访问。有了Windows之后,我们才可以在上面安装各种应用软件(如Word、PPT等)。同理,在云基础设施之上也需要一个专门为智能城市设计的智能城市操作系统(相当于PC机上的Windows),来连接底层的云和上层的各种智能城市应用。只有安装了智能城市操作系统,我们才可以支持各种不同的智能城市应用,如交通大脑、环境大脑、市域社会治理、数字城管等,并确保这些应用可以复用功能组件和数据。若直接在云上开发智能城市应用,就好比直接在没有Windows的PC机上开发应用,其难度大、代价高、扩展性差,而且智能城市的应用是互相孤立的,无法协同。
城市操作系统的框架
给出了城市操作系统的基本框架,包括数据采集、数据结构、数据管理引擎、人工智能引擎、联邦数字网关和展示引擎等6层。数据采集层通过数据直通车提供各类数据的采集接口,对接城市中包括*务系统、传感器、移动设备和人群等数据源,实现城市状态的全域感知,完成*务数据、时空数据、视频、图像、语音和文本数据的全量、高实时、稳定、安全的采集和汇聚。数据直通车具备以下3个特点:
1.普适:针对物联网(IoT)、视频等设备源提供统一接入网关,适配不同协议,实现快速高效的接入;同时,通过开发者模式接口,支持自定义接入方式,保证灵活适配的同时降低接入成本。
2.便捷:提供即插即用的数据管道,支持插拔各种数据预处理或稽核组件,丰富接入拓展能力。
3.安全:预制多种加解密算法、脱敏算法来保障数据传输安全稳定。
数据结构层把城市中纷繁复杂的数据归为三大类,针对每一类数据设计了相应的数据存储模型,确保了城市操作系统的扩展性和一致性。这三类数据包括:
1.结构化数据:以电子*务类表格数据为代表,通常以人或者机构的ID为锚点来聚合不同的信息,如名称、职业、收入等;后续会演变出基础库、主题库、专题库等一系列组织形式。
2.非结构化数据:以视频、图像、语音和文本为代表,后续大多需要经过分析处理变成结构化数据才能被使用。
3.时空数据:以地理信息、IoT、轨迹数据为代表。时空数据按照数据结构可分为点数据和网数据;按照时空信息是否动态变化可分为三类:空间静态时间静态、空间静态时间动态和时空动态。
数据管理引擎层包含结构化数据管理引擎、视图管理引擎和时空数据引擎。其中时空数据引擎是智能城市操作系统的亮点,它将时空索引技术与分布式计算环境相结合,提供针对6类时空数据的多种查询算法,包括时空范围查询、最近邻查询、ID时间点查询、可达区域查询等一系列查询方式,支持对时空数据的高效检索,向上支撑各种AI算法模型的高效分析。其对时空数据的查询效率比行业水平快10~倍。
此外,时空数据引擎也满足了城市治理中对多源数据按照时空维度来聚合的需求。例如,在治理一个社区时,我们需要根据这个社区的空间范围聚合在某个时间段(如最近1个月)出入该社区的人流和车辆数据,以及这个社区内产生的消费和视频等多源数据。
AI引擎层包括通用人工智能引擎和时空AI引擎。前者包含图像识别、语音识别和自然语言处理等常用的AI算法模型;后者则是专门针对时空数据设计的AI算法模块,如交通流量预测、充电桩选址、人流聚集预警等。与通用AI模型不同,这些AI模型要重点考虑时空数据的空间临近性、空间层次和空间距离,以及时间的临近性、周期性和趋势性,共六大属性。
此外,在智能城市的一项具体业务中,通常需要利用不同数据背后蕴含的知识,例如,预测空气质量需要同时考虑气象、交通流量和地理信息等多种因素。针对此问题,时空AI引擎提供多源数据(知识)融合的能力,通过有机融合不同数据背后蕴藏的知识来深挖数据价值,强力支撑智能城市的应用。
联邦数字网关可以实现不同城市操作系统之间数据的安全互联和共享。联邦数字网关跟随城市操作系统部署到不同的部门,在原始数据“不出门”的前提下,各部门内部将数据进行不可逆的粗加工,然后再融合计算,最终的计算结果可以支撑不同的应用。如果把不同机构比作麦田,机构中的数据比作小麦,联邦数字网关就是磨麦机。我们用磨麦机在各自的麦田里把小麦磨成了面粉,我们无法从面粉反推出原来小麦的样子。之后把各个麦田里磨成的面粉拿出来,加上水和成面团做成包子,这个包子就是有价值的应用,但我们并没有泄露任何原始数据和可读信息。这个不可逆的粗加工过程并不是加密,也不是简单的匿名化处理,更不是特征值提取。
数字孪生层通过莫奈视窗等组件来实现对数据及分析结果的展现,实现人和机器之间的动态交互以及人机智能的深度融合。数字孪生系统包括以下4个环节:
1.为物理世界与虚拟世界提供非常逼真的数字建模和镜像。例如,物理世界里有一座桥,虚拟世界里就会有这座桥详细的数字建模,关联的信息具体到每个桥墩,每一块砖的体积、材质,生产商和建设日期等。这些都属于静态信息。
2.将物理世界的动态信息(如车流、人流、气象、能耗等)叠加到数字世界模型上,实现更加逼真的展现。
3.利用AI和大数据模型,对获取的数据进行处理和分析,产生相应的决策。例如根据人流、事件和气象来预警某一地区的人流聚集异常情况,并建议疏导方案和路径。
4.通过数字孪生系统将决策作用于物理世界,指导人们的行为和方案实施。例如,通过数字孪生系统直接给某个具体的民警下派任务,并能实时、清晰地看到民警执行任务的状态。