大多数数据将会存储于大型遗留或打包的系统中,数据结构的细节对于这些系统来说可能是不可见的。其他数据将存储于电子表格和个人数据库(例如MicrosoftAccess)中,且可能对于IT部门或高级业务数据管理员来说是不可见的。一些关键数据可能存储于由服务供应商或业务合作伙伴维系的外部系统中。随着您对复杂数据架构的探究,就会逐渐接受两个现实:
您很少能够控制高级业务数据概念实现的方式。数据很可能是高度分散的,并且常常在质量方面缺乏足够的控制。
大部分数据在大量系统中进行复制,并且在质量、格式及含义上出现重大变更。
一些由企业应用程序集成(EnterpriseApplicationIntegration,EAI)技术或精心的业务流程进行维护的副本,也许是好的(但很可能不完善)。而大部分数据的处理是很不好的,仅仅由临时的批量传输或迫于压力和不流畅的人工流程来维护。组织及业务流程的冲突或信任上的失败可能会阻碍对数据处理见解的进步。这些条件有几个重要的结果。例如,当计划,如客户关系管理(CustomerRelationshipManagement,CRM)和商业智能(BusinessIntelligence)需要通过各种各样的来源来合并数据时,不够良好的副本也许会使得业务或技术问题恶化。一些组织在端到端流程中利用各种遗留系统。业务或IT都可能会进行改变以简化业务流程,流水化数据流并减少复制。尽管建模为解决这些难题带来了好处,但是传统的建模方法不能解决这些难题。它们会建立要么过于详细以至于无法使用的模型,要么建立不够详细的模型,并且他们没有着重于企业数据架构和各种组件整合的难题。我们相信用企业级的观点来创建强有力的、简单并有效的数据结构模型是很重要的——一组被称为“企业数据架构”的模型。
企业数据架构模型——支持各种公共的IT和业务改进计划
数据架构不是一组单个系统的详细模型,因为它们不能传送用来满足以上需求的所需要的“大图片”信息。而且它不仅仅是业务流程和系统范围的顶级模型,因为它们没有包含足够的细节以回答实际的问题。
数据架构图
数据架构图描述了“什么”组成了数据架构。支持它的数据策略和计划阐述了“为什么”。单个的模型说明数据是什么、在哪里,以及什么时候由谁如何改变。
哪些模型构成了数据架构
数据架构主要由下面部分介绍的四级模型定义。通常,只有在业务流程发生重大变更时,高级数据模型才会变更,但其他的模型将存在于各种各样的版本中,代表“目前”的结构和一个或多个“将来”的进展。
高级数据模型
顶层是一组高级数据模型,用概念性观点描述业务数据,独立于任何当前实际系统的实现。每个高级数据模型(high-leveldatamodel,HLDM)包含:
主要数据项(业务实体)及其关系的通用(规范的)UML类模型。
业务属性的超集,包含对这些属性含义(语义)、标准化格式(语法)和普遍制约的描述。
因为这些是数据模型,所以它们不会包含类方法,如果业务对象有责任管理其他结构的话,对这些方法进行概括是适合的。
模型应包含所有具有业务意义的属性和定义数据结构的内容(例如,控制多样性业务规则的输入)。
改进数据架构:数据策略
将“目前”的数据架构进行建模非常有用,它能够很确定地显示出哪里不是最佳的。然而,如果您想要进行提高,就需要有比好的模型多得多的东西。围绕改进数据集合、使用和管理的大部分问题是非技术性的。IT部门,及业务经理们,需要开发以下内容:
设定企业如何收集、管理并使用数据的原则。
包含“目前”的和“将来”的模型的数据架构。
数据架构的管理规则和变更控制流程,由IT和适当的业务代表共同管理。
在每个业务领域内的数据管理规则:
存储什么数据。
谁负责数据的收集和质量。
谁控制,谁管理
存储多久,将来如何安排或归档。
谁可以使用,及如何向常规用户组之外的用户公开。
关于信息和相关风险分类的方案,以确保定义恰当的安全方法。
您还需要帮助改进并编制业务流程以改进数据管理。
数据策略需要建立在清晰的意见一致的原则之上,例如以下部分:
不论在哪里,数据的输入必须简单且数据能准确地反应情况,还要以一种对输入输出有效的且可用的格式。
如果数据具有已知且编制了的用途和值,就应收集。
那些对数据有合法业务需要的数据应该是易用的。
数据获取、验证和处理的流程不论在哪都应是自动的。数据只应输入一次。
在整个企业范围内,更新所给数据项的流程应是标准的。
应尽可能准确完整地记录数据,利用最广博的来源,使其与原始内容尽可能接近,在最初的时候将其变成电子格式,并采取可检查可跟踪的方式。
数据收集和共享的费用应最小。
企业,而不是任何个人或业务单元,拥有所有数据。
每个数据源必须有确定的管理人(业务角色)负责数据的精确性、完全性和安全性。
防止对数据进行未授权的访问和更改。
除非有实际的原因需要进行复制,否则不能够对数据进行复制。在此情况下,一个源必须明确地作为原版,要有健壮的流程确保每一步的副本,并且不能修改副本。
数据结构必须在严格的变更控制下,以便于可以适当地管理各种业务和系统牵连的变更。无论什么时候,对公共数据模型采用国际、国家或行业标准。在不可能采用时,开发组织的标准来替代。对企业数据架构的文档化的理解是许多公共IS和业务改进计划的必要先决条件。适当的模型与详细的系统模型和高级业务模型截然不同。本文概述了一组有助于满足这些需求的UML模型和技术。
欢迎分享与同行转载,但请务必注明作者及出处,尊重作者及小编劳动成果,这是作为信息化从业者最基本的职业素养之一,谢谢!