2015/11/27 15:53:19 数字化校园的共享数据库中心的设计方案

在分析了数字化校园建设的基础上,指出了建立共享数据库中心是整合现有校园信息资源的核心,是实现校园信息化的关键之一.通过研究数据仓库技术和联邦数据库技术,提出了一个包含数据源层、共享数据库层和主题分析层的三层体系结构的共享数据库中心设计方案,并对数据源层包含的数据进行了分析,最后给出了该共享数据库系统的实现方法.

数字化校园一般分为五个层次,从下到上依次是:网络层、数据层、支持层、业务层和表示层。另外,还有贯穿整个系统的用于安全、运营的管理工具等。其中,网络层是整个系统的硬基础,数据层是整个系统的软基础。而在数据层中,共享数据库中心是其核心。

高校的很多部门都存在着自己独立的异构系统,形成了一个个信息孤岛。消除信息孤岛的办法有两种:一种是废除已有的异构系统,按照一定标准重建系统;一种是通过系统集成的方法,整合异构的系统。高校可根据不同的系统采取不同的方案:对于旧的、运行良好的系统,采用整合方案,把旧应用系统整合到数字化校园中;对于新系统或落后系统,按照统一标准新建或重建。由于目前大部分高校中存在的大部分旧系统运行还良好,一时不会废除重新建造,所以系统集成是现在最常用的方法。

对旧系统的集成主要包括硬件集成与软件集成。对于硬件集成,现在的网络技术已为其集成提供了技术支持与保障。因此,软件集成是系统集成的核心内容。软件集成又涉及到两个方面:一方面是应用程序集成;一方面是数据集成。数据集成是应用程序集成的基础,是整个软件集成的重中之重。

在数字化校园框架中,网络层可以完成系统的硬件集成,软件集成中的数据集成可由数据层完成,软件集成中的应用系统集成可由支持层、业务层和表示层完成。由于数据集成在系统集成中的重要地位,以及共享数据库中心在数据层乃至在数字化校园中的重要地位,决定了共享数据库中心是整个系统集成的核心。

本文我们以益教教育数字化校园集成建设方案的实例分析,如何才能在数字化校园中完成高校数字化校园系统共享数据库的建设,这样才能确保原有数据库与现有资源融合。下面以企业数据库建设为例,具体分析两种系统集成方案。

1、系统集成方案

当前用在企业中并且比较成熟的数据集成方案有数据仓库和联邦数据库系统。下面就详细的介绍这两类系统集成方案的应用。

数据仓库

数据仓库是一个面向主题的、整合的、稳定的并且时变地收集数据以支持管理决策的一种数据结构形式。

数据仓库可由数据源、数据准备区、数据存储、应用工具和用户界面组成。

数据源的作用是提供原始的数据,这些数据一部分来自企业内部现有的信息系统,如ERP系统;另一部分来自企业外部,如第三方提供的数据或商业数据库提供的数据等。数据源是建立数据仓库的基础。数据仓库中存储的数据和数据源中的数据在格式和内容上差别很大,这个差别可由数据准备阶段的数据抽取、清洗、转换和加载来消除。应用工具OLAP、数据挖掘完成对数据仓库中数据的再次加工,然后提交给用户。元数据是数据仓库本身信息的数据,连接数据仓库的所有部分。

数据仓库是一种紧耦合的数据集成,是一种“数据驱动”的模型。“数据驱动”是将各个数据源的数据预先集成,并存在共享库中,供用户直接查询和分析,其优点是可以提高系统性能和响应速度,而且可以保存大量有用的历史数据。

数字化校园集成库

2、联邦数据库系统(FDBS)

联邦数据库系统是在集成各个应用系统,提供统一、透明的全局操作的同时,仍能保持各个应用系统局部应用的高度自治。它不采用一个全局的模式,各成员数据库可以自由加入或退出集成框架,以及以不同的程度集成到集成框架中去。

联邦数据库系统主要由通信接口、数据字典、数据组装模块、数据映射模块和中心虚拟数据库组成。

中心虚拟数据库是应用操作的数据库,由应用根据需要结合数据字典构造,集成各应用系统的数据;数据字典记录对各应用系统数据的集体描述,包括所有的应用系统数据库中表和数据项的定义等,是构造中心虚拟数据库和语法分析模块的基础;数据映射模块根据应用需求,将中心虚拟数据的构造与操作映射为对各应用系统数据库的SQL操作;数据组装模块负责将由通信接口取回的分组数据“组装”至中心虚拟数据库;通信接口负责进行操作命令与数据的传送与通信。

联邦数据库是一种松耦合的数据集成,是一种“查询驱动”的模型。“查询驱动”是将用户对共享数据库的查询根据元数据字典信息进行转换,然后再转发到相应的异构的数据库上,最后将各个站点的返回信息进行集成返回给用户。这种方法的优点在于可以利用原有的库结构,不用为共享库重新设计模式,但是它需要各个操作数据库具有一定的“剩余能力”,来完成与虚拟数据库的数据交换,在数据量很大时效率较低。

联邦数据库

以上两种数据库系统是最为常见的,也是最为实用的。我们以这两种数据库的优势结合到一起构建以数字化校园为主的共享数据库中心。下面具体说一下数字化校园共享数据库设计方案。

2、数字化校园下共享数据库中心设计方案

数字化校园下共享数据库中心

数字化校园可以看成一个特殊的企业,但是它又与企业有着本质的区别。企业的管理和流程一环紧扣一环,并相互连接,业务数据和逻辑采取的是紧耦合的方式,所以ERP建设通常是全局的、自上而下的。数字化校园的需求不像企业那样固定,中国教育制度的改革,学校的教学模式的不断变化,以及学校所特有的各种校园文化和各院系部门的相对独立、相对松散的性质,决定了数字化校园不能像ERP那样建设。于是就有了以一种松散的结构来设计数字化校园。

数字化校园共享数据中心的基本要求和总体目标是要做到:保证数字化校园信息编码的统一;保证任何两个业务系统之间没有冗余业务数据;保证“谁产生、谁维护”原则,保证所有的数据都只有唯一的维护者;保证提供反映整个学校的全面信息;保证为整个学校决策提供所需的数据信息。总之,数字化校园的共享数据中心一方面要提供包含全局一致的、细节的、当前或接近当前的数据,用于进行全局联机事务处理;另一方面,还要提供包含面向主题、集成的数据环境,适用于完成日常的决策分析。

基于数据仓库的系统是面向分析和高层决策支持的,能提供集成的、统一的、面向主题的数据环境。但是它要求系统中积累足够的历史数据,而且对于数据仓库的建设和维护需要投入大量的人力和物力。目前高校环境中,系统建设规模、即时OLAP和数据要求等方面都没有达到采用完整数据仓库方案的条件,因而数据仓库并不一定是最好的方案。

另外,高校中各个部门都有自己比较成熟的旧系统,如果采用联邦数据库,每个系统都要实现一个与虚拟共享库的接口,要对原系统做相应的修改。

总之,纯粹的数据仓库和联邦数据库系统是不能适应数字化校园建设需求的。

共享数据库中心的层次结构

数字化校园数据库

基于学校各系统的松耦合性质,以及学校的数据量相对企业来说比较小,可以同时借鉴数据仓库“数据驱动”模型和联邦数据库“查询驱动”模型,建立适应数字化校园的数据集成方案。建立一个共享的非虚拟的中心数据库,把各个系统需要的共享数据抽取到中心数据库中。然后,再在中心数据库的基础上进一步地抽取,建立用于查询、统计、分析的OLAP数据库和用于信息发布的主题数据库。为了达到共享数据中心的需求,并便于分阶段、分步骤地实施,整个共享中心可以分为三个层次:数据源层、共享数据库层和主题分析库层。

数据源是各个应用系统的内部数据库,它为共享数据库提供主要的源数据,同时又从共享数据库中得到自己需要的数据。

共享数据库层是整个系统的核心,它一方面从数据源中抽取共享数据,一方面为主题数据库和OLAP数据库提供源数据。

主题分析库层包括OLAP数据库和主题数据库。OLAP库是一个数据仓库,它的数据源是历史库,OLAP库从历史库中抽取出用于查询、统计和分析的各种数据。主题数据库是共享数据中心应用的基础,它直接从共享数据库中抽取数据,通过一定的规则进行组合后形成一个应用主题所需要的数据集成,然后以Portal发布。

这个方案的优点在于:各个部门内部可以沿用自己的子系统;各部门需要共享数据时,就可以直接从共享库中获得,不再需要通过手工或者映射方式从其它部门获得;共享库中的信息来自权威部门,保证了共享数据库中数据的权威性和正确性,同时避免了数据的冗余;多层次的体系结构,便于分阶段、分模块地进行建设,符合数字化校园的建设特点。

总之,基于目前高校中各个部门都有自己比较成熟的系统,将这些系统的数据抽取到共享数据库中进行数据共享,并为进一步的决策和应用提供数据支持的多层次的设计方案,是一种投资小、回报高的解决方案。

核心共享数据库

共享数据库中的数据可以分为5个部分:共享数据字典、信息标准、共享数据、历史库和管理信息。

共享数据包括:各业务系统之间需要共享的数据;共享数据经抽取整合业务系统需被共享的数据;业务系统通过订阅从共享数据库中获取所需的数据。

信息标准也是共享数据库的数据源,但是它不是来自应用系统,而是来自国家或教育部颁布的信息标准,或者学校根据自身特点发布的信息标准。信息标准原则上是为了统一学校的信息编码,保证学校只有一套运行中的信息编码。共享数据引用信息标准。

历史库是共享数据库的历史记录,是OLAP数据库的重要的数据来源。

管理信息包括:管理共享数据库中心需要的数据;应用系统库作为用户的注册信息、权限信息和其它信息;各个应用系统共享数据的提供和使用情况等。

共享数据字典描述共享数据库中的数据,主要包括:共享数据的元数据、数据的来源、数据的用户、应用系统库的描述信息等。

配套工具和服务

系统的实现可以分为两部分:一部分是数据层次结构的实现;另一部分是数据运转的实现。共享数据库中心的层次结构是整个数字化校园共享数据库中心的骨架,它把数据的抽取自然地分成了两个步骤:第一步是从数据源到共享数据库的数据抽取;第二步是共享数据库到主题数据库或OLAP数据库的再次抽取。在设计实现中,共享数据库具有承上启下的关键性作用,是整个系统数据层建模和数据运转的中心。

为了实现数据的运转,在共享数据库的基础上可以根据需要开发一系列的工具和服务。数据来源收集用于收集数据源各系统可以提供哪些共享数据,也就是明确数据从何处来、何时来。数据订阅收集数据源各系统需要哪些共享数据,也就是明确数据何系统在用、何时用。数据抽取根据数据来源从不同的系统中抽取需要的共享数据。数据同步有两方面:一方面是共享数据库同步数据来源系统的数据;一方面是订阅共享数据的系统同步共享数据库中的数据。数据发布服务于主题数据库的数据抽取。分析查询服务于OLAP库的各种分析查询工作。应用系统管理用于管理数据源系统在共享数据库中的注册信息。信息标准管理用于管理信息标准的制定和更新。元数据管理主要用于共享数据库结构和内容的展示。

总之,整个的系统实现就是一个数据共享和数据集成平台的搭建,不仅需要数据层的建模,还需要一些配套的工具和服务才可以满足系统的需求。

数字化校园是一个长期的系统工程,共享数据库中心是其重要的基础设施。本文提出的共享数据库方案已经用于中州大学数字化校园的建设。不过,整个方案还有很多地方需要进一步的细化。方案中提到的信息标准和各种配套的工具、服务需要进一步的设计和细化;旧系统集成的数据更新、同步方案有很多,要找到适合中州大学的方案,也需要进一步的调研;新系统的建设,需要制定出统一的系统建设标准。这些都是下一步需要继续研究的内容。

总之,数字化校园下的共享数据库中心是一个包含了大量共享数据和各种配套的工具、服务的数据集成平台,对它的设计要充分地考虑灵活性和可扩展性。

 
QQ在线咨询
销售热线
0371-53302651