数据交换平台
发布日期:2016-06-27 来源:研发中心

概述:

天诚数据交换平台分为C/S基于ETL工具进行数据抽取(Extract)、转换(Transform)、装载(Load)的过程。转换功能全,使用简洁。作业项丰富,流程合理。 java语言编写,支持的数据源范围广,所以,跨平台性较好。B/S可以随时进行终端监控数据作业项状态查看,作业的启动时间,完成时间,正在运行的作业信息,可以看到每个作业项导入数据的读、写、更新、舍弃、错误、输入、输出。

天诚数据交换平台致力于为政府部门进行数据采集,解决省级或市级单位与地区级进行数据同步,完成数据层和服务层中同层或异层间的数据交换,能为实现不同网络系统、不同操作系统、异构数据库、不同数据格式、不同地域的应用系统之间的信息共享与交换,提供数据处理和数据传递服务。

物理边界分析,数据交换平台的机器设备分部在全省各县、市(地区)区及机关单位,每个机关单位都有一个数据交换平台的前置机(如数据服务器、资源服务器和WEB服务器可以共用一台机器),每个县或市都有一个数据交换中心,前置机和交换中心通过中间件跨地域成一个数据交换平台,前置机是数据交换平台和各县市区业务系统的边界线,如下图所示:

转换功能,数据交换平台提供数据的格式转换功能,能将文本文件、XML文件、数据库、JMS提供的数据通过过滤、组合处理,对数据进行格式转换和过滤清洗,成为干净的符合条件的数据。

数据采集、同步及入库功能,平台能定时或自动的从前置机数据库中采集相应数据,同步到市中心或省中心数据库,数据可以是格式文件、数据库、及外部系统调用平台的接口API传入的数据。

数据交换的平台约束之相对独立性,数据交换平台独立于各个业务应用系统的业务逻辑,数据传输与数据的内容、形式无关。同时,数据交换平台与现有的业务应用系统应保持相互隔离和透明,数据交换平台对现有业务应用系统没有影响或尽量减少影响。

数据交换的平台约束之松耦合性,各个跨部门跨地域的业务应用系统在使用统一的数据交换平台时具有逻辑独立性,其中任何系统出现故障,都不会对其他业务系统造成直接的危害和影响,唯一的影响只是出现故障的业务应用系统不能实时获取或提供交换数据。

总体架构:

数据处理架构

天诚数据软件交换平台基于ETL进行数据采集处理,下面介绍下ETL特点:

ETL,Extraction-Transformation-Loading的缩写,中文名称为数据抽取、转换和加载。ETL负责将分布的、异构 数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。

ETL是数据仓库中的非常重要的一环。它是承前启后的必要的一步。相对于关系数据库, 数据仓库技术没有严格的数学理论基础,它更面向实际工程应用。所以从工程应用的角度来考虑,按着物理数据模型的要求加载数据并对数据进行一些系列处理,处 理过程与经验直接相关,同时这部分的工作直接关系数据仓库中数据的质量,从而影响到联机分析处理和数据挖掘的结果的质量。

数据仓库是一个独立的数据环境,需要通过抽取过程将数据从联机事务处理环境、外部数据源和脱机的数据存储介质导入到数据仓库中;在技术上,ETL主 要涉及到关联、转换、增量、调度和监控等几个方面;数据仓库系统中数据不要求与联机事务处理系统中数据实时同步,所以ETL可以定时进行。但多个ETL的 操作时间、顺序和成败对数据仓库中信息的有效性至关重要。

C/S端数据采集配置及B/S端数据监控实例: