探析铁路运输支持系统关键技术论文
2020-02-04 14:25:03 92
1铁路运输决策支持系统
传统数据库在决策支持方面存在以下缺陷:(1)缺乏组织,首先是格式获得的数据混乱且不稳定,并且没有统一的标准;其次,由于各部门在分析过程中单方面提取数据,对同一问题的分析可能导致不同的结果。 (2)数据利用率低,难以转换它是有用的信息; (3)数据存储不完整,难以满足决策支持的需求; (4)模型库分析能力有限; (5)人机界面开发不理想。数据仓库和在线分析处理(OLAP)技术以及数据挖掘技术日趋成熟,为克服传统数据库的问题提供技术支持,并为决策支持系统开辟了新途径。铁路运输决策支持系统基于数据仓库技术,并使用OLAP技术和数据挖掘工具作为设计和实施整套解决方案的手段。
1.1铁路运输决策支持系统的体系结构
铁路运输决策支持系统由数据提取,数据仓库管理系统,模型库/知识库管理系统,数据挖掘,用户组成接口和其他模块。 。例如,铁路运输决策支持系统具有以下特征。 (1)从异构数据源中提取数据以实现数据库系统独立性。 (2)将数据仓库和OLAP结合起来,建立一个相互集成,互补的辅助决策系统。 (3)使用数据挖掘工具发现过去无法识别的数据关系,以帮助决策者做出更好的决策。 (4)将数据仓库,OLAP,数据挖掘,方法库/模型库以及用户交互相结合而形成的综合决策支持系统,可以进行定量分析和定性分析,进一步提高了辅助决策能力。铁路运输决策支持系统采用数据仓库技术,遵循数据仓库的结构体系,包括环境,数据仓库,主题,主题表,汇总表组,信息市场和数据市场。
1.2数据仓库的数据源
数据仓库的数据源基于当前铁路系统的业务系统及其综合应用,包括:(1)十八点统计分析系统; (2)自动号码识别系统; (3)卡车跟踪系统; (4)确认制度; (5)TMIS票务系统; (6)集装箱系统; (7)货运营销和生产管理系统(8)机票销售和预订系统(9)精密统计系统; (十)调度系统; (11)现在的编组站汽车管理系统。
1.3铁路运输决策支持系统的原型系统
对于铁路运输决策支持的核心组件-数据仓库,选择综合运输指标数据集市和旅客数据集市作为该系统的原型。项目。选择“综合运输指数数据集市”作为该项目的原型是基于以下考虑。
(1)能够全面反映运输生产组织和运行状况的十八点运输统计报告系统和精确统计系统,其基本信息通过人工收集,然后逐步报告。该系统具有良好的稳定性,并已积累了大量的数据。在此基础上,数据集市的建立是快速而有效的。
(2)综合运输指标体系所涉及的内容是指导运输生产和经营的重要信息,服务于运输分析部门,运输统计部门,调度部门等各级运输部门。其中,某些综合效率指标(货物收入,旅客收入,货物运输,旅客运输等)是该部领导人关注的信息。
(3)尽管十八点统计分析系统和精确统计系统设计的指标重叠,但时间类别并不一致。十八点统计分析系统是每日报告系统,每天18点进行报告。统计系统是月度报告系统,它是已在各个级别进行验证的月度信息。它具有很高的准确性,并在每个月中报告上个月的精确统计数据。运输情况还可以获得准确的数据,以指导未来的运输生产和管理。当前的情况是因为十八点统计分析系统,旅客运输精确度统计和货物运输精确度统计是数据库系统,各运输部门的内容不同,往往无法及时获得所需信息。经过铁路客运业务系统近十年的发展,大多数客运业务已经实现了计算机管理。它主要包括票务网络系统,票务非链接网站系统,小型车站系统,仓库系统,移动票务替换系统和乘客管理信息系统。手动完成的服务主要包括替代票和在偏远小站的手动票销售。票务系统被称为“铁路票务销售和预订系统”,它是国家“九五”科技攻关计划中最重要的项目。车站三级系统的建设,已建立了包括铁道部售票中心,23个区域售票中心和1800多个计算机售票站在内的计算机售票系统。其中,有800多个车站实现了网上售票。售票系统实现了车站售票的处理和区域中心客运业务的应用管理。这些业务操作生成的数据是用于决策支持系统以全面利用信息的重要数据源。此外,票务系统网站数量的增加使通过票务系统进行的票务销售占票务总收入的85%以上,票务收入占票务总收入的90%以上。因此,票务系统已经积累了丰富的历史数据,并具有建立数据集市的所有优势。它应该是铁路运输决策支持系统的组成部分。
2综合运输指标数据集市的设计
综合运输指标数据集市的数据来自18点统计分析系统和精密统计系统(包括货运)运输)精度统计和乘客统计)。前者涉及维度很少,指标很多,大多数指标值仅与时间维度有关;后者设计的指标较少,但是具有更大的相关维度。因此,可以使用不同的逻辑模型。
2.1综合运输指标数据集市的模型设计
十八点统计分析系统的数据关系很简单,使用传统的E_R模型。精度统计系统的数据使用星形模型。精密统计系统的维度包括:时间维度,地理维度1(级别为铁道部,公路局,分局和分界点),地理维度2(级别为国家,省和市),类别维度,运输距离尺寸,座位类型尺寸(硬座,软座,卧铺),统计分类尺寸(车站销售,汽车维修,退款),运输类别尺寸(管道直通,管道入口,管道到达),干线尺寸,火车尺寸和车站尺寸。十八点统计分析系统和精度统计系统的数据在数据集市中使用不同的物理存储模型。前者使用关系数据库组织形式(由关系事实表和维表组成);后者主要使用多维数据库组织形式(MDDB)。
2.2综合运输指标的ETL方案设计
综合运输指标的数据清理任务主要是:(1)统一十八点统计分析系统和精确统计系统中的编码; (2)为了便于进行OLAP分析,需要将数据源的数据集成到数据集市的主题表中,而不是直接将数据源复制到数据集市中。 18点统计分析系统的ETL计划包括:综合索引主题表,当前车辆,装卸车辆,卡车在分界点的出入,综合旅客运输指标,关键,快速旅客列车指标和主要旅客车站登机指标。 ETL计划,用于精确统计货物,包括货物到达统计,货物运输量和吨公里统计,分界站货物进出和转运统计,省际货物交换统计,货物运输距离统计,主干货物统计表,铁路分支机构的商品交易统计。 ETL解决方案,用于精确的旅客统计,包括旅客运输和票价统计,旅客流量和营业额,按距离和营业额计算的旅客人数,按行程,营业额和票价计算的旅客人数,行李,包裹运送,过境和到达统计,往返/窄轨包裹的运输量,营业额和平均旅行次数。
2.3建立数据仓库更新的时间机制
数据仓库数据不需要与在线交易处理系统进行实时同步,因此可以定期执行数据提取,但是需要进行多次提取操作时间,相互顺序,成功或失败对数据仓库中信息的有效性至关重要。十八点信息系统是每天八点在这个时间的统计信息,数据仓库的更新时间为24h;精密统计信息系统每月更新一次。
3综合运输指数数据集市的决策支持应用程序
3.1报表应用程序
报表始终是表示数据的最简单方法,该方法铁公路业务部门是数据传输的必要手段。因此,报表的应用也是铁路运输决策支持系统的主要应用之一。该系统使用BusinessObjects软件来实现报表应用程序。 BusinessObjects可以灵活,任意地生成各种形式的报告,以进行数据分析。基于铁路运输决策支持系统,首先生成部门使用的日常报告,然后从现有报告中得出其他各种报告。报告的数量是无限的,并且报告的形式是可变的。报告主要包括货运静态报告和旅客静态报告。
3.2多维分析
在决策支持系统中可以执行多种多维分析,包括分析货运量变化趋势和分析乘客变化趋势体积。在分析货运量变化趋势时,可以生成总货运量变化趋势图,每个局(省,市)的交通量变化趋势图,按类别的货运量变化趋势图以及一个局(省,市)按类别变化趋势图,跨省货物交换变化趋势图以及各运输距离的货运量变化趋势;在客运量变化趋势分析中,您可以生成乘客发送量和收入变化趋势图,局,省,线,窄趋势图,铁路货运量和周转量的变化,包裹量的变化图旅客和营业额发送的数据,每个运输距离的旅客运输量变化趋势图以及每次旅行的旅客人数,营业额和收入趋势。多维分析显示包括多维报告以及三维条形图和饼图。
3.3临时查询
临时查询是数据库应用程序中最常见的查询类型。使用数据仓库技术,用户可以随时访问数据库并从各种业务系统中获取所需的数据。综合运输指标数据集市中包括所有运输指标。通过为终端用户提供友好且易于使用的图形界面,它提供了选择和模糊搜索指标的功能,即,用户输入了他想查询的指标的名称(部分名称),以及其他诸如时间,局名,类别,运输类别,座位类型等待,您可以获得相应的信息,并且可以根据需要导入文本文件或另存为HTML格式文件。
3.4数据挖掘应用
基于18点统计分析系统和精度统计系统的数据,可以使用数据挖掘工具对综合运输指标进行时间序列预测分析。具体方法包括:使用广泛的预测方法,包括指数平滑模型,Winter方法和ARIMA(Box-Jenkins)模型;也可以通过组合模型来生成新模型或方法;在预测模型和预测模型中使用预测变量,包括时间趋势曲线,回归因子,干扰效应;浏览时间序列图,预测实数值,预测误差图,具有置信区间的预测图;逐一比较或根据特定模拟比较任何两个预测模型的拟合优度值;对所有模型进行统计排名;浏览预测和误差值或有意选择了两个模型来比较预测结果。测试了每个预测模型的拟合参数和统计显着性。
4结束语
本文介绍了铁路运输决策支持系统的基本架构。该系统依赖于数据仓库,并使用数据挖掘技术来尝试实现信息的综合利用。它还为铁路系统的各个级别和部门提供决策支持。其中,研究重点是铁路运输决策支持系统的子系统,即综合运输指标数据集市的设计,包括基于数据源特性的数据集市模型和ETL方案的设计。对于综合运输指标数据集市,其在决策支持中的应用包括报告应用,多维分析,即席查询和数据挖掘应用。本文首次系统地将数据仓库,数据挖掘和决策支持技术应用于中国铁路运输决策支持系统的建设。它专门研究系统基本体系结构的建立,包括数据源提取,数据集市模型设计,数据清理技术以及系统在决策支持中的若干特定应用。它为该系统的建立提供了坚实的理论基础和实践指导,为先进的数据处理技术在其他第三方物流企业的决策支持系统中的应用提供了宝贵的参考。