安防人上中安网!

关注我们  

安防网 >> 工程方案 >> 其他

多维数据分析的实现及应用

2009-12-17 10:12:01 来源:中安网 作者:花楹 责任编辑: xiongs 收藏本文
本文简要介绍了商业智能的基本知识和多维分析模型的基本技术,通过将多维建模思想应用于关系数据库的E-R模型,充分利用结构化查询语言(SQL)和JAVA数据存储技术,提供了一种基于WEB的多维分析工具的实现,描述了如何将该多维分析工具应用于安全技术防范统计工作,实现了安全技术防范工作的多维统计分析功能。

  一、引言


  信息技术随着需求的变化在不断地向前发展,从最初的单机版的应用软件发展到网络版的管理系统(MIS),接着又出现了ERP(企业资源计划)、CRM(客户关系管理)等,商业智能则是最近几年信息技术领域研究和应用比较多的一个概念,多维数据分析是商业智能当中应用的一项主要技术,其往往通过商业智能前端展现工具进行体现,后端则一般是基于数据仓库和OLAP服务器来实现,针对目前大量的数据信息都是存储在关系数据库中,需要找到一种解决办法,使关系数据库中数据能够以多维的形式进行展现,并且能将这种展现应用于日常的业务系统当中。


  通过对关系数据库E-R模型的分析,可以找到关系数据模型与多维数据模型之间的对应关系,从而实现关系数据向多维数据的转换,关系数据最终都是通过SQL查询语句实现数据检索的,因此需要将多维分析操作转换成相应的查询语句,在数据的展现方面主要通过表格和图形的方式进行显示,通过以上研究实现了一个基于WEB的多维数据分析和展现的工具。


  在某安全技术防范工作项目的研究当中,集成了该多维数据分析工具,实现了数据的多维分析和展现,达到了很好的应用效果,增强了数据统计的真实性、灵活性和直观性。


  二、商业智能及多维数据分析技术


  商业智能简称BI(Business Intelligence),商业智能是对商业信息的搜集、管理和分析的过程,目的是使企业的各级决策者获得知识或洞察力,促使他们做出对企业更有利的决策。商业智能作为一个系统的解决方案,它综合了多种计算机技术和信息处理技术,商业智能技术主要包括:数据库和数据仓库技术(Data Warehousing)、数据抽取转换加载技术(ETL-Extraction Transformation Loading)、联机分析处理技术(OLAP-Online Analytical Process)、数据挖掘技术(Data Mining)、前端展现技术等,图表1说明了这些技术之间的相互关系。
 



图表 1 商业智能技术框图

  从图表1中可以看出,存储在各种各样的数据源中的数据经过ETL过程之后被存储到数据仓库中,通过OLAP服务器可对数据仓库中的数据进行多维建模,使数据以多维的方式存储在OLAP服务器中或多维数据库中,通过数据挖掘技术和工具可发现数据中隐含的有价值信息,利用前端展现工具和技术可把数据以多种方式展现出来,供查阅和分析。


  我们如何理解多维数据中的维?维是人们观察事物的角度,同样的数据从不同的维进行观察可能会得到不同的结果,同时也使人们更加全面和清楚地认识事物的本质。比如一个典型的商品销售数据库,记录了商品销售的详细情况,则我们可从这么几个方面来对销售数据进行分析:从产品的角度,可以按产品的类别、品牌、型号来查看产品的销售情况;从客户的角度,可以按客户的类别、地区等来查看产品的购买情况;从销售代表的角度,可以按销售代表的部门、级别等来查看产品销售业绩;从时间的角度,可以按年度、季度、月份等来观察产品销售的变动情况。其中产品、客户、销售代表、时间分别是四个不同的维度,每个维度都从不同方面体现了销售数据的特征,而每个维度又可按粒度的不同划分成多个层次,称为维度成员,多维分析中另一个重要的概念是数据指标,简称指标,指标代表了数据中的可度量的属性,在上面的销售数据中有两个重要的指标是销售数量和销售金额。


  当数据有了维的概念之后,便可对数据进行多维分析操作,常见的多维分析操作主要有:钻取(上钻和下钻)、切片、切块、旋转。钻取:钻取是改变维度的层次,变换分析的粒度。钻取包括上钻和下钻,上钻是在某一维上将低层次的细节数据概括到高层次的汇总数据的过程,减少了分析的维数;下钻则是相反,它是将高层次的汇总数据进行细化,深入到低层次细节数据的过程,增加了分析的维数。切片和切块:在多维分析中,如果在某一维度上限定了一个值,则称为对原有分析的一个切片,如果对多个维度进行限定,每个维度限定为一组取值范围,则称为对原有分析的一个切块。在多维分析中,维度都是按某一顺序进行显示,如果变换维度的顺序和方向,或交换两个维度的位置,则称为旋转。


  三、多维数据分析的实现


  要实现关系型数据的多维分析,首先要从关系数据库的E-R模型中提取维度和指标信息,然后在这些维度和指标之间建立一种关联,通过执行SQL查询语句检索出统计结果,最后将统计结果以可视化的形式进行显示。基于这样一种思想,要实现一个多维统计分析工具,可按以下几个步骤来进行。


  3.1 维度指标定义


  根据维度和指标的概念,从现有的数据表中选择可对应维度或指标的字段,将这些字段的信息分别保存在维度表和指标表中,维度表的信息主要包括:维度名称、维度类别、表的ID、字段名、规则等,指标表的信息主要包括:指标名称、指标类别、表的ID、字段名、规则 、聚合类型等。


  3.2 建立关联关系


【想第一时间了解安防行业的重磅新闻吗?请立即关注中安网官方微信(微信号:cpscomcn)——安防行业第一人气微信,万千精彩,千万不要错过!!!

中安网官方微信

提示:试试"← →"实现快速翻页

网友评论

共有0条评论  点击查看全部>>

所有评论仅代表网友观点,与本站无关。

24小时阅读排行

本周阅读排行

订阅邮件
安防速递

每天三个要闻,知晓行业关键

E 周 刊

一周事,一朝知

Email: