安防人上中安网!

关注我们  

安防网 >> 工程方案 >> 其他

数据挖掘技术在安全技术防范管理中的应用研究

2009-10-15 10:10:47 来源:中安网 作者:花楹 责任编辑: xiongs 收藏本文
本文将数据挖掘技术引入公安技防领域,通过尝试建立技防产品与某种类型案件及多发场所的联系,提出了两种符合公安实际要求的挖掘模式,为技防管理者有针对性地指导各地技防部门安装技防设施、预防案件发生提供决策参考。
 

  前言


  安全技术防范,作为社会管理实践活动中应用先进的电子技术对管理区域实施管理控制的一种防范手段,其本质是借助科学技术实现高效率的、可控成本的管理,其目的是最大限度地减少各种安全隐患,不断提高社会自防自卫能力和公安机关等管理机关处置各类突发事件的快速反应能力。它是以预防损失和预防犯罪为目的的一项公安业务和社会公共事业。对于警察执法部门而言,安全技术防范就是利用安全防范技术开展安全防范工作的一项公安业务。


  安全技术防范(以下简称技防)设施具有实时性、全天候、全角度、可记录等特点,能够大量减少持续投入的人力和物力,在整体上直接降低安全成本,因此公安机关为提高地区的安全保障,常使用技术防范手段,通过科学的安排警力,来有效的降低地区刑事和治安的案件发生率,提高群众的安全感、维护社会稳定。技防系统建设可供使用的技术手段非常多,由于每个地区的居民成分不同、居住环境不同、技防需求不同、资金条件不同,因此,使用的技防产品也各不相同,目前最常用到的产品有:出入口控制系统、移动报警系统、视频监控系统、防盗报警系统、电子巡更系统、周界报警系统、楼宇对讲系统等。


  技防管理中数据挖掘的应用


  数据挖掘通常又称数据库中知识发现(KDD),是自动的或方便的模式提取,这些模式代表隐藏在大型数据库、数据仓库或其他大量信息存储中的知识,获取的知识通常可广泛用于金融、电信、交通和制造业等包括商务管理、市场分析、工程设计、生产控制和科学探索众多领域。


  随着公安信息化的发展,数据挖掘作为一个利用各种分析工具在海量数据寻找信息和知识、发现模型和数据间关系的过程,已经越来越广泛地运用到公安决策支持过程中来,但由于数据类型和数据挖掘任务的多样性给数据挖掘技术提出了许多具有挑战性的课题,找出符合公安实际需求的模式,往往需要大量的基础业务数据和反复的尝试,分析出结果能否准确地反映公安机关的实际需求,也是重点和难点之一。


  2003年以来,公安部组织开展在城市出入口、主要道路和路口、公共复杂场所、易发案部位、重点要害单位、社区等安装电子报警和视频监控系统为主要内容的城市报警与监控系统建设,通过这些技防设备在保障重点地区安全工作中的使用,对稳定社会秩序起到了重要的作用,同时也积累了大量的原始数据。但是,在众多技防产品和设备中,哪一种技防设施的应用在哪一特定时间内、在哪一类型案件多发场所段所起的作用更大,目前,还没有一个可供参考的模式和规律可以借鉴。本文试图利用数据挖掘技术来建立技防产品与某种类型案件及多发场所的关联关系,以初步智能化的手段对技防工作的重点进行预测,使技防管理者能够有针对性地指导各地技防部门安装技防设施来预防某类案件的发生,为公安机关实现社会治安“全面控制、重点防范、快速反应、精确打击”的管理目标以及对技防工作的指导和决策提供依据。


  本文结合技防管理的工作内容,根据某技防系统数据集市的信息,运用数据挖掘技术不同的分析方法,构造数学模型来对样本数据进行分析比较,给出了通过构造不同的算法分析模型,如关联、分类的方法来对样本数据进行尝试性数据挖掘的思路和模式,并对于不同的分析方法带来不同的信息进行了分析和描述。



业务流程如图1.1所示:



  一、构建数据模型


  使用到数据源主要包括:地区背景资料,案发类型说明(刑事案件或治安案件)、案件发生过程记录、结案记录、技防产品安装使用记录。


  地区背景数据是属于静态数据,记录了各种形式的地区的背景信息,相对来说是较为稳定的,主要数据结构如下:

  表1.1  地区背景资料

 
  案件发生记录:属流水信息,直接从事务处理库中提取,记录各省市县在安装技防产品后发生的各类案件,包括破获的与未破获的,其主要变量说明如下:

 

  表1.2  案件发生记录



  表1.3  案件类别名称


  表1.4  案发场所


  技防器材使用记录:这部分的数据描述的是各种技防器材在案发地区的使用记录,又称“地区-器材关系表”,其主要相关内容如下:
 

        表1.5  技防产品使用记录



  表1.6  技防产品名称


  根据数据情况和建模要求,在经过数据的预处理、清洗、转换和修正后,建立样本数据。


  二、分类方法在技防管理中的应用


  1、用决策树分类方法构造分析模型


  在分类方法中,数据挖掘算法的工作方法主要是通过分析已知分类信息的历史数据总结出一个预测模型。


  基于决策树的分类方法是指是在内部节点上选用一个属性进行分割,每个分支代表一个测试输出,叶子节点表示一个类分布。每一个叶子节点都有一个由各种变量取值组成的规则,每一个输入记录都可以根据该模型归类到一个叶子节点中。由于每一叶子节点描述了训练数据的一个特定子集,而训练数据集中的每一种情况恰好属于树上的一个终端节点,所以决策树展示的任一特定数据记录只有一种可能预测。在本课题中采用了判定树分类方法。


  2、 使用ID3算法建模


  通过分析样本数据,发现技防产品中的移动报警系统大多数都涉及到机动车盗窃案件。于是提取某地区在已侦破的机动车盗窃案件中涉及移动报警系统技防手段的全部信息,如表2.1所示。在本文中,我们通过建立决策树来分析机动车盗窃案件中案发地区、时间、地点和发案季节等属性对于移动报警系统防范效果的影响。


  表2.1  机动车盗窃案件统计表


  表2.2 是经过数据清理后的机动车盗窃信息的训练集。其中地区状态中的1代表市区,2代表城乡结合处。技防产品防范效果中A类代表该产品在侦破案件中起决定作用,B类代表起一定作用,C类代表未起作用。

 
  表2.2  移动报警系统作用于机动车辆盗窃案件的信息训练集


  将样本分成三个类c1,c2 ,c3 则s1=2452s2=653s3=273


  总计s=3378 按照基于信息熵的ID3算法公式,同时将“相同类型总计”考虑进去,可以得出:


  I(s1,s2,s3)=I(2452,653,273)=0.3355+0.4583+0.2933=1.087下一步,按公式计算每个属性的熵。先计算“地区状态”,对于“市区”:s11=2452s21=275s31=0


  I(s11,s21,s31)=0.1379+0.3378=0.4757


  对于“城乡结合处”:s12=0 s22=378  s32=273


  I(s12,s22,s32)=0.4554+0.5258=0.9812


  如果样本按“市区-城乡结合处”划分,那么期望信息为:


  E(“地区状态”)=2727/3378I(s11,s21,s31)+651/3378I(s12,s22,s32)=0.5731


  因此按这种划分的信息增益是:


  Gain(“地区状态”)=I (s1,s2,s3)- E(“地区状态”)=1.0871-0.5731=0.51399


  同理可以得出以下几个字段的信息增益:


  Gain“案发地点”=0.2001,Gain“居住人口性质”=0.1761,


  Gain“案发时间(白天晚上)”=0.3431


  这样,Gain“地区状态”最大,说明该属性对于数据分解为子类所起的作用最大,于是建立第一节点“地区状态”,并将样本分成两部分。然后对每一棵子树按照以上方法递归计算,最后得出的决策树如图2.1所示。


  图2.1  决策树

  在图2.1中从根到树叶每条路径创建一个规则,可以很清楚地看出在市区,白天,停车场地区容易涉机动车辆盗窃案,在3378件已侦破机动车辆盗窃案中,移动报警设备在2269起案件发挥了决定性的作用等分类知识。


  又如在已破获的机动车辆盗窃案发生在城市地区,白天、居民小区内, 移动报警设备在151起案件的侦破中起到了一定的作用;而在已侦破的发生在城乡结合部、流动人口密集的地区273件案件中,移动报警设备基本上都没发挥什么作用。这些知识对于警务决策是相当有帮助的。比如在白天对停车场地区的车辆加强管理,提高防范力度,比如在此多安置报警设备以及部署更多的警力等。

 
  三、关联方法在技防管理中的应用


  1、  使用关联分析规则建立模型


  数据库中的数据一般都存在着关联关系,也就是说,两个或多个变量的取值之间存在某种规律性。而采用关联分析的目的是找出数据库中隐藏的关联网,描述一组数据项目的密切度或关系。有时并不知道数据库中数据的关联是否存在精确的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有置信度,置信度级别度量了关联规则的强度。


  经过分析样本数据,我们可以看到针对技防产品与犯罪关系的预测属于关联分析范畴。在本研究中,我们使用关联规则来建立模型,来分析在同类型案件中,何种技防产品对侦破案件起的作用更大一些。


  2、 用Apriori算法建模及实验分析


  本文结合某一住宅小区发生的4起机动车盗窃的具体案例进行分析,该小区投入了5类技防措施,表3.1显示的数据是这些技防措施在这4起同类型案件中起到的实际作用。


  表3.1  某小区技防措施作用于机动车辆盗窃案件的信


  以下是用Apriori算法进行的分析步骤。在图3.1-图3.7中,数字代表在案件中起作用的技防措施的名称。1视频监控,2移动报警,3巡更,4停车管理,5出入口控制。
 


  若分析视频监控和移动报警设备两种技防措施在机动车盗窃案中所起的作用:从图中就可以看到:1à2的可信度为100%,2à1的可信度为50%,由此可得出以下知识,在视频监控措施发挥作用的情况下,移动报警措施100%发挥作用,而当移动报警措施发挥作用时,视频监控措施起到50%的作用。说明在预防小区车辆盗窃案中安装移动报警设备所起的作用会更大一些。


  对技防管理工作中数据挖掘的近一步思考


  以上分析可以看出,技防管理部门对于指导安装某种技防设施来降低地区案件的发生有着重要意义,同时也是公安警力部署的信息来源之一。我们可以根据某省治安状况、地理环境、可能发生的犯罪性质和规律,建立省内地区技防小区试点。对试点的小区技防工作相关安全防范活动的数据和信息进行收集、整理和分析,以此来衡量技防管理工作的适宜性和有效性。


  技防管理作为全国公安科技管理工作的重要组成部分,其工作内容和方法是大情报信息系统的战略情报的有益补充,它不但是技防管理部门指导安全技术防范行业发展的依据,而且可以大大提高公安机关发现和控制治安事件的能力,提升基层公安机关治安管理和服务社会的科技含量。


  数据挖掘的最终目的是辅助决策,因此挖掘出的“知识”应具有明确性和可操作性而不应仅仅是某些令人费解的模型和参数,而需要通过技术人员与行业专家的密切合作,将枯燥难懂的数字信息以人们熟悉的术语形式表达出来,使数据挖掘结果具有可操作性。因此,只有将数据挖掘过程融入到整个技防管理过程中,数据挖掘才能具有广阔的施展空间,才能发挥应有的潜质,才能最终真正辅助技防工作的科学与决策。


  参考文献:


  [1]数据挖掘技术,工业大学出版社  2003


  [2]数据挖掘应用平台及其关键技术研究 [博士论文] ,朱建秋.,上海复旦大学,2002


  [3]数据仓库与数据挖掘技术,陈京民等编着,电子工业出版社, 2002


  [4]智能决策支持系统实现技术 [专着] ,俞瑞钊,陈奇编着,浙江大学出版社, 2001

                          
        (公安部一所  周纪)

  
 

【想第一时间了解安防行业的重磅新闻吗?请立即关注中安网官方微信(微信号:cpscomcn)——安防行业第一人气微信,万千精彩,千万不要错过!!!

中安网官方微信

网友评论

共有0条评论  点击查看全部>>

所有评论仅代表网友观点,与本站无关。

24小时阅读排行

本周阅读排行

订阅邮件
安防速递

每天三个要闻,知晓行业关键

E 周 刊

一周事,一朝知

Email: