安防人上中安网!

关注我们  

安防网 >> 工程方案 >> 其他

智能视觉分析在视频监控领域中的技术浅析

2012-04-16 14:22:45 来源:CPS中安网 作者:孙敬 责任编辑: luocaocps 收藏本文
目前,智能视觉分析已广泛应用于视频监控领域。智能视频监控技术是建立在视频监控已经过第三代发展的基础上,为其加入智能视觉分析系统的新一轮技术变革。它相当于为普通监控设备加上了具有对观测到的事物进行分析和判断能力的大脑,拥有更强大的视频监控功能。它的出现为社会安全撑起一把更加严密、稳固的保护伞,以有效遏制影响秩序和安全的异常事件的发生。
行为分析主要涉及到三个方面的问题:运动目标检测、目标跟踪和行为识别。其系统结构如图1所示。


 
  1.运动目标检测


  运动目标检测就是从图像序列中将变化的目标物体从背景图像中提取出来,它包括:目标分割和目标分类两部分。这是行为分析系统的第一步也是最重要的一步,它是此后的目标跟踪和行为识别的关键信息源。目标分割的任务就是将视频序列中的所有运动目标所对应的区域准确提取出来;而目标分类则是从分割得到的多类运动目标中(例如,行人、汽车、转动的机器等)选取我们需要的目标(例如,行人)。


  常用的基于运动目标检测的目标分割方法有三种:光流法、帧差法、背景差分法。光流法在摄像机运动的条件下也能检测出独立的运动目标,然而多数光流法计算相当复杂,不利于实时计算;帧差法对于运动环境具有较强的自适应性,但一般不能提取出相关区域的所有像素点,在运动体中容易产生空洞现象;背景差分法适用于固定摄像机的情形,它先为背景图像建立背景模型,通过将当前图像帧与背景图像进行比较,确定出亮度变化较大的区域,即认为是前景区域。这种方法计算速度很快,可以获得完整的运动区域,但对于场景中光照和噪声比较敏感,在实际应用中需要采用一定的算法进行维护和更新背景模型,以适应环境的变化。图像序列中光线、阴影、遮挡和目标物体的像素的变化成为影响分割效果的最大障碍。一个理想的检测算法能够适应各种环境和条件,但事实上得到适用于各种环境的算法是非常困难的,因此,通常的做法是针对不同的应用条件和环境,选取不同的算法。


  在已经得到分割目标的基础之上对这些目标进行分类,进而对研究目标进行后续跟踪处理。分类过程中,首先需要对目标进行特征的提取,其主要存在纹理、灰度、边界、结构、变换域等不同类型的方法。然后对提取的特征进行分类,其方法有基于贝叶斯统计决策理论和判别函数等方法。其中判别函数的方法包括:统计学习理论支持向量机、人工神经网络等。另外,如果将后续的跟踪过程看作随机过程,那么需要在跟踪之前建立初始模型,对跟踪目标进行学习和训练,此时,目标的分类与跟踪融为同一个过程,因此,部分算法并没有单独的目标分类这一步骤。


  2. 目标跟踪


  和运动目标检测相比,目标跟踪属于较高层的视觉问题。但是在行为分析中,跟踪算法通常和运动分割有很大的相同之处。在时间域上的跟踪,即在后续帧上使用点、线或区域的特征匹配,也就是说,跟踪可以被看作根据位置、速度、尺度、形状、纹理或颜色等在帧与帧之间建立的图像特征的内在联系。其需要解决的问题主要有两个:目标建模和目标定位。


  建模主要用来收集描述目标的视觉特征,为以后定位目标提供信息。目前常用的特征有颜色特征、边缘特征、纹理特征、光流法、小波表达、局部区别特征描述算子等。颜色特征对于目标平面旋转、非刚性变形、部分遮挡等情形较为鲁棒,适合于变形目标跟踪。尽管颜色特征对变形和姿态变化很鲁棒,但是不能描述目标的空间结构,易受光照等外界条件的影响。边缘信息能弥补颜色信息的缺陷,不易受光照变化的影响。纹理是一种应用比较广泛的方法,例如,局部二值模式(LBP)其对光线等的变化有较好的鲁棒性,但其计算量较大难以满足实时性的要求。光流在跟踪领域是一种有效的特征,但在计算光流信息时,必须计算图像中每个像素点的速度和方向,所以计算量大同样很难满足实时性的要求。小波表达可以从不同尺度、不同方向描述图像,对于由粗到精的差分运动估计非常有效。局部区别特征描述子是指目标通过一组辨别特征描述算子表达,这些描述算子从局部区域的图像特征点产生,他们表达了局部区域对于尺度、旋转和光照的不变性,将这种特征描述算子嵌入到跟踪框架中,实现跟踪。


  目标定位是一个预测目标参数的过程,根据图像序列,确定目标在图像中的位置、形状参数。近年来,目标定位研究的主流方法是将目标定位转换为在贝叶斯滤波框架下求解目标状态后验概率密度的过程。在贝叶斯理论框架下,将目标跟踪问题看作最优估计过程,通常采用状态空间模型来描述,首先选择状态向量,通过状态转移方程进行预测,然后利用最新观测值对预测值做出修正。当过程噪声和观测噪声都是高斯分布,且状态转移方程和观测方程都是线性的,利用常规的Kalman滤波就能给出最优解。当状态方程和观测方式是非线性函数时,扩展Kalman滤波就可求解后验概率。如果状态空间是用有限的离散值组成,隐马尔科夫模型(Hidden Markov Models)可以实现。但是在实际场景中,状态方程和观测方程往往都是非线性的,而且噪声也是非高斯的、状态分布是多模态的,在这种情况下,通常利用粒子滤波的方法。


  3. 行为识别


  此处的行为是广义上的“行为”定义,它包括动作、行为和活动三个层面。动作是指人体的一个小的运动元素,如抬脚、落脚、甩臂等,而狭义上的行为是按时间有序排列在一起的动作的集合,例如跑步,走路等。而一系列狭义行为组成的序列称为活动,如打球等。其主要目的是对人体的运动进行了层次的划分,但划分并不是绝对的。对于行为(未加说明时指广义行为)的识别方法主要有两种:基于模板匹配的方法和状态空间模型的方法:


  模板匹配的方法首先将动态的图像序列转化为特征模型,然后与训练得到的各种行为模板进行匹配。其优点是计算复杂度较低且简单易行,但其对噪声和特征模型在时间和空间尺度上的轻微变化较为敏感,通常要加入模型演化的步骤。


  基于状态空间模型的方法是把每个静态动作定义为一个状态,使用特定概率生成这些状态之间的相互连接。所有的连续动作被看作是不同状态之间的转移。通过研究这些状态转移的概率,把联合概率作为动作分类的标准。但是,如何选择合适数量的状态和特征向量的维数仍是一个难点。


  以上是对人体行为分析主要技术点的概述,然而针对不同的应用需求,其具体算法也有所不同,具体分析如下:


  1)人员徘徊


  准确的徘徊行为是一个包含复杂动作的过程,识别难度较大。但是可以通过在预设区域内判定目标移动的距离、时间以及方向等来做出间接判断。由上述目标检测和跟踪可知,在对目标进行可靠跟踪的基础上,将目标在帧与帧之间的坐标距离进行累加即得到整个运动过程中的轨迹长度,以此可利用较简单的判断方式进行识别,但此方法鲁棒性较差,容易造成误判,可满足安全级别较低的场景中。当安全级别要求较高的情况下,可通过对徘徊行为训练和学习、建立模型,利用基于状态空间模型的方法来识别,可降低误判率,但其对训练样本的数量和多样性要求较高,训练过程复杂。


  2)物品遗留


  物品遗留一般是指由人携带物品进入目标区域,然后人员离开,物品遗留在目标区域。此种情况下可对进入目标区域的移动目标进行跟踪,当目标保持静止状态的时间超过预设阈值t0时,判定为遗留。由于遗留物品种类繁多,需要建立大量、多种类的样本库。另外,遗留物体突然出现、没有遗留过程(遗留过程被遮挡、不可见)时,以及当遗留物品不断被移动目标大面积遮挡时,上述算法并不适用,所以针对不同的应用场景需要不同的算法满足需求。


  

【想第一时间了解安防行业的重磅新闻吗?请立即关注中安网官方微信(微信号:cpscomcn)——安防行业第一人气微信,万千精彩,千万不要错过!!!

中安网官方微信

提示:试试"← →"实现快速翻页

网友评论

共有0条评论  点击查看全部>>

所有评论仅代表网友观点,与本站无关。

24小时阅读排行

本周阅读排行

订阅邮件
安防速递

每天三个要闻,知晓行业关键

E 周 刊

一周事,一朝知

Email: