视频信息的提取及处理

时间:2022-10-21 11:25:03 浏览量:

摘 要:将视频处理成相关数据,首先参考关键帧求取的方法将视频进行分割提取,然后进行图像灰色处理,减少图片信息量,再进行图像除噪,提高图片信息精准度,最后进行边缘提取,减少了需要处理的数据量。

关键词:关键帧提取;灰色处理;图像除噪;边缘提取

1.关键帧自动提取

视频镜头分割和关键帧提取是视频检索的核心。首先,通过结合直方图交集及非均匀分块加权的改进直方图方法,根据视频内容将视频分割为镜头;然后,利用基于像素的帧差法,对得到的检测镜头进行二次检测,优化检测结果;最后,在颜色空间的基础上,计算镜头内每帧的图像熵,从而确定关键帧序列。

基于关键帧的视频摘要是视频检索的有效手段,将选定的关键帧作为视频摘要[8]以帮助高效地认知和理解视频的基本内容。与原始视频相比,关键帧序列由于只是部分视频帧,因此所需的存储空间要小很多,从而减少了视频摘要的传输时间,提高了视频检索的效率。

(1)计算相邻两帧直方图的交集,并与设定阈值进行比较,以判断是否发生镜头变化。设定直方图相似度阈值的取值范围为0.75~0.95,并由大量实验得知当阈值设为0.9时,该方法综合效果最优。

(2)对于(1)所得结果,利用帧间灰度/颜色差值进行镜头边界的二次检测。结合非均匀分块加权(分为9块,中心部分所占比例最大,且权值和为1)的方法,计算每块像素差值并与预设的分块帧差阈值,作比较以进行标记;而后对每块的标记变量加权求和,并与设定的分块加权阈值进行比较,以判断是否发生镜头变化。

(3)考虑到强烈光照变化的情况,本文将帧数小于20的镜头划归到上一个镜头中。

(4)计算镜头内每帧的图像熵值,从每个镜头中提取综合图像熵最大的帧作为代表该镜头的关键帧。

熵值法提取的关键帧可以更好地代表视频内容,且关键帧分布也最为均匀。本文采用的综合法对直方图法中帧间差异的计算进行了一定的改进,结合了非均匀分块加权的思想,利用帧差法对所得结果进行了二次检测,并考虑到可能出现的强光对镜头检测的影响,在没有显著增加时间及计算复杂度的同时,使镜头的准确率有了一定程度的改进,从而提升了关键帧提取的精确性。从而为顺利进行后续的视频检索工作奠定了良好的基础。

2.灰度处理

将彩色图像转化成为灰度图像的过程称为图像的灰度化处理。彩色图像中的每个像素的颜色有R、G、B 三个分量决定,而每个分量有255个值可取,这样一个像素点可以有1600 多万的颜色的变化范围。而灰度图像是R、G、B 三个分量相同的一种特殊的彩色图像,其一个像素点的变化范围为255 种,所以在数字图像处理种一般先将各种格式的图像转变成灰度图像以使后续的图像的计算量变得少一些。灰度图像的描述仍然反映了整幅图像的整体和局部的色度和亮度等级的分布和特征。

灰度化原理。灰度图像矩阵元素的取值范围通常为[0,255]。因此其数据类型一般为8位无符号整数,这就是人们经常提到的256灰度图像。“0”表示纯黑色,“255”表示纯白色,中间的数字从小到大表示由黑到白的过渡色。

我们在对图像进行分析处理时,需要完成1)读取数字图像的基础数据2)对灰度值进行分析处理,完成图像变换与增强。

1)灰度值的读取。数字图像是在计算机中以矩形点阵形式存在的一个位图,像素作为数字图像中的基本元素。一副m×n大小的图像中,每个像素由具有不同明暗程度的灰度值所标识。若将白色的灰度值定义为 ,黑色灰度值定义为 ,由黑色到白色之间的会的均匀的划分为

个等级。彩色图像处理是通过对其三个单色图像分别处理得到的,要定位像素点,读取R、G、B的值,根据读取的值调整代码,并保存R、G、B的值

2)图像处理。若为彩色图像,则转换R、G、B值,计算灰度值gray,取r=g=b=gray;若为黑白图像,只需读取R分量的值,再进行灰度取反、灰度增强与灰度均衡化。

3.图像除噪

图像在数字化和传输过程中常受到成像设备和外部环境噪声干扰等影响,称为含噪图像或噪声图像。本文利用模糊数学理论,对于图像对比度的调整一般采用的都是调整图像颜色参与值来实现的。其中对于图像颜色值的调整只要是固定于某一范围内就一定会实现最终想要达到的效果。但是对于一些较为特殊的图像,比如灰度值较大的图像,在实现它的图像清晰度达到一定效果时,首先需要调节它的灰度边缘,既增加它的灰度值以实现对比清晰。这里介绍一个模糊边缘提取法实现图像灰度值提高的过程。假设一个灰度值为某一确定比例的图像,那么它在一定像素值内的灰度值也一定,就可以通过这一比例关系确定出它的灰度值范围,根据这一灰度值范围就可以计算出它的最大灰度值,因此就可以通过调整图像边缘灰度模糊值来实现图像对比度的调整了。

模糊数学理论在计算机图像处理中的应用,简化了计算机图像处理中的一些繁杂的图像调整或处理方法,还相应的提高了处理过后的图像的精准度,对后期图像应用等都有一定积极作用[1]。

4.边缘提取

如果某个像素点具有该像素点及其直接领域的灰度值呈现阶跃或屋顶变化这种属性,则此像素点被称为边缘点,而这些边缘点的集合构成了图像的边缘[2]。图像的边缘提取除去了非相关信息,保留了图像的重要结构特性,很大程度地减少需要处理的数据量。

本文采用一种基于数学形态学的图像边缘提取算法。数学形态学是基于形态结构元素对几何形状和结构属性进行分析和描述的数学方法,也是一种建立在几何代数和集合论基础上,通过非线性叠加来描述图像的非线性的处理系统[3]。数学形态学的基本思路是,通过使用一定形态的结构元素,度量在目标图像区域中的可放性和填充方法的有效性,并提取更为本质的图像形态结构相关特性信息,进而达到对目标图像分析和识别的目的。该理论可以剔除图像中不相关的形态结构属性,而保留基本的本质的形态结构属性,达到简化目标图像数据的目的。

数学形态学运算。数学形态学最基本的形态转换包括膨胀和腐蚀,它们能实现许多的功能,如滤波降噪、弥合目标图像中相邻的元素等。数学形态学也能实现寻找目标图像中的明显区块的极大值区域或极小值区域,以及求出目标图像的梯度 。

结构元素的选取。任何数学形态学算法都由两个基本问题组成:数学形态学运算和结构元素的选取[4]。数学形态学的定义使得数学形态学的运算规则已经确定不变,所以形态结构元素的选取决定了数学形态学算法的目的和效果。

形态结构元素的选取问题可以分为两个方面:结构元素的尺寸和形状。选择的结构元素的尺寸过小时,对于较大区域的凸起开运算不能有效地消除,而对于边缘断裂较大的情况闭运算不能有效地弥合;选择的结构元素的尺寸过大时,开运算会过度消除图像原本为边缘点的像素而造成假断裂,闭运算会过度弥合图像原本断裂的像素点而造成干扰信息。所以,采用单一尺寸的结构元素容易导致在对目标图像进行边缘提取时定位不够准确,去噪效果不理想。采用单一形态的结构元素在对目标图像进行边缘提取时不能够有效地保留图像边缘的细节信息。

最后通过Python软件编程,通过以上步骤可以将视频中信息转化为可用数据,经过对数据的分析整合,以方便使用。

参考文献

[1] 张伟.模糊数学理论在图像处理中的应用[J].计算机光盘软件与应用,2011.

[2] 罗山.基于改进数学形态学的含噪图像边缘检测[J].攀枝花学院学报,2013, 30(4):121-124.

[3] 朱培逸,刘红晴.基于数学形态学图像分割算法在水果分级中的应用[J].科学技术与工程,2013,34(13):10375-10379.

[4] 张黄群,于盛林,白银刚.形态学图像去噪中结构元素选取原则[J].计算机应用,2008,28(2),:477-478.

推荐访问:提取 视频 信息

最新推荐
猜你喜欢