当前位置：文档库 › 一种新的镜头边界检测算法

一种新的镜头边界检测算法

２００８年４月

第３５卷第２期

西安电子科技大学学报（自然科学版）

ＪＯＵＲＮＡＬｏＦＸＩＤＩＡＮＵＮＩＶＥＲＳＩＴＹ

Ａｐｒ．２００８

Ｖ０１．３５ＮＯ．２一种新的镜头边界检测算法

田玉敏，赵缙，吴自力

（西安电子科技大学计算机外部设备研究所，陕西西安７１００７１）

摘要：提出基于联合直方图的镜头边界检测算法，利用相邻帧帧阊联合直方图关于对角线的对称度在

同一镜头内很高，而在镜头切换处很低的特性，定义相邻帧的相似度，通过对相似度做差分突出切变特

征，同时引入有限自动机提高渐变检测的鲁棒性，并将切变和渐变检测紧密结合，获得了较好的检测效

果．对多辩类型的视频序列进行测试的实验结果表明，检测结果达到了９５．６％的查全率和９５．８％的查

准率．

关键词：视频检索；镜头边界检测；联合直方图，切交，渐变

中图分类号：ＴＰ３９１文献标识码：Ａ文章编号：１００１—２４００（２００８）０２—０２８８—０５

Ｓｈｏｔｂｏｕｎｄａｒｙｄｅｔｅｃｔｉｏｎａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｃｏ－ｈｉｓｔｏｇｒａｍ

ＴｍＮＹｕ－ｍｉｎ。ＺＨＡ０Ｊｉｎ，ＷＵＺｉ－ｌｉ

（ＲｅｓｅａｒｃｈＩｎｓｔ．ｏｆＣｏｍｐｕｔｅｒＰｅｒｉｐｈｅｒａｌｓ，ＸｉｄｉａｎＵｎｉｖ．，Ｘｉ’ａｎ７１００７１，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：Ａｎｅｗａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｔｈｅｃｏ－ｈｉｓｔｏｇｒａｍｂｅｔｗｅｅｎｔｗｏｃｏｎｓｅｃｕｔｉｖｅｆｒａｍｅｓｉｓｐｒｅｓｅｎｔｅｄ。Ｉｎ

ｔｈｅａｌｇｏｒｉｔｈｍ，ｔｈｅｓｉｍｉｌａｒｉｔｙｉｓｄｅｆｉｎｅｄｂａｓｅｄｏｎｔｈｅｃｏ－ｈｉｓｔｏｇｒａｍｓｙｍｍｅｔｒｙｗｈｉｃｈｉｓｈｉｇｈｉｎｔｈｅｓａｍｅ

ｓｈｏｔ。ｂｕｔｌＯＷｉｎａｓｈｏｔｔｒａｎｓｉｔｉｏｎ．Ｔｈｅｓｉｍｉｌａｒｉｔｙｅｆｆｅｃｔｉｖｅｌｙｒｅｖｅａｌｓｔｈｅｔｒａｎｓｉｔｉｏｎｃｈａｒａｃｔｅｒｉｓｔｉｃｓ．Ｔｈｅ

ｄｉｆｆｅｒｅｎｃｅｏｆｓｉｍｉｌａｒｉｔｉｅｓｉｓｕｓｅｄｔｏｅｎｈａｎｃｅｔｈｅａｂｒｕｐｔｔｒａｎｓｉｔｉｏｎｆｅａｔｕｒｅｓ，ａｎｄａＦｉｎｉｔｅ－ＳｔａｔｅＡｕｔｏｍａｔａｉｓ

ｕｓｅｄｔＯｉｍｐｒｏｖｅｔｈｅｒｏｂｕｓｔｎｅｓｓｉｎｄｅｔｅｃｔｉｎｇｇｒａｄｕａｌｔｒａｎｓｉｔｉｏｎ．Ｅｘｐｅｒｉｍｅｎｔｓｔｅｓｔｉｎｇｖａｒｉｏｕｓｖｉｄｅｏｓｓｈｏｗ

ｔｈａｔｔｈｅａｌｇｏｒｉｔｈｍａｃｈｉｅｖｅｓａｐｅｒｆｏｒｍａｎｃｅｗｉｔｈ９５．６％ｒｅｃａｌｌａｎｄ９５．８％ｐｒｅｃｉｓｉｏｎ．

ＫｅｙＷｏｒｄｓ；ｖｉｄｅｏｒｅｔｒｉｅｖａｌ｝ｓｈｏｔｂｏｕｎｄａｒｙｄｅｔｅｃｔｉｏｎｃｏ－ｈｉｓｔｏｇｒａｍ；ａｂｒｕｐｔｔｒａｎｓｉｔｉｏｎ；ｇｒａｄｕａｌｔｒａｎｓｉｔｉｏｎ

视频数据具有数据量大的特点，对其进行有效的组织、管理和检索比较困难．但是视频数据具有一定的结构，即一段视频自顶向下分为视频、场景、镜头和帧，因此可以在这样的结构上对视频进行分析、组织和检索．镜头指的是摄像机在一个连续的时间和空间中拍摄得到的视频序列，它由相邻的若干帧组成，是视频序列的基本元素．镜头边界检测是场景边界检测必不可少的第一步，因为场景转换几乎总是发生在镜头边界处［１。．同时镜头边界检测也是提取关键帧的前提，可以方便地作为视频浏览的跳越点．因此，镜头边界检测是视频内容分析和基于内容的视频检索的重要基础．

视频序列中，镜头的边界分为两大类：切变（ａｂｒｕｐｔｔｒａｎｓｉｔｉｏｎ）和渐变（ｇｒａｄｕａｌｔｒａｎｓｉｔｉｏｎ）．切变是指变化突然发生在连续的两帧之间，而渐变是指变化发生在连续的多帧之间．渐变比较复杂，包括淡人淡出、溶解和擦除等．目前，国内外研究者提出了多种不同的镜头边界检测方法．如计算相邻帧对应位置的像素差［２］，该方法最简单，但是对运动很敏感．相比而言，基于直方图差的算法对运动较不敏感，因此得到了广泛的应用‘２￣‘］．基于边缘信息的方法［５］利用镜头切换处边缘的不同模式特征检测镜头边界，对于噪声鲁棒性差，而且运算量较大．由于视频多用压缩格式存储，所以有很多方法直接在压缩域检测，如利用ＤＣ系数法［６］和宏块（ＭＢ）法‘７３等．目前为止，尽管有这么多的方法取得了较好的效果，但却没有一种鲁棒性较好的方法可以应用于多样的视频序列并取得好的效果¨Ｊ．

笔者提出了一种基于联合直方图（ｃｏ－ｈｉｓｔｏｇｒａｍ）的镜头边界检测方法．联合直方图¨１是关于两幅图像的

收稿日期：２００７－０６—２５

基金项目：陕西省自然科学基金资助项目（２００６Ｆ４８）

作者简介：田玉敏（１９６４一）。女，教授，Ｅ－ｍａｉｌ：ｙｍｔｉａｎ（鱼ｍａｉｌ．ｘｉｄｉａｎ．ｅｄｕ．ｃ皿

第２期田玉敏等：一种新的镜头边界检测算法２８９

一种二维联合概率分布，与计算帧间差的方法相比，联合直方图的对称度能够更好地利用帧间信息反映镜头的边界特征．对于切变，相邻帧亮度或颜色突然变化，联合直方图的对称度也突然变化；对于渐变，相邻帧的亮度或颜色缓慢变化，联合直方图的对称度也缓慢变化；而对于镜头运动，联合直方图的对称度不敏感，可以较好地区别渐变和运动．

１基于帧问联合直方图的镜头边界检测

１．１联合直方图与特征提取

设两幅图像ｆ（ｘ，ｙ）和ｇ（ｘ，ｙ），其大小为Ｗ×Ｌ，单位为像素．定义像素值对（户，ｇ）的联合概率为

Ｉ广１Ｗ一１

Ｐ～（户，ｑ）＝∑∑３（ｆ（ｘ，ｙ），户）?艿（ｇ（ｚ，ｙ），ｑ）／（Ｗ?Ｌ），（１）其中ｄ（口，６）是克罗内克（Ｋｒｏｎｅｃｋｅｒ）函数

艿（口，６）一｛１’口２ｂ’（２）

【０，口≠ｂ．，

根据式（１），对所有像素值对（ｐ，口）求Ｐ，．。（ｐ，ｇ）值，便可得到两幅图像ｆ（ｘ，ｙ）和ｇ（ｘ，ｙ）的联合直方图．从一段视频中随机截取几帧图像，计算出它们的联合直方图如图１．

（?）同一帧（ｂ）相邻帻（同一蕾头）（ｃ）相邻帧（不同薯哭）

图１图像间的联合直方图

从图１中联合直方图沿对角线的分布可以看出，同一帧图像的宽度很窄，严格地分布在对角线上，而不同图像的宽度较宽，尤其是图１（ｃ）的分布非常宽．

为利用联合直方图明确地描述图像间的相似性，这里引入了联合直方图对称度．倘若联合直方图绝对对称，那么两幅图像完全相同；倘若联合直方图接近对称，那么两幅图像一定相似．反之亦然．也就是说，联合直方图的对称度反映的就是图像间的相似度．这里定义联合直方图对称度为

口芝：Ｐ｝．。（ｐ，ｐ）＋芝ｊｐＰ，ｔ。（夕，ｑ）Ｐ，＇。（ｑ，ｐ）

小＾∥。—忑河万者砭万历万一’∞’

ｐ’，ｑ

其中Ｏｔ为大于０的常量，是联合直方图对角线上像素的权重．卢一（夕一口）“，是远离对角线元素的权重，其中咒为整数．为突出图像间的差异，ａ赋较小值，而卢赋较大值．文中取口＝１／８，行＝２，所以像素对距离对角线越远，卢值越大．而Ｈ越接近１（Ｈ∈（ｏ，１３），联合直方图越对称，图像越相似．Ｈ不同于其他视频分析所用的特征，它定量地刻画了图像帧间的相似性，使得联合直方图在视频分析中的意义更易理解．对视频序列Ｖ一｛，１，厂２，…，Ｌ），在ＲＧＢ颜色空间上定义相邻帧的相似度Ｓ．将相邻帧图像的Ｒ，Ｇ，Ｂ３维均量化为８个等级，求各维的联合直方图和各自的对称度，然后取平均值（参见式（４））．对于帧＾，厶。，Ｈ。（＾，＾。），ＨＧ（＾，Ａ，）和ＨＢ（工，．■。）分别表示Ｒ，Ｇ，Ｂ３维的联合直方图的对称度，可以分别由式（３）计算得到．

２９０西安电子科技大学学报（自然科学版）第３５豢

ｓ（ｉ）＝（Ｈ曰（＾，ｆ／＋１）＋ＨＧ（＾，Ａ。）＋ＨＢ（＾，ｆ．－１））／３

，（４）显然，ｓ（ｉ）∈（ｏ，１３．发生镜头切换（包括切变和渐变）时，Ｓ的值较小．选取一段包括切变和渐变的视频片

段，利用式（４）得到帧间相似度，如图２所示．。１

警

０臣交啊”＿１甲—”。’１，州切交淅变

切变切交切交

横图２相邻帧帧问相似度

由图２可以看出，镜头内的相似度较大，接近１，而当镜头发生切换时，相似度发生明显变化，即值较小．而且，这样定义的相似度对镜头运动不敏感．图２中９００～１２５０帧和１４４０～１６００帧这两段视频中存在镜头运动，但是其相似度仍然保持较大．

１．２自动阈值选取

得到帧间相似度后，可以采用阈值法判断某处是否存在镜头切换，一般而言，相比固定阈值，自适应地选取阈值能够利用帧间相似度的相对大小判断是否发生了切换，从而提高算法的检测性能．这里采用矩保持聚类算法ｎｏ］在一定范围内自适应地选取阈值．矩保持聚类算法可以对样本数据实现多阈值分割，而这里只需要把视频分为镜头内帧和镜头切换帧，故只需一个阈值，实现二值分割．具体方法是：首先将帧间相似度均匀量化为１００个等级，求这１００个等级上的归一化直方图，再用该直方图计算１～３阶矩（不需计算零阶矩，因为其值等于１），将结果代入到矩保持方程组得到分割样本数据的阈值Ｔ．

１．３切变和渐变检测

为检测切变，定义差分相似系数Ｄ为

踟）：Ｐ＋１卜ｓ“ｈ曼ｊ．“卜ｓ“）≥０’（５）

１０，兵他．

，显然，由式（４）所得的帧间相似度只能反映两帧之间亮度或颜色变化量，而Ｄ可以反映亮度或颜色的变化率，更明显地突出切变特征．差分的结果使得切变更为明显，但在明显削弱运动等噪声的同时，也削弱渐变特征，因此，差分法只能用于切变检测．

为了尽可能地不遗漏切变边界，在通过矩保持聚类算法自适应地得到阈值Ｔ之后，设定系数ｙ（Ｏ≤ｙ＜１），定义切变阈值

Ｔ．ｂ。。＝Ｔ＋ｙＸ（１一Ｔ）．（６）Ｄ小于Ｔ曲。。的镜头边界为潜在切变边界，记为ｎ呻。“．利用阈值ｋ难免会把噪声（如目标物与摄像机的

运动等）和一些渐变误判为切变．切变和运动的区别在于，切变在连续两帧间发生变化，而运动往往持续多帧，因而可以利用这一特性消除运动噪声．对于０～叫中的每一位置Ｐ，选择一个窗口Ｗ。（５≤Ｗ。≤ｌＯ），分别求Ｐ帧与Ｐ＋ｉ帧的相似度Ｓ。，其中ｉ＝１，２，…，矾．对于切变，Ｓ；的数据较为平稳，而对于噪声，Ｓｉ的数据不平稳，从而可以区别切变和运动．在检测过程当中，分别设定一个较严格的平稳检测条件Ｃｒ和不是很严格的平稳检测条件Ｃ，．满足Ｃ，的加入完全可信赖的镜头切变集ｎ。中，满足Ｃ，的加入可能的镜头切变集力却中．

对于渐变检测，一个经典的算法是双阈值法瞳】．双阈值法通过两个阈值Ｔ＾（较大的阈值）和Ｔｌ（较小的阈值）判断切变和渐变．然而，渐变通常是一个较为平缓的过程，难免会出现帧间差异度很小的帧．当这些帧间差小于阈值时，按照以往的方法，如双阈值法，就会终止渐变过程，造成误判．为描述这一问题，在渐变过程中引入了容忍度的概念．如果一个渐变过程允许出现最多Ｎ个帧间差很小的渐变帧，则称Ｎ为渐变检测的容忍度．在这一概念上，文献［４３提出了一种基于有限自动机的渐变检测方法．笔者对该方法做了一些改进，应用于镜头的渐变检测．

第２期田玉敏等：一种新的镜头边界检测算法２９１

为检测渐变镜头，首先，对式（４）做修正，定义相邻多帧的相似度ＳＭ为

ｓＭ（ｉ）一（ＨＲ（＾，＾）＋ＨＧ（＾，＾。）＋Ｈｅ（＾，厶。））／３，（７）其中五一般取３～７之间的一个整数，这里是一４．因为在同一镜头内，无论是相邻帧还是非相邻帧镜头内容的变化都不是很大，而当渐变发生时，该过程较为平缓，相邻帧内容的变化相对较小，但渐变毕竟是镜头从一个镜头向另一个镜头转换，所以相邻多帧的内容变化就比较大，相似度就会减小，使得渐变过程更为明显．其次。构建一个由０和１组成的序列．通过式（８）计算Ｔ｜捌。．，Ａ的取值一般大于式（６）中的ｙ．如果ＳＭ小于ＴＩ刚“，序列相应位置１，否则置０．

Ｔ：ｒ｜ｄ一＝Ｔ＋．：Ｉ×（１一Ｔ），０≤．：Ｉ＜１．（８）最后，构造容忍度为３的有限自动机，见图３．其中，０－１序列为输入，ＳＴＡＲＴ为初始状态，ＥＮＤ为结束状态．每一次到达ＳＴＡＲＴ状态时，标记该位置为渐变开始位置．当连续出现４个较小的帧间相似度时（输入为１）进入ＰＲＥ４状态．此后，有限自动机可以容忍连续出现３个帧间相似度较大的帧（输入为ｏ）．当到达ＥＮＤ状态时，标记此位置为渐变结束位置，一个渐变检测过程结束，将检测到的渐变加入到一个可能的渐变集合０俺中．这样构造的有限自动机具有多个复杂意义的状态，允许渐变中连续出现３个变化平缓的帧，从而提高了渐变检测的鲁棒性．

图３有限自动状态机的状态图

１．４镜头检测算法

设一段长度为Ｎ帧的视频序列Ｖ＝｛ｆｌ，厂２，…，工），输出为切变集ｎ．ｂｆＩＩｐ。和渐变集０。ｒｔａ叫，设定一个窗口，长度为Ⅳ，这里Ｗ＝８００，Ｎ≥Ｗ，当前位置为ｔ，基于帧问联合直方图的镜头检测算法描述如下：（１）对视频序列Ｖ，通过式（４）和式（７）计算窗口内的帧间相似度Ｓ（ｉ）和Ｓ＾ｆ（ｉ），ｉ一１，２，…，Ⅳ．然后对Ｓ（ｉ）和ＳＭ（ｉ）通过矩聚保持聚类算法及式（６）和式（８）分别求得切变阈值ＴＩ。。叶和渐变阈值Ｌ利叫．（２）由式（５）计算Ｄ（ｉ），由小于ｋ的Ｄ（ｉ）生成潜在切变镜头集合ｎ一“，根据平稳条件Ｃ，和Ｃ，分

别生成０。和ｎ坤．由大于Ｔｇｒ｜ｄ“的ＳＭ（ｉ），生成０－１序列，输入有限自动机，生成可能的渐变镜头帧集合力衄．（３）如果发生切换的位置同时出现在ｎ卢和０船中，把这些位置从０坤中删除；如果发生切换的位置同时出现在ｎ。和０坶中，把这些位置从０衄中删除．这里，“同时出现”指的是切变位置处在一段渐变过程中．接着，把０。和ｎ坤加入０。岬中，并清空ｎ。和ｎ加，把ｎ俺加入ｎ。ｒ－ａＩ＿Ｉｌ，并清空ｎ俺．

（４）窗口向前滑动Ｗ宽度，即ｔ＝ｔ＋Ｗ．如果ｔ＜Ｎ，转步骤（１）；否则，设定窗口范围为Ｎ—ｗ到Ｎ，依次执行步骤（１）～（３），然后转（５）．

（５）删除ｎ．脚中重复的切变位置；合并Ｄ州一．－－中相互重叠的渐变位置，算法结束．

此时，ｎ。ｈｍ中的结果就是切变位置，而ｎ州－一－－中的结果标记了渐变的起始和终止位置，明确地指定了渐变的整个过程．

２实验结果与分析

为验证算法的检测性能，实验数据采用了包括电影、综艺科教、体育和新闻等多种视频，共计６５３２１帧，详见表１．这些视频含有摄像机的推拉和平移，也有目标的运动，以及淡人淡出、溶解、擦除和翻转等多种类型的渐变．为评估文中的边界检测方法，采用了标准的查全率（ｒｅｃａｌｌ）和查准率（ｐｒｅｃｉｓｉｏｎ）［１１．为进一步评估

２９２西安电子科技大学学报（自然科学版）第３５卷

检测效果，还增加了一种将查全率和查准率结合起来的评估参数（Ｒ）［１１］．该参数的优点在于当查全率和查准率均取值较高时，它的取值才较高．

表１实验视频信息

实验结果与双阈值比较法‘２３进行了对比，结果见表２和表３．

表２镜头切变检测实验结果

表３镜头边界检测评估结果

由表２和表３可以看出，对于每一测试视频序列中的切变和渐变，文中算法整体上均优于双阈值比较法，体现出了较高的鲁棒性．其中，切变中出现的误检，一部分原因是视频中前后两帧亮度突然变化，这是由视频编辑所引起的；另一部分原因是出现了较大块局部内容的改变．漏检则主要是因为相邻两帧具有相似的颜色空间分布．

渐变中的误检主要是由摄像机和目标快速运动造成，致使查准率下降．而漏检是因为渐变前后两个镜头具有相似的特征，使得帧间相似度很大，造成了漏检．在测试集上，文中算法总的查全率和查准率分别达到了９５．６％和９５．８％，综合检测达到了９５．７％．

３结束语

笔者提出了一种基于相邻帧帧间联合直方图的镜头边界检测算法．该算法利用帧间联合直方图的对称度定义帧间相似度，用相邻帧相似度的差分检测切变，用相邻多帧相似度和有限自动机检测渐变，并将二者的检测过程统一进行．该相似度具有对运动不敏感的特点，可以较好地区分渐变和镜头运动．实验表明，该算法优于常用的双阈值比较法，不仅能以很高的精度检测切变，而且能够克服渐变中帧间差别很小的帧的影响，有效地检测出包括淡入淡出、溶解、擦除和翻转等多种类型的渐变，提高了渐变检测的鲁棒性．

参考文献：

［１］ＣｏｔｓａｃｅｓＣ．ＮｉｋｏｌａｉｄｉｓＮ，ＰｉｔａｓＬＶｉｄｅｏＳｈｏｔＤｅｔｅｃｔｉｏｎａｎｄＣｏｎｄｅｎｓｅｄ

Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ：ａＲｅｖｉｅｗＣＪ］．ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＭａｇａｚｉｎｅ，ＩＥＥＥ，２００６。２３（２）：２８—３７．

（下转第３０４页）

３０４西安电子科技大学学报（自然科学版）第３５卷ＯＯ．ｔｘｔ．

［２３ＢａｒｒｅｒｅＦ．Ｂｅｎｚｅｋｒｉ九ＡＭｕｌｔｉ－ｄｏｍａｉｎＳｅｃｕｒｉｔｙＰｏｌｉｃｙＤｉｓｔｒｉｂｕｔｉｏｎＡｒｃｈｉｔｅｃｔｕｒｅｆｏｒＤｙｎａｍｉｃＩＰＢａｓｅｄＶＰＮＭａｎａｇｅｍｅｎｔ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓＴｈｉｒｄＩｎｔｅｒｎａｔｉｏｎａｌＷｏｒｋｓｈｏｐｏｎＰｏｌｉｃｉｅｓｆｏｒＤｉｓｔｒｉｂｕｔｅｄＳｙｓｔｅｍｓａｎｄＮｅｔｗｏｒｋｓ．ＷａｓｈｉｎｇｔｏｎｚＩＥＥＥ，２００２：２２４－２２７．

［３］ＳａｎｃｈｅｚＬＡ，ＣｏｎｄｅｌｌＭＮ，ＳｅｃｕｒｉｔｙＰｏｌｉｃｙＰｒｏｔｏｃｏｌ［ＥＢ／ＯＬ］．［２００８—０３—０３］．ｈｔｔｐ：／／ｗｗｗ．ｉｅｔｆ．ｏｒｇ／ｐｒｏｃｅｅｄｉｎｇｓ／ｏｏｄｅｃ／Ｉ－Ｄ／ｄｒａｆｔ－ｉｅｔｆ－ｉｐｓｐ－ｓｐｐ．ｔｘｔ＞．

［４３ＣｈａｒｔＫ，ＤｕｒｈａｍＤ，ＧａｉＳ，ｅｔａ１．ＣＯＰＳＵｓａｇｅｆｏｒＰｏｌｉｃｙＰｒｏｖｉｓｉｏｎｉｎｇ（ＣＯＰＳ－ＰＲ）［Ｓ］．ＩＥＴＦ，２００１．

［５］ＭａｔｔＢ，ＪｏｈｎＩ．ＴｒｕｓｔＭａｎａｇｅｍｅｎｔｆｏｒＩＰｓｅｃ［Ｊ］．ＡＣＭＴｒａｎｓｏｎＩｎｆｏｒｍａｔｉｏｎａｎｄＳｙｓｔｅｍＳｅｃｕｒｉｔｙ，２００２，５（２）：９５－１１８．［６３ＣｏｎｄｅｌｌＭ。ＬｙｎｎＣ．ＳｅｃｕｒｉｔｙＰｏｌｉｃｙＳｐｅｃｉｆｉｃａｔｉｏｎＬａｎｇｕａｇｅ［ＥＢ／ＯＬ］．［２００８—０３一０３］．ｈｔｔｐ：／／ｗｗｗ．ｉｅｔｆ．ｏｒｇ／ｐｒｏｃｅｅｄｉｎｇｓ／ｏｏｊｕｌ／Ｉ－Ｄ／ｉｐｓｐ－ｓｐｓｌ－００．ｔｘｔ．

［７］周贤伟，薛楠．ＩＰＳｅｃ解析［Ｍ］．北京：国防工业出版社，２００６：１１７—１２２．

［８］张新，常义林，沈中，等．分层多管理者网络故障监控策略［Ｊ］．西安电子科技大学学报，２００５，３２（６）：８７３—８７６．ＺｈａｎｇＸｉｎ，ＣｈａｎｇＹｉｌｉｎ，ＳｈｅｎＺｈｏｎｇ，ｅｔａ１．ＦａｕｌｔＭｏｎｉｔｏｒｉｎｇＰｏｌｉｃｙｆｏｒａＨｉｅｒａｒｃｈｉｃａｌＮｅｔｗｏｒｋｗｉｔｈａＭｕｌｔｉ－ｍａｎａｇｅｒ［Ｊ］．ＪｏｕｒｎａｌｏｆＸｉｄｉａｎＵｎｉｖｅｒｓｉｔｙ，２００５，３２（６）：８７３—８７６．

（编辑；高西全）

（上接第２９２页）

［２］ＺｈａｎｇＨｏｎｇｊｉａｎｇ，ＫａｎｋａｎｈａｌｌｉＡ，ＳｍｏｌｉａｒＳＷ．ＡｕｔｏｍａｔｉｃＰａｒｔｉｔｉｏｎｉｎｇｏｆＦｕｌｌ—ｍｏｔｉｏｎＶｉｄｅｏ口］．ＭｕｌｔｉｍｅｄｉａＳｙｓｔｅｍｓ．１９９３，１（１）ｌ１０－２８．

［３］Ｃｅｒｎｅｋｏｖａｚ，ＫｏｔｒｏｐｏｕｌｏｓＣ，ＰｉｔａｓＩ．ＶｉｄｅｏＳｈｏｔＳｅｇｍｅｎｔａｔｉｏｎＵｓｉｎｇＳｉｎｇｕｌａｒＶａｌｕｅＤｅｃｏｍｐｏｓｉｔｉｏｎ［Ｃ－］／／ＰｒｏｃＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，ＳｐｅｅｃｈａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ．ＨｏｎｇＫｏｎｇ：ＩＥＥＥ。２００３：３０１—３０４．

［４］佟子健，袁进辉，郑武杰，等．一种基于有限自动机的渐变镜头检测算法［Ｊ］．计算机科学，２００６，３３（１）ｔ２５２—２５４．ＴｏｎｇＺｉｊｉａｎ，ＹｕａｎＪｉｎｈｕｉ，ＺｈｅｎｇＷｕｊｉｅ，ｅｔａ１．ＡＮｅｗＡｐｐｒｏａｃｈｆｏｒＧｒａｄｕａｌＴｒａｎｓｉｔｉｏｎＰｅｔｅｃｔｉｏｎＢａｓｅｄｏｎＦｉｎｉｔｅ－ｓｔａｔｅＡｕｔｏｍａｔａ［Ｊ］．ＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ，２００６，３３（１）：２５２—２５４．

［５］ＺａｂｉｈＲ，ＭｉｌｌｅｒＪ，ＭａｉＫ．ＡＦｅａｔｕｒｅ－ｂａｓｅｄＡｌｇｏｒｉｔｈｍｆｏｒＤｅｔｅｃｔｉｎｇａｎｄＣｌａｓｓｉｆｙｉｎｇＰｒｏｄｕｃｔｉｏｎＥｆｆｅｃｔｓ口］．ＭｕｌｔｉｍｅｄｉａＳｙｓｔｅｍｓ，１９９９，７（２）：１１９—１２８．

［６］ＹｅｏＢ，ＬｉｕＢ．ＲａｐｉｄＳｃｅｎｅｏｎＡｎａｌｙｓｉｓｏｎＣｏｍｐｒｅｓｓｅｄＶｉｄｅｏ口］．ＩＥＥＥＴｒａｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ。１９９５，５（６）：５３３—５４４．

［７］ＰｅｉＳＣ，ＣｈｏｕＹＺ．ＥｆｆｅｃｔｉｖｅＷｉｐｅＤｅｔｅｃｔｉｏｎｉｎＭＰＥＧＣｏｍｐｒｅｓｓｅｄＶｉｄｅｏＵｓｉｎｇＭａｃｒｏＢｌｏｃｋＴｙｐｅＩｎｆｏｒｍａｔｉｏｎ［刀．ＩＥＥＥＴｒａｎｓｏｎＭｕｈｉｍｅｄｉａ，２００２，４（３）：３０９－３１９．．

［８］ＨａｎｊａｌｉｃＡ．ＳｈｏｔＢｏｕｎｄａｒｙＤｅｔｅｃｔｉｏｎ：ＵｎｒａｖｅｌｅｄａｎｄＲｅｓｏｌｖｅｄ［Ｊ］．ＩＥＥＥＴｒａｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２００２，１２（２）：９０－１０５．

［９］ＨａｏＰｅｎｇｗｅｉ，ＳｈｉＱｉｎｇｙｕｎ，ＣｈｅｎＹｉｎｇ．Ｃｏ－ｈｉｓｔｏｇｒａｍａｎｄＩｔｓＡｐｐｌｉｃａｔｉｏｎｉｎＲｅｍｏｔｅＳｅｎｓｉｎｇＩｍａｇｅＣｏｍｐｒｅｓｓｉｏｎＥｖａｌｕａｔｉｏｎ［Ｃ］／／ＰｒｏｃＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｍａｇｅＰｒｏｃｅｓｓｉｎｇ（ＩＣＩＰ）．Ｂａｒｃｅｌｏｎａ：ＩＥＥＥ，２００３：１７７－１８０．

［１０］ＴｓａｉＷ．Ｍｏｍｅｎｔ－ｐｒｅｓｅｒｖｉｎｇＴｈｒｅｓｈｏｌｄ．ａＮｅｗＡｐｐｒｏａｃｈ［Ｊ］．ＣｏｍｐｕｔｅｒＶｉｓｉｏｎ，Ｇｒａｐｈｉｃｓ，ａｎｄＩｍａｇｅＰｒｏｃｅｓｓｉｎｇ，１９８５，２９（３）：３７７—３９３．

［１１］ＱｉＹａｎｊｕｎ。ＨａｕｐｔｍａｎｎＡ，ＬｉｕＴｉｎｇ．ＳｕｐｅｒｖｉｓｅｄＣｌａｓｓｉｆｉｃａｔｉｏｎｆｏｒＶｉｄｅｏＳｈｏｔＳｅｇｍｅｎｔａｔｉｏｎ［Ｃ］／／ＰｒｏｃＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＭｕｌｔｉｍｅｄｉａ＆Ｅｘｐｒｏ（ＩＣＭＥ’０３）．Ｂａｌｔｉｍｏｒｅ：ＩＥＥＥ，２００３：６８９—６９２．

（编辑：齐淑娟）

一种新的镜头边界检测算法

作者：田玉敏，赵缙，吴自力， TIAN Yu-min， ZHAO Jin， WU Zi-li

作者单位：西安电子科技大学,计算机外部设备研究所,陕西,西安,710071

刊名：

西安电子科技大学学报（自然科学版）

英文刊名：JOURNAL OF XIDIAN UNIVERSITY(NATURAL SCIENCE)

年，卷(期)：2008，35(2)

被引用次数：0次

参考文献(11条)

1.Cotsaces C.Nikolaidis N.Pitas I Video Shot Detection and Condensed Representation:a Review

2006(02)

2.Zhang Hongjiang.Kankanhalli A.Smoliar S W Automatic Partitioning of Full-motion Video 1993(01)

3.Cernekova Z.Kotropoulos C.Pitas I Video Shot Segmentation Using Singular Value Decomposition 2003

4.佟子健.袁进辉.郑武杰一种基于有限自动机的渐变镜头检测算法[期刊论文]-计算机科学 2006(01)

5.Zabih https://www.wendangku.net/doc/9b5884594.html,ler J.Mai K A Feature-based Algorithm for Detecting and Classifying Production Effects 1999(02)

6.Yeo B.Liu B Rapid Scene on Analysis on Compressed Video 1995(06)

7.Pei S C.Chou Y Z Effective Wipe Detection in MPEG Compressed Video Using Macro Block Type Information 2002(03)

8.Hanjalic A Shot Boundary Detection:Unraveled and Resolved 2002(02)

9.Hao Pengwei.Shi Qingyun.Chen Ying Co-histogram and Its Application in Remote Sensing Image Compression Evaluation 2003

10.Tsai W Moment-preserving Threshold:a New Approach 1985(03)

11.Qi Yanjun.Hauptmann A.Liu Ting Supervised Classification for Video Shot Segmentation 2003

相似文献(10条)

1.学位论文刘文哲基于内容视频检索的镜头边界检测与分层组织研究2005

随着计算机、通信和多媒体技术的不断发展,视频信息快速增长,如何对视频数据进行有效地组织、管理、表达和检索成为视频检索研究领域里的热点问题,本文主要利用计算智能与小波的相关理论对基于内容视频检索技术中的视频镜头边界检测和分层组织技术进行了较为深入的研究.首先讨论了视频镜头边界检测的特征提取,在研究分析了镜头切变检测的一般方法后,提出了基于支撑矢量机的镜头切变检测方法.该方法利用支撑矢量机良好的学习推广能力和镜头切变的特点,构造支撑矢量机分类器,实现对镜头切变的检测.该方法减少了经验阈值的数目和由此带来的人为因素的影响.仿真实验对具有不同特点的视频片段进行测试均取得了较好的结果,通过与其他方法检测结果的比较,证明了本文方法的有效性.其次,将视频的多帧差序列视为一维信号,提出了一种基于小波去噪的二次帧差滑动窗口镜头边界检测算法.该方法能同时检测出镜头的切变和渐变,仿真实验表明该方法在一定程度上克服了由于摄像机不规则运动、光影变化,画面中物体快速运动等造成的影响,通过对不同视频片段的测试和比较,表明本文提出的算法能较好地实现镜头的突变和渐变检测.最后,通过分析视频分层组织方案的基本思想,提出了利用基于免疫克隆的聚类算法对视频镜头进行聚类,实现基于镜头的视频场景构造,仿真实验表明该聚类算法对视频场景的聚类具有较好的性能,在此基础上可以实现视频的一种分层组织结构,为进一步的视频分析处理创造条件.

2.期刊论文方勇.戚飞虎一种新的视频镜头边界检测及关键帧提取方法-华南理工大学学报（自然科学版）

2004,32(z1)

根据视频邻域片段变化的特点提出了镜头边界系数模型,镜头边界系数具有良好的抗噪能力,且对视频帧的时域变化有较好的描述能力,可用于镜头边界检测与关键帧提取.它可以单独检测镜头边界,也可以与传统的基于帧差的镜头边界检测方法相结合检测镜头边界.在提取关键帧时,根据镜头边界系数的分布,自适应地确定镜头内的关键帧数,用非极大值抑制方法与基于镜头边界系数的优先级方法确定关键帧的位置.实验结果表明,该方法在镜头边界检测性能上要优于已有的基于帧差的镜头边界检测方法,提取的关键帧对镜头的视觉内容具有较好的表达能力,且可在视频回放时实时执行.

3.学位论文易运池MPEG压缩域镜头边界检测技术研究2006

随着计算机技术、多媒体技术和网络技术的飞速发展，数字视频的应用也越来越广泛。如何从这些海量的视频数据中快速、有效地查找所需要的信息，成为人们关注的热点。基于内容的视频检索技术正是在这种情况下提出的，同时，也逐渐成为目前多媒体技术中的研究热点。

镜头检测是视频检索中最基本也是最重要的一项内容，它的基本任务是根据相邻帧的相关性将视频序列分割成相对独立的基本单元一镜头，分割精度直接影响到检索的结果。所以，准确、快速的检测出镜头对视频检索具有重要的作用。

目前，越来越多的视频以压缩的形式储存。如何对这些压缩视频进行镜头的边界检测就显得更加重要。本文主要针对MPEG-2视频进行了镜头边界检测的研究。

论文在介绍视频压缩的基本理论及MPEG-2视频压缩标准的基础上，对压缩域内的镜头检测进行了深入研究。通过直接从MPEG-2压缩视频流中提取信息，实现了在压缩域内的镜头边界检测。本文分别采用宏块类型以及HSV颜色直方图进行了镜头的边界检测，并利用“滑动”窗口法来改善镜头切变与渐变检测的结果，实验结果表明，本文提出的算法对镜头切变以及渐变检测都能取得了比较好的效果，自动阈值的选取能适应不同类型的视频题材，可以

满足实时镜头检测的需要。

论文还对今后进一步的工作进行了展望。

4.学位论文谢明华基于二维图像分割的视频镜头边界检测2006

视频镜头边界检测是实现视频检索的基础。本文总结了现有镜头边界检测方法，并利用不同类型镜头边界在时空二维图上的特征提出了相应的检测方法。

对现有的突变边界检测方法进行了改进，首先在时空二维图上进行运动补偿，然后利用梯度信息得到不连续值，使用自适应阈值定位突变边界。实验证明，该方法可以减小光照、运动的影响，准确快速地定位突变边界。

提出了一种新的基于时空二维图像分割的渐变边界检测方法。检测溶解边界时，取像素在水平、正对角线、负对角线三个方向上误差最小的斜率作为该象素点的斜率，得到关于斜率和误差的二维图像并将其二值化，用数学形态学的方法进行进一步的处理后得到关于溶解边界的不连续值；对于淡入淡出镜头边界，先利用其包含单色帧的特征检测出是否存在淡入淡出，然后利用溶解边界检测方法定位淡入淡出的开始和结束位置；按照扫换过程中前后镜头衔接处的边缘特征将扫换边界分为突变扫换和溶解扫换，在时空二维图的单象素水平方向分别检测可能的突变变换和溶解变换象素点，然后将连接的曲线在垂直方向的长度作为扫换边界检测的不连续值。实验证明该方法能克服噪声、运动对视频时空二维图的影响，定位渐变边界的起始、终止位置。

5.会议论文方勇.戚飞虎一种新的视频镜头边界检测及关键帧提取方法2004

6.学位论文高洁体育视频检索的若干技术研究2007

如今，观看体育节目已经成为现代人生活娱乐的一种主要方式。随着体育视频节目的飞速膨胀，如何帮助用户找到他们钟意的比赛或比赛的精彩片断，成为一个急需解决的问题。本文面向体育视频领域，以羽毛球和网球视频为研究对象，对基于内容的视频检索过程进行了讨论，目的是通过对视频内容进行计算机处理、分析和理解，建立目录和索引，方便用户获取信息。

本文主要对下面几个问题进行了讨论，包括镜头边界检测、关键帧选取、特征提取，以及镜头分类，并研究了一个羽毛球和网球比赛视频的分类方法。

镜头边界检测是进行视频处理的第一步，本文在总结了解压缩域和压缩域现有镜头边界检测方法的基础上，在解压缩域内提出了一种改进的基于时空切片的镜头边界检测算法，完成了对突变和滑变镜头的检测。在压缩域内，本文研究了一种基于宏块信息的镜头边界检测算法，实现了阈值的自动选取和镜头转换点的准确定位。视频处理的第二步是关键帧选取和特征提取，本文采用基于帧间差异的方法来选取镜头中的关键帧，并将颜色、纹理等特征作为分类依据，运用基于球树的分类算法，实现比赛镜头与非比赛镜头的分类。针对羽毛球和网球比赛视频的分类问题，本文结合领域知识，通过提取场地主颜色、圆柱距离、形态学等手段，从比赛镜头的关键帧中分割出了比赛场地，并提取了场地线特征，最后完成了对两类视频的分类。

最后，本文用Matlab实现了上述算法。实验结果表明，改进的镜头边界检测算法具有更高的准确性和效率。球树分类模型不仅实现了镜头分类，更有利于提高视频检索的效率，此外，利用场地线特征来分类羽毛球和网球视频也能达到令人满意的效果。

7.期刊论文方勇.戚飞虎.冉鑫.FANG Yong.QI Fei-hu.RAN Xin基于窗帧差的镜头边界系数模型及其应用-电子学

报2006,34(5)

针对视频结构分析提出了一种新的镜头边界系数模型.首先,按照特定的计算方法计算当前帧的窗帧差,使得窗帧差在镜头内与镜头边界呈现不同的特征;然后,采用相应的镜头边界检测算子计算镜头边界相似系数,镜头边界相似系数越大,则该帧越可能是镜头边界;最后,为了提高镜头边界相似系数的检测能力,根据镜头边界相似系数定义了镜头边界系数.镜头边界系数具有良好的特性,可以单独检测镜头边界,也可以与传统的镜头边界检测方法相结合,为镜头边界检测提供了一种鲁棒的框架.实验结果表明,基于镜头边界系数模型的镜头边界检测方法能明显改善镜头边界检测结果.

8.学位论文孟祥茹视频镜头边界检测的研究2007

随着计算机技术、多媒体技术和网络技术的飞速发展，数字视频的应用也越来越广泛。如何从这些海量的视频数据中快速、有效地查找所需要的信息，成为人们关注的热点。基于内容的视频检索技术正是在这种情况下提出的，同时，也逐渐成为目前多媒体技术中的研究热点。但视频媒体的无结构性是阻碍新一代视频应用的瓶颈问题，为了解决视频的无结构性问题，研究者提出了“视频内容结构化”的技术途径。视频内容结构化技术分为低、中、高三层，镜头探测技术是低层视频结构化分析中的一项关键技术，在视频检索中起着重要的作用，好的镜头边界检测技术一定能为视频结构化分析打下坚固的基础。镜头边界检测一直是数字视频处理领域的一个重要课题。镜头是组成视频的最基本的单元，镜头检测就意味着为视频的结构化表示提供基础，使更高层的语义视频处理成为可能。本文全面而系统地研究了视频内容结构化技术中的镜头边界检测技术，本论文的主要工作如下：

本文首先介绍了镜头检测的概念、研究的背景和研究的理论以及应用意义，研究了解压域镜头探测技术，总结了镜头突变检测和镜头渐变检测的方法，并指出了现有方法中需要关注的问题。

本文对MPEG视频压缩标准进行了较为详细的讨论，重点介绍了MPEG视频模型，并对I帧、P帧和B帧的编码进行了详细的介绍，这是理解在MPEG压缩域内镜头检测的基础。

本文重点研究了基于MPEG压缩域镜头探测技术，在原有算法的基础上改进和实现了一种基于MPEG压缩域中镜头突变检测的方法，实现了利用分块直方图结合运动矢量信息进行镜头突变的快速检测，实验结果证明本文算法在查全率和查准率上相对于原算法有所提高，但仍有待于进一步提高，并讨论了渐变镜头探测和大运动的区分等。

9.学位论文李秀强视频镜头边界检测与体育视频分类算法研究2009

随着Internet的应用和普及，多媒体信息检索系统对社会各领域产生越来越大的影响。传统的信息检索采用基于文本的检索方式，查询时需要说明文本特征，要求用户对文本特征的描述具有一定的准确性和规范性。但由于视频数据的丰富内涵以及人们对视频内容进行抽取的主观性，视频信息难以用几个关键词描述。因此，基于内容的视频检索应运而生。

基于内容的视频检索通常有两种方法。一种方法是把视频信息看作是独立的帧或图像的集合，利用图像检索的方法进行视频索引和检索。这种方法的缺点是忽略了视频帧之间的时序关系，而且需要处理大量的图像。另一种方法是把视频序列分成若干组镜头，索引和检索针对镜头中有代表性的关键帧进行，该方法是目前研究的热点。目前，第二种方法的研究，主要集中在视频分割、特征提取和描述、关键帧提取和视频分类等方面。

本文主要研究的目标是第二种方法中的两个主要问题：镜头边界检测和几种体育类视频的分类。

论文首先在对当前镜头边界检测技术进行深入分析的基础上，将符合人类视觉系统的新颖特征应用到视频镜头边界检测中，最后用机器学习中支持向量机作为分类工具，系统地完成一个视频镜头边界检测算法。通过对TRECVID2007数据库进行实验的结果表明，该算法在查全率和查准率方面都获得了满意的性能。

接下来对于几种体育视频的分类，本文提出了一种基于多支持向量机的体育视频分类算法，该算法结合常见的视觉特征(颜色、纹理、运动矢量等)和多支持向量机，在篮球、足球、羽毛球和乒乓球的分类任务上，达到了很好的分类效果。关键词：基于内容的视频检索;镜头边界检测;视频分类

10.期刊论文丁洪丽.陈怀新.DING Hong-li.CHEN Huai-xin基于累积直方图的视频镜头边界检测方法-电讯技术

2008,48(3)

提出了一种基于累积直方图的视频镜头边界检测方法,以累积直方图来代表视频帧图像的特征,其帧差充分反映了视频帧图像间的差异性;结合滑动窗的局部阈值分割处理,获得镜头边界检测对物体/摄像机的运动和光线变化的不敏感性.实验结果表明,本方法在镜头突变边界检测中达到95.97%的查全率和96.75%的查准率.

本文链接：https://www.wendangku.net/doc/9b5884594.html,/Periodical_xadzkjdx200802020.aspx

授权使用：黄小强(wfxadz)，授权号：b3e9715a-348d-4e19-b886-9e3e01019ec3

下载时间：2010年11月30日