基于头肩像的人物视频编辑方法设计文献综述

 2022-11-25 04:11

近年来,随着信息技术的发展,应用的普及性不断提高,以及计算机的软硬件性能的飞速提升,更加高效也更加友好的人机交互技术,即HCI(Human Computer Interaction)被不断的提出改进并应用日常生活中,比如视频会议和视频电话、视频摘要和索引以及高级编辑和数字娱乐[1]。也有许多 进行人脸分割的交互式分割方法方面的研究[2]-[5]

由于人脸的检测与跟踪在许多方面具有广泛的应用前景和潜在的价值,以及问题本身的理论也非常具有挑战性,从而激发了世界上广大科研工作者及相关商家的浓厚兴趣,国内外已经开展了大量相关项目的研究。例如国外比较著名的有MIT,CMU等;国内有清华大学,中科院计算所等许多著名大学和研究单位人员从事人脸检测跟踪相关的研究。本文主要简要讨论了视频序列中的人脸检测和跟踪技术的基本知识。通过介绍一种已实现的视频中人脸检测系统来基本了解视频序列中人脸检测与跟踪会用到的一些知识和可能存在的问题。

人脸检测与跟踪问题涉及包括数字图像处理,计算机视觉,模式识别,人工智能,神经网络在内的众多领域[14]

目前常用的在图像中人脸定位方法有基于肤色和模板匹配[7][12]的方法,基于马赛克图[8]的方法,还有基于统计的方法[9]。关于基于头肩像序列的人脸特征定位系统[6],此系统采用的是基于人脸特征定位的方法,也可以从中看出视频图像处理的基本方法。视频序列的处理就必需要注意实时性,尤其在实际应用比如视频通话中需要对目标快速检测[6][13],但是高精度的人脸特征识别是比较费时的,所以要同时考虑实时性和精度的衡量。影响人脸特征定位主要有两大因素,一是视频的场景,二是人身上的特征变化,比如人脸的姿势,肤色,遮挡物等基于头肩像的人脸特征定位系统是在摄像头固定、人物的背景静止的条件下,针对的只是单人脸的检测,比较简化,所以采用的是先利用背景差分法并结合几何积分投影法找到人脸区域,再采用高斯肤色模型,在YCbCr颜色空间和RGB空间下,使用模板匹配和积分投影法,进行实时的人脸特征定位跟踪。

人脸跟踪是人脸检测问题的发展。很自然的想法就是把视频序列分解成一帧 一帧的图像,在每一单幅图像中进行人脸检测。但是由于人脸检测的算法为了准 确的定位出人脸,需要计算大量的特征,这样往往无法保证系统的实时性。在实际的系统中,通常考虑利用一些相关信息来缩小检测区域,辅助进行人脸定位。

视频中常用利用图像序列之间的运动相关性来提高检测速度[14]的方法。主要的运动信息检测方法有:

1.背景差分法:背景差分法也叫背景减除法,是目前运动物体检测中最常使用的一种方法,它是利用当前图像与背景图像的差分来检测出运动区域的一种技术。背景差分法可以提供绝大多数特征数据,但对于光照和外来事件的干扰都特别敏感,从而使得背景图像的更新变得十分重要。如果在一定时间间隔内没有检测处理任何的变化事物,则可以取最简单的时间平均图像作为背景模型,但如果频繁有干扰的话,取得背景图像一般是比较困难的。

2.时间差法:常与背景差法综合使用的方法,也叫帧间差法,时间差法是在连续的图像序列中两个或三个相邻帧间采用基于像素的时间差法并且阐值化来提取图像中的运动区域。对于两帧差分一个改进的方法是利用三帧差分来代替,但帧差分法有时不能提取出所有相关的特征向量,在运动实体内部容易产生空洞现象。

时间差法和背景差法都只适用于粗略的运动物体定位,比较精确的定位运动目标的方法有基于光流的方法和基于能量函数的方法。

3.光流:基于光流方法的运动检测是指通过计算位移向量光流场来初始化基于轮廓的跟踪算法,从而有效地提取和跟踪运动目标。在时间上连续的两幅图像中,如果用向量来表示移动前后的对应点,就称为光流。该方法的优点是在摄像机运动存在的前提下也能检测出独立的运动目标。但是,大多数的光流计算方法相当复杂且抗噪性能差,限制了其在需要实时性的系统中的应用。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。