基于手势的电视模拟遥控器文献综述

 2022-11-20 04:11
  1. 文献综述(或调研报告):

关于手势识别,前人很早就开展了大量工作。但是,因为时间和空间的变化,处理数据的速度,实际情况中的各种噪声,手势本身的变形性,以及特征的选取等因素的影响,使得手势识别研究变得困难重重,进展缓慢。比如,手势识别中最为复杂的手语识别目前依然存在很多困难,包括:1,识别方案本身的问题;2,环境及限制条件的问题;3,算法对不同的人敏感的问题;4,NMS(nonmanual signals) 的问题;5,语言语法处理的问题。虽然手势识别是一个复杂的任务,但是因为其自然,无接触,方便等优点,国内外仍有很多院校,科研机构,企业对其进行研究,而且不乏显著的成果。新加坡制造技术研究院的尹小明和谢彬利用基于颜色分割的 RCE 神经网络 , 应用于基于姿势的人与机器人交互系统中,该系统表现出了良好的有效性和鲁棒性,整个识别过程能在 1.5 秒内完成,手势的分割少于 1s[1]。伦敦大学玛丽女王学院的 Caifeng Shan 等人利用 mean shift 算法以及粒子滤波,在一个手势控制机器人轮椅的应用中,总体识别率达到 97.3%[2]。2010 年,名古屋大学的石田博之等人利用希尔伯特翘曲方法以及利用原始的特征值的相位同步使得输入的图像序列与参考序列对齐,结合隐马尔可夫模型(HMM)的方法,使得识别率相比于以前的翘曲(DTW)得到了很大的提高[3]。美国南佛罗里达大学的 Ruidou Yang 提出了一种利用中间分组模块与识别模块耦合的算法,使用该方法在没有得到很好的场景分割的情况下也能提高手势分割[4]。2009 年国立台湾科技大学的李永辉等利用 3D 数据结合神经网络对台湾20 个静态手势语进行识别,平均正确识别率达到 96.58%[5]。约旦大学的 M.AL-Rousan,K.Assaleh 等人利用隐马尔可夫模型(HMM)对阿拉伯手势语进行识别,基于标记的情况下,对训练过的手语的正确识别率达到 98.13%,对未训练过的手语的正确识别率达到 96.47%[6]。印度理工学院孟买电子工程部 2006 年,利用基于特征空间的构架结合马氏距离,且不考虑手的变形, 有效实现了对运动的跟踪,该系统对于背景的混乱及机构的噪声具有很好的鲁棒性;在训练阶段系统对于所有的 80 个姿势识别率达到100%[7]。曼彻斯特大学的 Nikolay Stefanov 等人利用可变长度马尔可夫模型结合粒子滤波在随机模拟人的行为中,在可比较的方法中稳固性得到了重大的提升,在实时模拟行为消耗的时间达到 16ms[8]。Heung 等利用一种动态贝叶斯网络模型(DBN)用于连续手势的视频流中实现手势识别,在其实验测试中,通过交叉验证,对十种孤立手势识别率高达 99.59%[9]。Don Willems 等利用一基于笔划的特征用于手写姿势的识别中,相较于全局特征分来准确率提高了 10%到 50%[10]。田纳西州立大学利用基于皮肤颜色的算法结合欧氏距离对 20 种不同的手势进行实时识别,正确识别率达到85.2%[11]。S. Malassiotis 和 M.G. Strintzis 利用 3D 手势模型能够在变化的背景下实现识别。在不缺像素的情况下,识别率将近 100%,而在缺少 20%的像素时,识别率迅速下降到 80%[12]。

目前,国内对于手势识别的相关研究也很多。虽然如此,但是在国内还是鲜有成果的。兰州理工大学利用 VFW 技术及 AdaBoost 算法,在利用手标代替鼠标用于计算机输入的应用中,在实验中实现了,得到了 95%以上的识别率[13]。西安电子科技大学在静态手势识别中,利用二维极坐标提取傅立叶描绘子,在识别中利用 BP 神经网络法实现了 94%的识别率[14]。上海交通大学的顾立中在机器人上利用 Zernike 矩,Isomap 降维方法,时间轴压缩的手势时空建模方法和速率边沿检测算法,建立了一个仿人头部的系统平台,实现了精确的三维头眼协调运动控制[15]。浙江大学 2008 年利用 YCbCr 颜色空间,Camshift 算法, Kalman 滤波算法,Hausdorff 距离的模板对两种定义手势的正确识别率都在 90%以上[16]。清华大学祝新远利用变阶参数模型,鲁棒回归分析及手势分割对 12 种手势识别率高达 97%[17]。青岛科技大学的孙玉在 word 录入程序应用中,利用支持向量机算法,HU 矩,YCbCr 颜色空间,对于十个定义的数字手势识别率达到了 98.9%[18]。中国科学技术大学的顾景提出了一种基于人体动作机电信号(SEMG)结合图像处理的技术,这是一种有趣的技术,它利用 SEMG 来捕捉手势的开始和结束,效果显著[19]。04 年上海海运学院利用几何矩,加权的欧几里德距离等算法实现了 30 个汉语手势字母,以及 10 个阿拉伯数字,在实验中识别率达到 93%[20]。至此,不得不提一下,利用传感器手套的办法,相比之下具有更好的效果。比如,2004年 2 月,中科院基于多功能感知理论的中国手语识别与合成研究,实现了 5177 个汉语词汇的中国手语识别,孤立词的正确识别率为 95%,连续手语的正确识别率为91.5%[6][12]。2008 年中科院计算机研究所,利用运动跟踪原理,数据手套及位置跟踪器已经实现了高质量的手语词运动数据库[21]。新加坡国立大学的 W.W. Kong 和 Surendra Ranganath 在精确英文手语的识别中,利用 CyberGlove 和磁性追踪器,FLD决策树以及 VQPCA 分析法,对于手形的识别率达到 96%,对于周期变化和非周期变化的手的轨迹的识别率分别达到 97.3%和 97%[22]。除此之外,还有另一种利用加速度传感器作为采集数据工具的技术。例如,Jiayang Liu 等利用3轴加速度传感器及uWave算法实现了 8 种手势的手势识别,识别率高达 98.6%[23]。张旭等利用 3D 加速度传感器结合 EMG 传感器对 18 种手势的进行识别,识别率达到 91.7%[24]。

参考文献:

[1] Xiaoming Yin, Ming Xie. Finger identification and hand posture recognition for human-robot interaction [J]. Image and Vision Computing, 2007. 25: 1291-1300

[2] Caifeng Shan, Tieniu Tan, Yucheng Wei. Real-time hand tracking using a mean shift embedded particle filter [J]. Pattern Recognition, 2007, 40: 1958–1970

[3] Hiroyuki Ishida, Tomokazu Takahashi, Ichiro. A Hilbert warping method for handwriting gesture recognition [J]. Pattern Recognition, 2010, 43: 2799-2806

[4] Ruiduo Yang, Sudeep Sarkar. Coupled grouping and matching for sign and gesture recognition [J]. Computer Vision and Image Understanding, 2009, 113: 663-681

[5] Yung-Hui Lee, Cheng-Yueh Tsai. Taiwan sign language (TSL) recognition based on 3D data and neural networks[J]. Expert Systems with Application, 2009, 36: 1123-1128

[6] M.AL-Rousan, K.Assaleh, A.Talarsquo;a. Video-based signer-independent Arabic sign language recognition using hidden Markov models[J]. Applied Soft Computing, 2009, 9: 990-999

[7] Kaustubh Srikrishna Patwardhan, Sumantra Dutta Roy. Hand gesture modelling and recognition involving changing shapes and trajectories, using a Predictive EigenTracker [J]. Pattern Recognition Letters, 2007, 28: 329-334

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。