基于图卷积神经网络的深度哈希学习研究文献综述

 2022-11-23 11:11

文献综述

1 应用前景

随着社交网络和互联网的发展,视觉数据(例如照片和视频)经历了爆炸性的增长。正因此,在图像检索、计算机视觉、机器学习和数据挖掘等诸多领域,最近邻(NN)搜索作为一种基础方法,其重要性日益凸显。但是面对庞大的数据量以及数据库中高维的数据信息,现有的基于NN的检索方法无法获得理想的检索效果与可接受的检索时间。在许多实际应用场景中,对每一个查询都给出准确的最近邻结果是不必要的,有时给出一个近似最近邻(ANN)结果就可以满足需求。可以通过近似最近邻搜索可能是近邻的数据项而不再只局限于返回最可能的项目,在牺牲可接受范围内的精度的情况下大大提高了检索效率,因此,近似最近邻搜索在近几年引起了广泛的关注。

其中,哈希方法由于其时间复杂度和空间代价较低,近年来受到了研究者的广泛关注。哈希方法将图像从原始的高维实值数据空间投影到低维二进制空间。每个哈希函数都是一个超平面,将原始数据空间分成两部分,并为位于其不同侧面的图像返回不同的代码值(-1, 1)。每个哈希函数对应一个哈希位。然后将数据库中的每个图像输入到哈希函数中以创建B位唯一的压缩二进制代码。检索时只计算查询图像的哈希码,检索数据库中具有相同或相似哈希码的图像。由于汉明距离计算速度快,且主要使用异或运算,因此它被用来评估哈希码之间的相似度。因此,基于哈希的图像检索方法能够快速找到与给定查询图像相似的图像。

2 现状和尚存的问题

许多哈希技术已被广泛应用于处理或简化实际问题,包括近似最近邻搜索[1],[2],视觉识别,多模态分析[3]-[7],大规模优化[8]等。

一般来说,学习哈希的目的是追求二进制嵌入,以保持原始数据之间的相似性。数据点之间的数据相似性是以多种方式计算的。监督哈希方法根据语义标签定义相似性,这个方法已被证明具有很好的性能。然而,收集语义标签的沉重负担阻碍了监督哈希在实践中的应用。相反,无监督哈希方法[9],[10]通常利用数据点之间的成对距离,通常是欧几里德距离,而不是标签来定义亲和图。作为监督类别和非监督类别之间的交集,半监督哈希(SSH)方法[11]-[13]确定了包括标记数据和未标记数据的相似性。近年来,基于深度神经网络的哈希已经得到了广泛的研究[14]-[23]。这些方法大多是通过卷积神经网络(CNNs)模型提供的强大特征表示来形成它们的哈希函数。

基于图的哈希近年来引起了广泛的研究关注[24],[25]。基于图的哈希范式以亲和图,即成对出现的相似矩阵作为一个适当设计的目标中的监督,这通常导致NP-硬二元二次规划(BQP)问题。谱哈希(SH)[26]作为一种最著名的基于图的哈希方法,通过在所有维度上保持一个均匀数据分布不现实的假设,来解决一维图拉普拉斯的特征函数解。为了放松这一强有力的假设,锚点图哈希(AGH)[27]采用少量的锚点来近似数据的相似性。然而,二进制约束仍然使哈希问题难以解决。然后,大多数方法选择丢弃二进制约束并求解一个松弛的连续优化问题,例如SH、AGH和归纳流形哈希(IMH),然而,随后的量化步骤通常是通过阈值实值嵌入来获得二元码,从而导致次优解。最近,通过将基于图的哈希转化为离散优化框架,直接解决了原二元约束问题。不幸的是,这些方法仍然属于BQP问题,在遇到巨大的数据时,这需要大量的计算成本。

最近提出的图卷积网络(GCNs)[28]-[30]推广CNNs来处理非欧氏图数据项,如社交网络、蛋白质交互网络和知识图。已经证明GCNs能够从图中提取局部的、固定的和成分的特征。利用一个有效的GCNs来追求似乎可信的二进制嵌入是可取的。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。