更新时间: 试题数量: 购买人数: 提供作者:

有效期: 个月

章节介绍: 共有个章节

收藏
搜索
题库预览
基于子空间跨模态检索技术利用不同模态样本对的成对共生信息学习投影矩阵,将不同模态的特征投影到一个共同潜在子空间,然后在该子空间中度量不同模态的相似性,从而实现跨模态检索。2003年,Li等人首次提出了基于子空间的跨模态检索方法,通过最小化变换域中不同模态样本对的距离,学习不同模态的投影子空间[1]。2012年,Srivastava等人[2]采用了两个单独的深度玻尔兹曼机(Deep Boltzmann Machine, DBM)对不同模态类型特征上的分布进行建模,并在模型的基础上增加一层作为联合表示层,通过计算联合分布来学习公共空间。2016年,文献[5]提出了群组不变跨模态子空间学习方法。该方法在学习投影子空间的同时,学习不同模态间的群组共生关系,而不仅仅是样本对的共生信息,这种高层次的语义对应关系有效提高了潜在子空间的鲁棒性和检索的准确性。2018年,文献[6,7,8,9,10,11]提出的基于 KDM(Kernel Dependence Maximization)的跨模态子空间方法:通过核最大化(不是特征相关性最大化)来学习每个模态的子空间表示,KDM 能够有效保持样本的特征相似性和语义相似性。 请检查下列参考文献列表的格式错误,并进行修正: [1] Li D, Dimitrova N, Li M, et al Multimedia content processing through cross-modal association[C].Proceedings of international conference on Multimedia.2003: 604-611. [2] Yan F, Mikola K. Deep correlation for matching images and text[C].Proceedings of the Computer Vision and Pattern Recognition, IEEE Conference on 2015: 3441-3450. [3] Andrew G, Arora R, Bilmes J. Deep canonical correlation analysis[C].International Conference on Machine Learning.2013: 1247-1255. [4] Shuhan Qi, Zawlin Kyaw, Xuan Wang, Zoe L. Jiang, Jian Guan: Large Scale Product Search with Spatial Quantization and Deep Ranking. Multimedia Tools and Application. 2019,78(19): 27045-27065 [5] Liang J, He R, Sun Z. cross-modal subspace learning[C].Proc of International Joint Conference on Artificial Intelligence. 2016: 1739-1745. [6] Ngiam J, Khosla A, Kim M, et al. Multimodal deep learning[J].Proceedings of international conference on machine learning. 2011: 689-696. [7] Xu M, Zhu Z, Zhao Y et al Subspace learning by kernel dependence maximization for cross-modal retrieval[J].Neurocomputing.2018: 94-105.(含图)(含图)