大媒体计算中心│徐行博士在国际顶级期刊连发论文

  • 日期:2017-03-14 10:03:25

摘要:

阳春三月,东风报喜,电子科技大学计算机学院│大媒体计算中心徐行博士在国际顶级期刊IEEE Transactions on Image Processing(TIP)、IEEE Conference on Computer Vision and Pattern Recognition(CVPR)上连发两篇高水平论文。

        阳春三月,东风报喜,电子科技大学计算机学院│大媒体计算中心徐行博士在国际顶级期刊IEEE Transactions on Image Processing(TIP)、IEEE Conference on Computer Vision and Pattern Recognition(CVPR)上连发两篇高水平论文。
        以徐行博士为第一作者、沈复民副教授、杨阳教授和申恒涛教授共同完成的论文《Learning Discriminative Binary Codes for Large-scale Cross-modal Retrieval》被图像处理及计算机视觉领域的国际顶级期刊IEEE Transactions on Image Processing(TIP)录用。传统的跨模态检索方法,尤其以哈希算法为主的检索方法,通常需要较高的时间复杂度来获取相关的哈希码字和相关的编码函数。在对比与分析传统的跨模态哈希算法的基础上,本论文提出了一种基于线性判别分类的统一哈希表示学习框架,创新性的将不同模态的哈希函数、统一哈希表示以及线性分类器进行联合学习。在维基百科等多模态数据集的搜索验证性实验中,提出的方法能以更快的训练速度得到非常令人满意的跨模态检索性能,而且采用统一的哈希码表示,能更有效的节省多模态数据的存储空间。因此,该方法其可以很好地应用于异构数据搜索等实际问题中。
\
        以徐行博士为第一作者、沈复民副教授、杨阳教授和申恒涛教授共同完成的研究论文《Matrix Tri-Factorization with Manifold Regularizations for Zero-shot Learning》被CVPR 2017接收。该论文创新性的提出了基于矩阵分解和流形正则化技术的零样本学习(Zero-shot Learning)算法。该算法通过矩阵分解的框架,挖掘类别已知的样本的视觉特征空间和语义嵌入空间中隐含的关联关系,并通过流形正则化的约束将这种内在的关联关系传递给零样本的类别。该算法有效的解决了零样本学习中的“投影域偏差”(projection domain shift)问题。在多个标准数据集的标准和通用零样本分类和检索任务上,该算法均优于现有的方法,达到了最好的识别和检索性能。

\
        徐行,博士,计算机学院大媒体研究中心讲师。主要研究方向涵盖多媒体内容分析等方面,具体在大规模图像数据集的自动语义标注以及跨媒体信息检索等前沿方向展开技术研究和系统实现。作为主要成员参与日本学术振兴会基础课题研究及产学研合作研究。近五年以第一作者身份累计发表学术论文十余篇。多次参加多媒体和模式识别领域的重要国际会议,如ACM MM, ICME, ACCV,ICIAP等, 并在会议中进行口头发表。

        大媒体计算中心成立于2014年,致力于计算机科学与技术学科在智能信息处理方向的学科建设,团队建设,人才培养,科学研究与技术应用。研究团队目前有国家“千人计划”入选者2人(含青年千人1人),四川省“千人计划”入选者4人,电子科技大学“校百人计划”特聘教授3人,副教授3人,博士青年教师1人,研究生近四十人。团队主要从事多媒体、模式识别、计算机视觉、信息检索、机器学习、数据挖掘与数据库等领域的国际一流研究。自中心成立以来,已经在ACM MM,CVPR,ICCV,AAAI, IEEE TIP, IEEE TKDE,IEEE TMM等CCF A类/中科院JCR二区以上的会议和期刊上发表论文近八十篇,相关论文在多媒体、模式识别、计算机视觉、数据挖掘等研究方向产生了较大的国际影响力。团队目前承担1项国家自然基金重点项目,2项国家自然科学基金面上项目和5项国家自然科学基金青年项目。