英才学院本科生在机器学习CCF-A类会议IJCAI发表研究成果电子科技大学成电新闻网

分享到微信 ×

打开微信“扫一扫”
即可将网页分享至朋友圈

英才学院本科生在机器学习CCF-A类会议IJCAI发表研究成果

文：崔晨航图：崔晨航来源：英才学院时间：2023-05-29 5960

近日，英才实验学院2021级本科生崔晨航在任亚洲老师课题组科研训练期间撰写的论文“Deep Multi-view Subspace Clustering with Anchor Graph”成功入选机器学习领域CCF-A类会议之一的International Joint Conference on Artificial Intelligence（IJCAI，国际人工智能联合会议）。该会议2023年投稿总篇数为4566，接受率为15%。崔晨航为该论文的第一作者，任亚洲老师为通讯作者，电子科技大学为第一作者和通讯作者单位。

多视图聚类（Multi-view Clustering）是指通过利用来自多个数据源或多个特征空间的视图，对数据进行聚类分析的一种方法。它在计算机视觉、自然语言处理和生物信息学等领域得到了广泛应用。多视图聚类的特点在于利用多个视图的信息，提高聚类分析的准确性和稳定性。多视图子空间聚类考虑使用在不同视图中呈现的数据的各个特征，以产生更准确的聚类结果。子空间聚类（Subspace Clustering）已经在过去几年得到了广泛研究，它假设数据点是从低维子空间中绘制出来的，并且可以表示为其他数据点的线性组合。

现有的多视图子空间聚类（Multi-view Subspace Clustering）方法旨在有效地学习具体子空间并挖掘所有视角的全局信息以提高聚类分配质量，但仍然存在一些挑战：

（1）大多数MVSC方法需要高时间复杂度来计算原始特征上的聚类结果，这需要更多的存储和时间，也很难处理大规模数据集。此外，一些方法专注于通过非线性嵌入数据来学习子空间。由于所学子空间与聚类之间的联系较弱，所学特征可能不适合聚类任务。

（2）现有的自监督多视图聚类方法中的大多数都严重依赖于潜在表示的质量来监督学习过程。一些方法融合所有视图的嵌入特征，并利用k-means 获得全局目标分布。但是k-means在某些数据结构上表现不佳，例如非凸结构。因此，这些模型得到的伪标签可能无法反映清晰的聚类结构，以指导潜在特征学习过程。

（3）一个实例的某些视图可能具有错误的聚类分配，导致聚类不一致。一些基于深度学习的MVC方法通过直接学习潜在特征上的共同信息来实现一致性，这可能会降低每个视图信息的互补性，因为要同时实现学习精确潜在表示和实现一致性之间存在冲突。

为了解决上述问题，本文提出了一种新颖的用于多视图子空间聚类（MVSC）的深度自监督模型。通过谱聚类生成一个统一的目标分布，该分布更具鲁棒性，并且可以准确地指导特征学习过程。为了提高模型的效率，采用锚点图来构建图矩阵，避免构建一个时空复杂度高的全图。该策略通过抽样锚点显著降低时间复杂度，这对于处理大规模问题尤其实用。同时利用对比学习方法在伪标签上进行训练，以缓解一致性目标和重构目标之间的冲突，从而在多个视图之间获得一致的软聚类分配。通过在真实世界数据集上的广泛实验，验证了所提出模型的有效性和效率。

崔晨航同学于2022年7月加入任亚洲副教授课题组。任亚洲副教授（https://yazhou-ren.github.io）主要从事人工智能理论与应用研究，近年来已在AAAI、IJCAI、CVPR、ICCV、NeurIPS、ACM MM、SIGIR、ICDM、ECCV等国际顶级会议，以及TKDE、TIP、TGRS、NN、KBS、IS等国际知名期刊上发表论文80多篇（第一/通讯作者40多篇），其中CCF-A类和中科院1区论文20多篇；主持和参与多项国家级、省部级科研项目；指导的大部分学生毕业后进入哥伦比亚大学、弗吉尼亚理工大学、佛罗里达大学、香港中文大学、清华大学等海内外名校深造，或进入华为、阿里巴巴、腾讯、微软等企业工作。

论文链接：

[2305.06939] Deep Multi-View Subspace Clustering with Anchor Graph (arxiv.org)