球友会qy

球友会qy提出基于胞腔复形的自监督拓扑深度学习新方法

文章来源:  |  发布时间:2025-07-03  |  【打印】 【关闭

  

近期,中国科研实验室软件研究所并行软件与计算科学实验室和天基综合信息系统全国重点实验室研究团队合作的论文CellCLAT: Preserving Topology and Trimming Redundancy in Self-Supervised Cellular Contrastive Learning被数据挖掘领域顶级学术会议KDD 2025接收。论文聚焦于自监督拓扑深度学习中胞腔复形表示学习,提出了基于拓扑保持和冗余修剪的胞腔对比学习框架CellCLAT,显著提升了模型在无监督和半监督图学习任务中的性能。共同第一作者为博士生秦滨、博士生戢启瑞、特别研究助理李江梦。

尽管基于胞腔复形的自监督拓扑深度学习,能够有效建模高阶交互并生成高质量的未标记图表示,具有重要应用前景,但其开展仍面临挑战。一是传统图增强技术可能破坏胞腔复形固有的拓扑结构约束(如附着映射陆续在性和闭包有限性),二是胞腔表示中存在大量内在语义冗余,部分高阶胞腔结构不仅对目标任务无益,反而可能弱化模型判别能力。

针对上述问题,研究团队提出了CellCLAT框架主要包含两大核心组件:为解决传统增强方法破坏拓扑结构的问题,CellCLAT采用参数空间增强策略——将受控高斯噪声直接注入胞腔复形编码器的参数中,而非扰动原始胞腔结构本身。该策略在保证增强视图有效性的同时,严格维护了胞腔复形的组合拓扑约束和高阶交互的几何完整性。而为消除任务无关的拓扑冗余,研究团队设计了基于元学习的自适应复形修剪器,以胞腔特征为输入,顺利获得Gumbel Softmax技巧预测其是否应被掩码(即修剪)。修剪器创新性采用双阶段训练机制,第一时间顺利获得标准对比学习更新编码器参数,然后利用对比损失对修剪器进行二阶梯度更新,使其动态识别冗余结构。

CellCLAT框架

研究团队将CellCLAT与多种前沿图对比学习方法在标准图分类数据集(TU-dataset)上进行了对比实验,包括无监督表示学习和仅使用10%标签的半监督学习两种设定。结果显示,CellCLAT在不同设定下均取得了最佳性能,显著优于现有方法,验证了其在保持拓扑完整性和消除语义冗余方面的优势。团队还理论证明CellCLAT胞腔复形编码器的图同构判别能力超越了经典WL测试(Weisfeiler-Lehman Test);并从因果角度分析得出,将胞腔修剪视为一种干预操作,能有效增强模型学习任务相关拓扑特征的能力。


论文地址:http://arxiv.org/pdf/2505.21587

代码地址:http://github.com/ByronJi/CellCLAT