英才学院本科生在SCI一区期刊KBS发表论文

文:叶文涛 王俊入 / 来源:英才学院 / 2021-09-12 / 点击量:4878

  近日,在大数据研究中心刘震副教授的指导下,英才实验学院2017级本科生叶文涛(计算机科学与技术专业)以第一作者身份撰写的论文“Who are Celebrities? Identifying Vital Users on Sina Weibo Microblogging Network”被中科院一区期刊Knowledge-Based System接收。

  后互联网时代,社交网络因其便利性得到蓬勃发展,与人们的日常生活变得日益息息相关,蕴藏着巨大的经济和社会价值。新浪微博作为流行的中文社交网络平台拥有庞大的用户数量,其中也存在少数特殊的重要用户如行业大V等。该类用户对于促进信息传播,舆情监督和市场营销等方面具有潜在的巨大作用,因此预测微博网络中可能出现的重要用户可以在未来更好地引导网络舆情健康发展,创造更大的经济价值。然而,通过简单的方法如基于用户的粉丝数量并不能准确识别这些潜在重要用户,比如有些重要用户由于活跃度不高导致他们的粉丝数量甚至低于普通的用户;因此如何通过微博网络的拓扑结构特征建模并对新浪微博网络中潜在的重要用户进行准确识别是一个有趣并富有挑战性的问题。目前研究的方法主要采用各类中心性指标来衡量用户的重要性或者利用分类/聚类的方法区分重要用户和普通用户;但现有方法没有充分挖掘社交网络的拓扑结构性质,也无法实现端到端的模型训练,因此识别效果较差。

1111.png

DCSGA模型结构示意图

  该论文提出的方法Deep node Classification model based on Simplified Graph Attention mechanism(DCSGA)在以下四个方面进行了创新:首先,相对于各类传统中心性指标,该研究采用了图嵌入的方法,引入了机器学习的思想,可以挖掘深度的网络拓扑结构信息;论文的模型采用了端对端的模型架构,利用全连接神经网络构建嵌入层和分类器(如下图所示),进行有监督地训练;论文定义了同时包含结构信息和标签信息的邻接标签矩阵,可以充分利用标签信息,对嵌入向量的训练提供监督信号,从而可以提高重要用户的识别精度;论文根据对局部微博网络(社交网络)的统计分析,将粉丝网络与关注网络进行了合理的叠加,并采用了改进的损失函数解决样本不均衡问题等。

  通过实验验证,研究者得出如下结论:DCSGA比现有模型能够更加精准地识别重要用户;DCSGA也具有较强的鲁棒性,且能够更加精准地识别小入度节点是否为重要用户;DCSGA对损失函数的改进可以有效提升模型的检测性能。 

  Knowledge-Based System是人工智能领域的跨学科国际期刊。该期刊旨在支持科研工作者通过数据科学与计算技术提供预测和决策;支持人工智能领域的理论和实践研究相平衡;鼓励以知识为基础的智能模型、方法、系统和软件工具的新开发和实施,并将其应用于商业、政府、教育、工程和医疗保健等领域。

  叶文涛同学于2019年秋进入刘震副教授的实验室学习。目前他正在香港中文大学(深圳)攻读博士学位。刘震老师近年来已指导多名本科生发表高水平学术会议和SCI期刊论文。他带领的团队致力于探索大数据和人工智能算法,主要深耕于复杂网络中的表达学习和异常检测等问题。


编辑:助理编辑  / 审核:林坤  / 发布者:陈伟