科研学术

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
英才学院本科生在数据库著名会议DASFAA上发表论文
文:张进 图:曾晟来 来源:英才学院 时间:2022-01-28 20081

   近日,英才学院2019级本科生曾晟来在信通学院虞红芳教授指导下,以第一作者身份撰写的论文 “Heterogeneous Federated Learning via Grouped Sequential-to-Parallel Training” 被第27届数据库系统高级应用国际会议(27th International Conference on Database Systems for Advanced Applications,DASFAA 2022)接收。会议将于2022年4月11日线上举行,届时曾晟来将在会议上展示并交流其学术成果。虞红芳教授是该论文的通讯作者,李宗航博士为共同第一作者,论文的部分工作在新加坡南洋理工大学完成,合作者包括哈尔滨工业大学徐增林教授、新加坡南洋理工大学Dusit Niyato教授(IEEE Fellow)和于涵教授。

  DASFAA是数据库/数据挖掘领域的国际知名会议(CCF-B类),目前已经举办27届。该会议旨在展示数据库系统及其应用中最先进的研发活动,为数据库研究人员、开发人员等提供技术演示和讨论。

1046e01b23794e1b927505a40a85b7b3_f45c5.p

图一:FedGSP

b0724d0b8e6adc1230768511534b825a_f45c5.p

图二:串行-并行训练模式

       联邦学习(FL)是一种保护用户隐私的分布式机器学习范式,是针对数据孤岛问题的主流解决方案,近来得到业界广泛关注。在实际的联邦学习系统中,用户间的数据往往存在异构性,如果处理不当,则会导致模型性能下降。

  针对数据异构性的挑战,该论文引入一种串并转换协同训练的新概念,提出了一种对数据异构具有鲁棒性的FL方法,FedGSP。FedGSP包括一种新型的串行-并行转换的训练模式(Sequential-to-Parallel Training,STP),一套支持串并协同训练的训练架构,一种基于质心定理(centroid equivalence theorem)的快速分组方法。在FedGSP中,用户以最小化组间分布距离的原则分配到具有同构性的各组中,随着训练过程的进行,FedGSP按照预设的并行度增长曲线,通过增加组数来提高训练的并行度。实验结果表明,与现有方法相比,FedGSP至少提高了 3.7% 的准确率,并将训练时间和通信开销减少了 90% 以上。

  英才学院从2020年起开展“学术领航计划”,为全面提升学术科研氛围,进一步激发大一、大二学生的科研好奇,引领学生学术梦想,培养学生的科研素养,提高综合科研能力,面向全校招聘优秀博士生担任领航导师,共同指导学生步入科学研究。得益于该计划,曾晟来同学加入了智慧网络团队进行科研训练,在虞红芳教授和李宗航博士的指导下进行联邦学习底层架构设计和效率优化相关研究。目前他已经申请1项国家专利(第一发明人),发表论文1篇(第一作者),第一负责人完成大学生创新创业项目并以优秀结题(其中项目组成员均来自参与学术领航计划的2019级英才本科生)。


编辑:林坤  / 审核:林坤  / 发布:林坤

"