近日,计算机(网安)学院赵志为教授团队在计算机体系结构领域顶级国际会议European Conference on Computer Systems(EuroSys’26)上发表题为《GeDES: GPU-Driven Discrete Event Network Simulator》的最新研究成果。计算机(网安)学院2022级博士生李芹涌为第一作者,电子科技大学为唯一第一完成单位,指导教师为计算机(网安)学院赵志为教授和闵革勇教授。
该研究在大规模网络仿真GPU加速方面取得重要突破,较现有NS3等方法实现了33–2400 倍的性能提升,可用于包含分布式大模型训练在内的各类大规模网络系统的高效仿真验证。EuroSys 是系统研究领域最具影响力的国际会议之一,本届会议录用率仅为16.9%,全球仅收录79篇,代表了体系结构领域的最新前沿进展。
离散事件仿真器(Discrete Event Simulator,DES)是网络系统研究中的核心工具。然而,传统仿真器在运行效率与扩展能力方面存在显著瓶颈,严重制约了网络研究的实验效率。例如,使用经典仿真工具 NS-3 模拟仅 1 秒的网络行为,往往需要接近 68 小时的计算时间。
针对这一问题,论文指出 DES 的根本瓶颈在于 CPU 并行能力有限,而GPU的SIMT指令架构与DES事件依赖与多样性存在天然矛盾。为此,作者团队首次提出了一种基于 GPU 的离散事件网络仿真框架 GeDES,通过重新编排DES仿真事件,充分释放 GPU 的大规模并发能力,显著加速仿真过程。
论文突破了传统以时间推进为核心的仿真模式,提出了一种基于因果一致性的全新驱动机制,使 DES 能够高效映射到 GPU 并行架构之上。同时,针对 GPU 在实际应用中的关键挑战,论文通过重构 DES 的内存管理模型缓解显存容量限制,并设计启发式负载均衡算法以解决计算核心间负载不均问题,从而最大化 GPU 的计算效率。
论文GeDES的系统框架
实验结果表明,GeDES 显著提升了离散事件仿真的效率。与当前最先进的仿真工具 NS-3、Unison 和 DONS 相比,其仿真完成时间实现了 33–2400 倍的加速,同时支持的仿真规模提升了 2.2–13.5 倍。此外,GeDES 已通过 ACM 严格的可复现性评测(Artifact Evaluation),并获得全部三个官方徽章(badges),相关源代码也已全面开源,为网络系统研究社区提供了重要支撑。
欧洲计算机系统国际会议European Conference on Computer Systems(简称 EuroSys)是计算机系统领域最具影响力的国际学术会议之一,由 ACM操作系统特别兴趣小组SIGOPS(Association for Computing Machinery Special Interest Group on Operating Systems)主办,长期推动操作系统、分布式系统、存储系统、计算机体系结构以及云计算等方向的发展。该会议创办于 2006 年,旨在为系统研究领域提供高水平的国际交流平台,现已发展为每年举办一次的旗舰会议。在学术评价体系中,EuroSys 被中国计算机学会(CCF)推荐为 A 类国际学术会议(“计算机体系结构”方向),在全球计算机系统结构研究领域具有重要影响力。