科研学术

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
格拉斯哥学院本科生连发多篇高水平论文
文:吴迪一 来源:格拉斯哥学院 时间:2024-11-29 624

  近期,格拉斯哥学院本科生李晨希、朱凝、蒋懿辰、沈宣霖同学分别以第一作者在国际知名期刊IEEE Transactions on Industrial InformaticsIEEE Transaction on Instrument and Measurement和重要国际会议ICMMT发表多篇论文,电子科技大学均为第一作者单位。

  2021级电子信息工程专业的李晨希和清华大学王欢博士共同撰写的论文《Large-scale Visual Language Model Boosted by Contrast Domain Adaptation for Intelligent Industrial Visual Monitoring》于9月发表在工业信息领域顶级期刊IEEE Transactions on Industrial Informatics

  在现代工业中,制造过程日趋复杂和精细化,这对自动化、可靠性和安全性提出了更高要求。为此,工业视觉监控(IVM)结合了先进的视觉传感器和人工智能技术,用于监控和优化从生产线到关键基础设施的各个方面。近年来,大型视觉-语言模型(LVLMs)展现了卓越的语义理解和自然语言交互能力,为IVM提供了全新的解决方案。然而,预训练于通用领域的LVLMs缺乏IVM场景的特定知识,导致其在适应工业图像模式和专门文本语料方面存在不足。为了解决知识缺失问题,论文探索了LVLMs在专业IVM场景中的适应性,并提出了DefectGLM,这是一种创新的视觉-语言IVM解决方案(图1)。论文提出了首个大规模多模态晶圆数据集,作为模型领域泛化的可靠数据基础。此外,DefectGLM引入了一种简单而高效的两阶段适应策略,旨在弥补专业领域知识的不足。具体来说,在第一阶段,我们采用了基于LoRA的对比视觉适应,使DefectGLM能够适应特定的工业图像模式并提升图像建模能力。第二阶段则通过视觉语言指令微调,使DefectGLM与专业领域知识对齐,增强其执行指令和生成准确诊断响应的能力(图2)。通过这些策略的微调,DefectGLM成功适应了专业IVM场景。DefectGLM是首个基于大模型的晶圆图像识别模型,能够准确识别36种晶圆缺陷并提供相应的文本描述。DefectGLM为工业大模型的发展提供了一种全新的解决方案。

 图片2.png

图1 所提出的基于对比域适应的工业视觉监控大模型的架构

 图片3.png

图2 所提出的两个阶段的自适应调优策略

  2022级电子信息工程专业朱凝在清华大学王欢博士指导下撰写的论文《An Adversarial Training Framework Based on Unsupervised Feature Reconstruction Constraints for Crystalline Silicon Solar Cells Anomaly Detection》于9月发表在IEEE Transaction on Instrument and Measurement

  随着光伏发电的全球普及,晶体硅太阳能电池的缺陷对光伏系统的整体性能构成了严峻挑战,如何准确检测并区分正常与异常的电池成了业界亟待解决的问题。传统的监督学习方法依赖于大量标注数据,但在工业应用中,获取足够的异常样本困难且成本高昂。此外,传统方法在处理复杂的太阳能电池缺陷时表现有限,难以适应多样化和复杂的缺陷类型。在此背景下,论文基于流型假说提出一种新颖的对抗性隐层空间约束的太阳能电池板晶体硅图像异常检框架(图3),专为晶体硅太阳能电池的缺陷检测而设计,并在理论上从最大变分角度证明了隐层空间低维表征的约束作用。该框架通过对正常数据的特征分布进行无监督建模,利用高维图像空间和低维潜在空间的重建约束,准确识别异常特征。论文中引入了Gaussian Context Transformer(GCT)模块(图4),通过全局上下文信息的提取和多尺度特征的融合,显著提升了对复杂缺陷的检测性能。实验结果表明,该方法在实际EL图像数据集上的检测效果优于现有的深度学习方法,为光伏行业中晶体硅电池缺陷检测提供了高效可靠的无监督解决方案。

图片5.png

图3 所提出的基于流型假说的对抗性隐层空间约束异常检测框架

 图片6.png

图4 所引入的Gaussian Context Transformer模块

  2022级微电子科学与工程专业学生蒋懿辰在电子科学与工程学院唐红艳教授指导下撰写的论文《A High Gain Conformal Antenna Based on Hilbert Fractal for Capsule Endoscopy Application》于4月发表在ICMMT(重要国际会议),9月底成功被IEEE收录。

  研究表明,消化系统疾病已成为威胁人类健康的主要疾病之一,而内窥镜检查是最直接的医疗诊断方法。然而,传统的有线内窥镜诊断只能对部分胃肠道进行成像。这种系统可能会让患者感到不适,且有交叉感染的风险。因此,需要无线胶囊内窥镜(WCE)来解决这些问题。它可以将体内内窥镜捕捉到的数据图像传输到体外的接收器,无痛无创。论文通过HFSS仿真软件设计,为胶囊内窥镜应用提出了一种基于希尔伯特分形的具有高增益的宽带共形天线(图5)。该天线有效工作频段覆盖0.4GHz到3GHz,在肌肉仿真环境中的谐振频率为1.43 GHz时,其最大增益达到-18.4 dBi;并在项目中期优化中,增益达到-11.2dBi,是胶囊内窥镜应用的理想选择(图6)。

  图片8.png

图5 天线结构以及馈电点位置           

图片9.png

图6 |S11| & 增益图

  2022级通信工程专业学生沈宣霖在电子科学与工程学院唐红艳教授指导下撰写的论文《A Minkowski-like Broadband Capsule Antenna Based on Fractal Theory》于4月发表在ICMMT(重要国际会议),9月底成功被IEEE收录。

  随着电子通信技术和医疗技术的不断发展,植入式医疗系统具备了越来越多的诊断和治疗功能,尤其是可吞服的医疗设备在胃肠内窥镜检查中受到了广泛关注。因此,无线内窥镜系统(WCE)应运而生。天线作为实现体内WCE与体外接收设备之间可靠通信的必要设备,其性能直接影响WCE传输信号的质量。因此,开发一种性能优良的天线对提高WCE的安全性和稳定性具有重要意义。论文提出了一种基于分形理论的Minkowski类宽带胶囊天线。该天线结构以及馈电点如图7所示,在915 MHz的共振频率下最大增益为-24.0 dBi,在1.43 GHz时为-22.9 dBi,在2.45 GHz时为-19.3 dBi。其性能卓越,在工作频段内具有良好的回波损耗值和增益值(图8)。在实物加工并测试的时候,该天线在2.45GHz增益达到了-20.1dBi(图9)。

 图片11.png

图7 天线结构以及馈电点位置

 图片12.png

图8 |S11| & 增益图

图片13.png

图9 实物增益测试

  格拉斯哥学院致力于培养具有跨学科视野和前瞻思维的创新型人才,学院本科生在专业领域取得的成果不仅展现了学术潜力,也体现了学院在人才培养上的扎实基础和卓越成就。学院将持续推进科研与教育深度融合,全面提升科研育人成效。

 

  论文发表链接:

  1、Huan Wang、Chenxi Li(共一)、Yan-Fu Li,“Large-Scale Visual Language Model Boosted by Contrast Domain Adaptation for Intelligent Industrial Visual Monitoring,”https://ieeexplore.ieee.org/document/10666846

  2、Ning Zhu、Jing Wang、Ying Zhang、Huan Wang、Te Han,“An Adversarial Training Framework Based on Unsupervised Feature Reconstruction Constraints for Crystalline Silicon Solar Cells Anomaly Detection,”https://ieeexplore.ieee.org/document/10683727

  3、Yichen Jiang、Shengchen Yang 、Xuanlin Shen、Jiayi He、Hongyan Tang,“A High Gain Conformal Antenna Based on Hilbert Fractal for Capsule Endoscopy Application,”https://ieeexplore.ieee.org/document/1067243

  4、Xuanlin Shen、Jiayi He、Shengchen Yang、Yichen Jiang、Hongyan Tang,“A Minkowski-like Broadband Capsule Antenna Based on Fractal Theory,”https://ieeexplore.ieee.org/document/10672300

编辑:王晓刚  / 审核:李果  / 发布:陈伟