近日,国际人工智能顶尖会议The 39th Annual AAAI Conference on Artificial Intelligence (AAAI 2025) 论文录用结果揭晓,由清华大学及凌云光知识理性研究院合作的论文《通过自感知调优的SAM可调异常分割》(Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning)成功入选,团队创新性地提出自感知调优方法,在少量异常样本下实现高效精准的异常分割,在锂电、3C电子等行业具有广泛应用潜力。
AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。AAAI 2025竞争异常激烈,这次会议共收到破纪录的12,957篇有效投稿,最终仅录用了 3,032篇论文,录用率为 23.4%。
本次入选论文聚焦于使用Segment Anything Model(SAM)进行异常分割。SAM在分割任务中展现了强大的泛化能力,尤其是在自然图像处理领域取得了显著的进步,但在工业场景中的应用却面临着一系列挑战,如领域偏移(工业图像与自然图像差异大,导致现有模型无法准确适应工业场景)、样本稀缺(异常样本数量有限,训练数据不足)、标注困难和成本高(工业异常样本难以标注且需要大量专家参与),导致现有的缺陷检测算法在实际应用中难以提供准确和高效的解决方案。
研究团队提出了自感知调优(Self-Perception Tuning, SPT)方法,通过粗略的初步识别和精细修正相结合的过程,并增强了模型对异常区域间关系的感知,提高了SAM在面对领域偏移时的适应性。同时,SPT减少了对大量人工标注数据的需求,进而降低了成本。实验结果显示,SPT方法在多个公开工业数据集上表现出色,成功克服了工业场景中的多重挑战,显著提升了在少样本情况下的异常分割精度。
自感知调优(SPT)方法框架概述
凌云光深耕“视觉+AI”技术,早在2008年便推出了自研底层算法平台VisionWARE,性能与全球领先企业对标。在2022年建立了面向工业领域的通用大模型F.Brain,并广泛应用于3C、新能源、立体视觉、印刷、新型显示等多个行业,助力头部客户解决难题。本论文是基于凌云光LVM视觉大模型在缺陷检测领域的最新探索,在缺陷检测领域应用并发挥LVM大模型强大的泛化能力,提升工业缺陷分割的性能。
随着人工智能等技术的飞速发展,产业界与学术界的深度合作正变得愈发重要。凌云光一直致力于推动科技与产业的融合,未来将继续深化产学合作,围绕视觉AI、智能制造、工业互联网等领域深耕细作,将前沿的科研成果转化为切实可行的解决方案。
$凌云光(SH688400)$
本文作者可以追加内容哦 !