SAR(合成孔径雷达)图像解译领域新进展。
原标题:首个公开发表的SAR图像目标识别基础模型!国防科大刘永祥&刘丽教授团队提出SARATR-X 1.0
文章来源:机器之心
内容字数:8929字
国防科技大学团队突破SAR目标识别瓶颈,打造首个公开SAR图像目标识别基础模型SARATR-X
合成孔径雷达(SAR)目标识别是SAR图像智能解译的核心,但面临技术和生态两大挑战。技术层面,现有方法多为有监督、静态、单任务的,导致计算冗余、泛化能力不足等问题;生态层面,缺乏高质量的开源数据和评估基准。为解决这些问题,国防科技大学刘永祥&刘丽教授团队研发了首个公开发布的SAR图像目标识别基础模型SARATR-X 1.0,并构建了相应的开源数据集和评估基准,为SAR图像解译领域技术创新和发展生态带来了突破。
1. SARATR-X 1.0的核心技术突破
SARATR-X 1.0在技术层面取得了多项突破:首先,它率先开展了基于自监督学习的SAR目标特征表示学习,创新性地提出了SAR-JEPA框架,该框架仅预测SAR图像稀疏且重要的梯度特征表示,有效抑制了相干斑噪声。其次,SARATR-X 1.0(0.66亿参数,基于Transformer架构)突破了对大规模高质量标注数据的依赖,大幅提升了预训练基础模型的认知能力。 该模型采用HiViT架构,能够更好地处理遥感图像的空间表示,尤其针对大图像中的小目标。
2. 构建完善的SAR目标识别开源生态
在生态层面,团队致力于构建良好的开源生态:规范和整合已有公开数据集,形成较大规模SAR图像陆海目标识别数据集SARDet-180K;构建了新的SAR车辆目标识别数据集NUDT4MSTAR(40种车辆型号,规模超过同类型数据集十倍);并开源相关的目标识别算法代码和评估基准。
3. SARATR-X 1.0的性能及可扩展性
SARATR-X 1.0在多个下游目标识别任务(包括小样本目标识别、稳健目标识别、目标检测等)上取得了国际先进或领先水平。例如,在细粒度车辆MSTAR数据集中,其目标分类性能优于现有的SSL方法,提升了4.5%。在目标检测方面,平均提升约4%。研究团队还对模型的可扩展性进行了研究,结果表明,随着数据和参数量的增加,下游任务性能显著提升,展现了良好的可扩展性。
4. 未来的发展方向
团队正在研制SARATR-X 2.0,预计参数规模将达到3亿,SAR目标切片样本规模200万,并将收集的数据形成开源数据集,进一步服务生态建设。
5. 研究成果的影响
该团队的代表性工作已引起国内外同行的广泛关注,获得积极评价,被国际顶级学术期刊《IEEE Transactions on Image Processing》和《ISPRS Journal of Photogrammetry and Remote Sensing》录用或发表。 国际同行对其工作给予了高度评价,例如ISPRS Journal主编Clement Mallet认为SAR-JEPA首次将联合嵌入预测框架概念应用于对地观测,并专门用于SAR数据。
联系作者
文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台
转载请注明:首个公开发表的SAR图像目标识别基础模型!国防科大刘永祥&刘丽教授团队提出SARATR-X 1.0 | 86AIGC导航