一种轻量级网络模型的多尺度热红外行人检测方法
A multi scale thermal infrared pedestrian detection method based on lightweight network model
  
DOI:
中文关键词:  热成像红外行人检测;轻量级网络;特征金字塔;多尺度训练
英文关键词:infrared pedestrian detection; lightweight network; feature pyramid network; multi scale training
基金项目:国家自然青年科学基金(61902194)、江苏省自然科学及高校自然科学重大项目(BK20170900,19KJB520046,20KJA520001)、江苏省创新创业人才项目及江苏博士后基金(2019K024)、江苏省六大人才高峰项目(JY02)、江苏省博士后研究实践创新项目(KYCX19_0921,KYCX19_0906)、之江实验室开放项目(2021KF0AB05)、南京邮电大学鼎山人才培养对象项目和南京邮电大学人才启动基金(NY219132)资助项目
作者单位
刘 强 南京邮电大学 计算机学院,江苏 南京 210023;南京邮电大学 高性能计算与大数据处理研究所,江苏 南京 210023 
姚小良 南京邮电大学 计算机学院,江苏 南京 210023;南京邮电大学 高性能计算与大数据处理研究所,江苏 南京 210023 
尤 帅 南京邮电大学 计算机学院,江苏 南京 210023;南京邮电大学 高性能计算与大数据处理研究所,江苏 南京 210023 
梅超君 南京邮电大学 计算机学院,江苏 南京 210023;南京邮电大学 高性能计算与大数据处理研究所,江苏 南京 210023 
刘尚东 南京邮电大学 计算机学院,江苏 南京 210023;江苏省无线传感网高技术研究重点实验室,江苏 南京 210023;南京邮电大学 高性能计算与大数据处理研究所,江苏 南京 210023;国家高性能计算中心南京分中心,江苏 南京 210023;江苏省高性能计算与智能处理工程研究中心,江苏 南京 210023 
季一木 南京邮电大学 计算机学院,江苏 南京 210023;江苏省无线传感网高技术研究重点实验室,江苏 南京 210023;南京邮电大学 高性能计算与大数据处理研究所,江苏 南京 210023;国家高性能计算中心南京分中心,江苏 南京 210023;江苏省高性能计算与智能处理工程研究中心,江苏 南京 210023 
亓 晋 南京邮电大学 计算机学院,江苏 南京 210023;南京邮电大学 高性能计算与大数据处理研究所,江苏 南京 210023 
摘要点击次数: 291
全文下载次数: 72
中文摘要:
      现有热红外行人检测算法存在网络参数众多、计算量大和小目标检测效果不佳的问题,针对这些问题,提出了一种轻量级行人目标检测算法。首先,该算法利用轻量级网络Resnext50作为骨干网络,实现检测网络的参数削减以及初始特征提取。其次,在模型中引入特征金字塔模块实现多尺度语义信息融合,并结合多尺度训练策略有效地提高了多尺度目标的检测效果。最后,在数据预处理部分引入图像原色填充策略,该策略有效地防止图像变换尺寸过程中出现的目标失真情况。在自建数据集和公开数据集上实验结果表明,此方法在速度和精度上均取得较好的性能,在自建数据集上mAP达到94.49%,比原SSD高出0.53%,而参数量少了近39%。
英文摘要:
      Existing thermal infrared pedestrian detection algorithms suffer from extra parameters, large computational efforts and poor detection performance for small targets. To address these problems, this paper proposes a lightweight pedestrian target detection algorithm. First, the algorithm uses the lightweight network Resnext50 as the backbone network to realize parameter reduction and initial feature extraction. Second, the feature pyramid module is introduced to achieve multi scale semantic information fusion, and combined with a multi scale training strategy to effectively improve the detection of multi scale targets. Finally, the image primary color filling strategy is introduced in the data preprocessing. It can effectively prevent the target distortion during size transformation for the image. Experimental results on both the self built and public datasets show that this method achieves better performance in terms of speed and accuracy: it outputs an mAP of 94.49% on the self built dataset, 0.53% higher than that of the original SSD, while retaining nearly 39% less parameters.
查看全文  查看/发表评论  下载PDF阅读器

你是第3088270访问者
版权所有《南京邮电大学学报(自然科学版)》编辑部
Tel:86-25-85866913 E-mail:xb@njupt.edu.cn
技术支持:本系统由北京勤云科技发展有限公司设计