Please wait a minute...
在线办公
优先发表

当期目录

    2021年 第48卷 第5期 刊出日期:2021-10-20
      
    面向智慧监控的视觉感知与理解专题序言
    高新波,王楠楠,梁荣华,郑伟诗,徐迈,卢策吾,宋一哲,韩军功
    2021, 48(5):  1-7.  doi:10.19665/j.issn1001-2400.2021.05.001
    摘要 ( 787 )   HTML ( 1185 )   PDF (1125KB) ( 552 )   收藏
    参考文献 | 相关文章 | 多维度评价
    一种多尺度三维卷积的视频超分辨率方法
    詹克羽,孙岳,李颖
    2021, 48(5):  8-14.  doi:10.19665/j.issn1001-2400.2021.05.002
    摘要 ( 559 )   HTML ( 81 )   PDF (2074KB) ( 328 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    视频超分辨率技术可由低分辨率视频获得高分辨率视频,有效提升视频的显示效果。与单幅图像超分辨率不同,如何利用相邻视频帧之间的信息在视频超分辨率中则显得十分重要。为改善视频超分辨率重建的性能,充分利用视频帧的时间-空间相关性,提出一种基于多尺度三维卷积的视频超分辨率模型。该模型输入连续的多帧视频图像,输出中间帧的超分辨率重建结果,包括多尺度特征提取、特征融合以及高分辨率重建3个模块。首先,使用多尺度的三维卷积进行初步特征提取;然后,使用三维卷积残差结构进行特征融合,并将特征图进行通道分离,在融合不同尺度的特征时,有效地减少了网络的参数量;最后,使用多个残差密集连接块和亚像素卷积进行高分辨率重建,并结合全局残差连接得到重建的高分辨率视频图像。Vid4数据集上3倍和4倍超分辨率放大的实验结果表明,与其他已有方法相比,该方法可有效提升峰值信噪比和结构相似性性能,取得较好的视觉效果。

    一种自适应权重学习的轻量超分辨率重建网络
    张宇浩,程培涛,张书豪,王秀美
    2021, 48(5):  15-22.  doi:10.19665/j.issn1001-2400.2021.05.003
    摘要 ( 584 )   HTML ( 59 )   PDF (2445KB) ( 214 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    近年来,基于深度卷积神经网络的单幅图像超分辨率重建方法取得了令人瞩目的成果。基于像素级注意力网络的图像超分辨率重建方法能够在极小的参数量下获得良好的重建性能,是目前最先进的轻量化超分辨率重建方法之一。但是,受到各模块参数量的限制,像素级注意力网络训练缓慢和收敛条件苛刻的问题变得日益突出。针对这些问题,提出了一种基于自适应权重学习的轻量化超分辨率重建网络。该网络使用多个自适应权重模块组成非线性映射网络,每个模块能够提取到不同层级的特征信息,在每个自适应权重模块中,利用注意力分支和无注意力分支分别获取相应信息,再通过自适应权重融合分支进行整合。使用特定的卷积层拆分和融合两条分支,大幅降低了注意力分支和无注意力分支的参数量,使网络在参数量与性能之间达到相对平衡。在标准数据集上的实验证明,所提出方法在降低模型参数量的同时,峰值信噪比和结构相似度两种客观质量评价指标均优于同类先进方法,该方法能够重建更准确的纹理细节,得到更好的视觉效果,证明了该方法的有效性。

    一种生成对抗网络的遥感图像去云方法
    王军军,孙岳,李颖
    2021, 48(5):  23-29.  doi:10.19665/j.issn1001-2400.2021.05.004
    摘要 ( 1114 )   HTML ( 58 )   PDF (2237KB) ( 263 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    遥感图像在获取过程中会受到气候等因素的影响,导致得到的图像包含云层信息,在很大程度上影响了遥感图像的后续使用。基于深度学习的图像去云方法可以较好地移除云层,但已有方法存在训练时间长,去云效果不充分和颜色失真等问题。针对这些问题,提出了一种端到端生成,对抗网络模型对遥感图像去云,可以从含有云层的遥感图像中恢复出清晰的原始图像。首先,使用U-Net网络作为生成器的主要结构,并在编码模块和解码模块中间加入连续记忆残差模块来挖掘输入信息的深度特征;然后,使用卷积神经网络作为判别器来判别输入数据的真伪;最后,联合对抗性损失函数和L1损失函数,通过计算网络模型的输出与真实数据之间的差距,来衡量网络模型预测的优劣。实验结果表明,该方法在定量指标(峰值信噪比和结构相似性)和运行时间上均优于现有的去云方法,并且在参数量一致的条件下,计算量GFLOPs最低,具有更低的算法复杂度。此外,该方法得到的遥感图像细节信息更丰富,颜色几乎没有失真,具有更好的主观视觉效果。

    维度情感模型下的表情图像生成及应用
    杨静波,赵启军,吕泽均
    2021, 48(5):  30-37.  doi:10.19665/j.issn1001-2400.2021.05.005
    摘要 ( 297 )   HTML ( 26 )   PDF (1881KB) ( 92 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    为了解决基于深度学习的人脸表情识别所需训练数据包含表情类别有限且训练数据规模不均衡的问题,提出了Arousal-Valence维度情感空间中基于生成对抗网络的表情图像生成方法AV-GAN,用于生成更多样且均衡的表情识别训练数据。该方法使用标记分布表示表情图像,通过引入身份控制和表情控制模块,以及对抗学习方法实现在Arousal-Valence空间中随机采样和生成表情图像。在Oulu-CASIA数据库上的评估实验显示,使用本文方法对训练数据进行数据增强比使用原训练数据的表情识别准确率可提升6.5%,证明了该方法能有效地提升非均衡训练数据下的表情识别准确率。

    改进DeeplabV3+的火焰分割与火情分析方法
    宁阳,杜建超,韩硕,杨传凯
    2021, 48(5):  38-46.  doi:10.19665/j.issn1001-2400.2021.05.006
    摘要 ( 324 )   HTML ( 24 )   PDF (2454KB) ( 101 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    火焰检测与火势发展分析对火情的控制十分重要。提出一种改进DeeplabV3+的火焰分割与火情分析方法:首先在DeeplabV3+的解码器部分增加低层特征来源,将其与高层特征融合后采用2倍上采样逐步恢复图像尺寸,保留更多的细节信息,实现更加准确的火焰分割;然后将火焰视频每帧分割得到的像素数组成火势发展序列,基于关键点对序列进行分段和线性拟合,获取火势发展的关键趋势。实验结果表明,所提方法可以在对火焰进行准确分割的基础上,有效地分析火情发展态势,为火情的检测与控制提供有效的帮助。

    采用神经网络架构搜索的遥感影像分割方法
    周鹏,杨军
    2021, 48(5):  47-57.  doi:10.19665/j.issn1001-2400.2021.05.007
    摘要 ( 370 )   HTML ( 34 )   PDF (4115KB) ( 104 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    由于传统的深度卷积神经网络分割高分辨率遥感影像需人工设计网络架构,过度依赖专家经验,耗时费力,且网络泛化能力较差,因此,提出一种资源平衡型部分通道采样的神经网络架构搜索方法。首先,在网络架构参数中添加资源平衡项,提升搜索算法稳定性,同时减小剪枝过程中产生的更新不平衡和离散化误差;其次,选择部分通道进行搜索空间的混合操作,以节省计算资源,提升搜索效率,缓解网络过拟合;最后,根据高分辨率遥感影像地物复杂、分布离散及空间范围广等特点,引入Gumbel-Softmax Trick方法从非连续概率分布进行采样,以提高采样效率。在WHUBuilding数据集上MIoU语义分割评价指标达到90.93%,在GID数据集上MIoU语义分割评价指标达到69.53%,优于SegNet、U-Net、Deeplab v3+、NAS-HRIS等网络模型。实验结果表明,新方法能高效地自动搜索出分割高分辨率遥感影像的网络架构,具有分割精度高、计算资源占用率低的特点。

    采用元学习的多场景教室学生姿态检测方法
    钱志华,高陈强,叶盛
    2021, 48(5):  58-67.  doi:10.19665/j.issn1001-2400.2021.05.008
    摘要 ( 264 )   HTML ( 26 )   PDF (3041KB) ( 80 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对不同教学场景图像的数据分布差异较大造成的跨域偏移问题,提出了一种采用元学习的多场景学生姿态检测方法。该方法设计了姿态检测元模型和一种参数可学习的域适应优化器。通过离线学习和在线学习相结合的方式,实现特定教学场景姿态检测模型的快速域适应。离线学习阶段,该方法通过双层训练模拟姿态检测模型在各类教学场景上域适应的过程,对姿态检测元模型以及域适应优化器参数进行训练;在线学习阶段,只需特定教学场景下少量有标签的样本数据,元模型就能在域适应优化器的引导下快速适应该场景的数据分布。另外,在离线学习阶段,还提出了一种能使双层训练更加稳定的外部优化器。实验结果表明,该方法在多场景姿态检测数据集上的综合检测精度要优于目前主流的目标检测模型,对有标签图像较少的新场景也有较好的域适应效果。

    一种复杂监控场景下的人体检测算法
    张书伟,李俊民
    2021, 48(5):  68-77.  doi:10.19665/j.issn1001-2400.2021.05.009
    摘要 ( 2139 )   HTML ( 106 )   PDF (2697KB) ( 93 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    在工业视频监控场景中,由于复杂背景、人体多姿态和人体遮挡等因素的影响,现有人体检测算法存在着准确率不高、模型泛化能力不强等显著问题。针对以上问题,基于特征图像金字塔和多尺度感受野理论,设计了一种检测网络的特征融合方式和特征图的生成策略,依靠轻量级的特征图像金字塔技术,并结合数据增强、锚点框匹配策略和遮挡损失函数等优化方法,进而提出了一种基于深度神经网络的人体检测算法EFIPNet。同时,为了充分验证EFIPNet算法的有效性,共建立了4个多元化的复杂监控场景下的人体数据集,其中涉及50种常见的人体行为。算法的有效性验证表明,新设计的高效人体检测算法可以有效地提高人体目标的检测精度,实现复杂监控场景下的人体精确和实时检测。此外,为了验证EFIPNet算法中不同模块的有效性,采用消融研究方法分析了网络中主要模块对人体检测模型性能的影响。在Person数据集上,EFIPNet算法在保持45帧/s检测速度的同时,相比于单发多盒检测器检测算法,将人体目标的检测精度提升了4.34%。

    一种LSTM与CNN相结合的步态识别方法
    戚艳军,孔月萍,王佳婧,朱旭东
    2021, 48(5):  78-85.  doi:10.19665/j.issn1001-2400.2021.05.010
    摘要 ( 435 )   HTML ( 34 )   PDF (1465KB) ( 148 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对行人运动过程中拍摄视角、外观变化等因素对步态识别的影响,提出一种长短时记忆网络与卷积神经网络相结合的步态识别方法。该方法首先使用人体三维姿态估计直接获得人体关节的三维坐标;然后根据三维空间中关节之间的周期性运动约束关系,从时间和空间两个维度构建视角鲁棒的三维步态约束模型。其中,模型中的运动约束矩阵用于表征关节运动及人体结构的时序约束特征;动作特征矩阵用于表征关节位移的空间约束特征。接着针对所构建的三维步态约束模型的特点,设计了长短时记忆网络与卷积神经网络相结合的并行网络,学习运动约束矩阵和动作特征矩阵中的步态时空特征。最后,在多视角步态数据库CASIA-B中对网络模型进行了评估。实验结果表明,该方法的识别率高于一些经典的方法,而且在视角变化较大的情况下,识别率没有显著下降,说明构建的步态模型对视角变化具有较高的鲁棒性。

    一种利用背景光流特征的虚假人脸检测方法
    孔月萍,刘楚,朱旭东
    2021, 48(5):  86-91.  doi:10.19665/j.issn1001-2400.2021.05.011
    摘要 ( 235 )   HTML ( 25 )   PDF (1510KB) ( 52 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    人脸识别系统会受到照片视频的虚假人脸攻击,但手持照片、视频攻击存在抖动现象,以光流表征运动信息,提出一种利用背景光流特征的假人脸检测方法。该方法聚焦真实人脸背景与虚假人脸背景之间的运动差异性,分析人脸外区域的光流角度分布,背景对比区的运动状况,通过评估对比区的运动一致性虚假人脸。新方法在公开数据集ReplayAttack和CASIA-FASD中的测试准确率分别为97.87%和 90.95%,可有效甄别含背景区手持照片视频的虚假人脸攻击。

    采用空洞卷积的多尺度融合草图识别模型
    杨云航,闵连权
    2021, 48(5):  92-99.  doi:10.19665/j.issn1001-2400.2021.05.012
    摘要 ( 300 )   HTML ( 20 )   PDF (1044KB) ( 58 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对现有的基于深度学习的草图识别方法大多将普通卷积作为草图特征提取的主要手段。而忽略了草图对象的稀疏性特点,提出了一种通过空洞卷积实现草图特征提取的草图识别模型。该模型将空洞卷积和普通卷积融合,利用空洞卷积不增加卷积核有效单元数量即可扩大感受野的特性,实现对草图结构特征的初步提取。考虑到空洞卷积的稀疏采样方式使得远距离卷积得到的信息之间没有相关性,对分类结果会产生影响,于是在使用空洞卷积对图像特征进行稀疏提取的同时,使用具有相同大小感受野的普通卷积对输入图像特征进行密集提取,最后将两种不同卷积方式输出的特征在通道维度上进行拼接。这种方法不仅发挥了空洞卷积的稀疏采样特性,也充分利用到不同卷积方式带来的多尺度信息优势。实验结果表明,该模型在TU-Berlin SKetch数据集取得了72.6%的识别准确率,相较于目前主流的草图识别方法,效果更加明显。

    一种基于局部表征的面部表情识别算法
    陈昌川,王海宁,黄炼,黄涛,李连杰,黄向康,代少升
    2021, 48(5):  100-109.  doi:10.19665/j.issn1001-2400.2021.05.013
    摘要 ( 402 )   HTML ( 20 )   PDF (4059KB) ( 102 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    表情是人类内心情感变化的重要体现。当前表情识别方法通常依赖面部全局特征进行处理,忽略局部特征提取。心理学家指出,不同面部表情对应不同的局部肌肉运动区域,以此为动机,提出一种基于局部表征的表情识别算法,简称EAU-CNN。为提取面部的局部特征,该文首先根据获取的人脸68个特征点将整体面部图像划分成43个子区域,随后选择肌肉运动区域与面部显著器官所覆盖的8个局部候选区域作为卷积神经网络的输入。为均衡局部候选区域的特征,EAU-CNN采用8个并行的特征提取分支,每个分支支配不同维全连接层。分支的输出按照注意力自适应地连接,以突出不同局部候选区域的重要程度。最后经Softmax函数,将表情分为中性、愤怒、厌恶、惊讶、高兴、悲伤和恐惧七类。该文在CK+、JAFFE、自定义大型FED数据集上对算法进行了评估实验,所提算法平均准确率分别为99.85%、96.61%、98.29%。该评价指标超过S-Patches算法6.01%、10.17%、6.09%,结果表明局部表征能够提升表情识别性能。

    注意力机制的多尺度单目标跟踪算法
    宋建锋,苗启广,王崇晓,徐浩,杨瑾
    2021, 48(5):  110-116.  doi:10.19665/j.issn1001-2400.2021.05.014
    摘要 ( 473 )   HTML ( 84 )   PDF (2181KB) ( 99 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    在单目标跟踪过程中,由于存在目标遮挡、目标消失、相似目标干扰等问题,导致算法错误跟踪目标,跟踪精度下降,并且错误的结果将会参与到模型更新中,使得跟踪精度进一步下降。针对这一问题,提出了基于注意力机制的多尺度单目标跟踪算法。该算法使用Inception网络非对称卷积思想,在增加多尺度卷积核的同时减少参数量,非对称卷积可以有效地结合局部特征和全局特征,提高跟踪的鲁棒性。在模型参数更新阶段,采用基于注意力机制的网络在线更新算法,结合每一帧的结果响应图和注意力响应图计算得到该帧的跟踪结果得分,从而在模型更新时剔除不包含目标的视频帧,强化了网络对目标和背景的判别能力,使网络能够快速学习到目标的外观变化,提高算法对目标的跟踪能力。在实验部分,将该算法在OTB-100数据集与其他先进的跟踪算法进行对比,在准确率和成功率方面相较ATOM算法分别有0.9%和0.8%的提升,提升精度的同时也更容易找回丢失的目标。

    一种小型四轴飞行器目标跟踪控制算法
    顾兆军,陈辉,王家亮,高冰
    2021, 48(5):  117-127.  doi:10.19665/j.issn1001-2400.2021.05.015
    摘要 ( 299 )   HTML ( 24 )   PDF (4933KB) ( 73 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    为了提高利用四轴飞行器单目摄像头传回的图片帧执行目标跟踪任务时的实时性和稳定性,提出一种基于注意力模型的图片帧预处理和基于反馈控制的四轴飞行器姿态调整的算法。首先,通过注意力模型对四轴飞行器采集到的视频图像进行预处理,选出对跟踪结果贡献度较大的部分帧;其次,将图像预处理阶段选出的图片帧进一步处理,得到选框像素点的位置偏差和面积偏差,记作反馈控制的误差;最后,通过反馈控制,将该误差与四轴飞行器的电机转速相转化,并将电机转速控制指令发送给飞行器,使其及时作出偏航和前后移动的姿态调整。通过在特洛(Tello)飞行器平台上的实际飞行验证,实验结果表明,所提出的目标跟踪算法在图像处理实时性和飞行器飞行稳定性两方面都有提升。所提出的算法可为四轴飞行器图像处理应用提供有力的技术支持。

    一种深度融合机制的遥感图像目标检测技术
    董如婵,焦李成,赵进,沈维燕
    2021, 48(5):  128-138.  doi:10.19665/j.issn1001-2400.2021.05.016
    摘要 ( 360 )   HTML ( 28 )   PDF (4449KB) ( 75 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    遥感图像覆盖幅面广、纹理信息丰富,其目标具有尺寸多样性,排列密集且与背景易混淆等特性,给快速定位和精准识别目标带来较多困难,尤其是易漏检小目标等。针对此问题,提出一种深度融合机制的遥感图像目标检测技术。该技术基于深度卷积神经网络,将多尺度、注意力机制与宽度学习三者融合,用于遥感图像目标检测技术。该技术首先基于多尺度与空间注意力机制获取到遥感图像的候选区域信息,然后采用通道注意力机制获取其多个尺度的特征信息并融合互补,旨在有效聚焦图像深层的高层语义信息和底层的小目标特征信息;最后,针对宽度学习存在超参数的确定需要依据不同的遥感图像,进行手工调参问题,提出基于贝叶斯网络搜索优化策略的宽度学习方法。该方法可智能地学习到一组适应于不同遥感图像数据集的超参数,对目标进行高效识别。实验结果证明,与当前先进的方法相比,该算法能够有效解决遥感图像目标检测中速度慢、精度低、易丢失小目标等问题,提升目标检测的准确率。

    一种利用贝叶斯优化的弹道目标微动分类网络
    李鹏,冯存前,许旭光,唐子翔
    2021, 48(5):  139-148.  doi:10.19665/j.issn1001-2400.2021.05.017
    摘要 ( 208 )   HTML ( 20 )   PDF (2729KB) ( 55 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    弹道目标识别在现在的军事反导系统中具有重要作用。不同的弹道目标由于其运动特征的不同会呈现出不同的微动特征,因此在弹道目标的识别中,微动特征被广泛应用。在弹道目标的微动特征分类中,卷积神经网络因为其优异的分类能力而被广泛应用。在卷积神经网络框架中,神经网络相关的超参数和结构通常与被处理的任务性质相关,不同的任务需要设置不同的超参数和不同的网络架构使卷积神经网络的识别效果达到最优。人工选择适合弹道目标微动分类的网络超参数和结构需要足够的人力经验和大量的计算时间,而且并不总能得到最优的参数。针对这个问题,提出用贝叶斯优化算法来自动获取应用于弹道目标微动分类的卷积神经网络的超参数和最优结构的方法,以提高神经网络对微动特征的分类性能。仿真结果表明,与基于迁移学习的神经网络和传统的方法相比,贝叶斯优化算法得到的卷积神经网络模型具有良好的识别效果和鲁棒性,能够精准地对不同微动特征下的信号进行分类与识别。

    响应差异约束的相关滤波无人机目标跟踪算法
    王海军,张圣燕,杜玉杰
    2021, 48(5):  149-155.  doi:10.19665/j.issn1001-2400.2021.05.018
    摘要 ( 246 )   HTML ( 20 )   PDF (9711KB) ( 55 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对无人机视频中跟踪目标易受到形变、背景杂乱等问题的困扰,提出一种新颖的基于响应差异约束的相关滤波无人机目标跟踪算法。该方法根据滤波器在前后帧间变化的一致性,建模不同滤波器基于同一训练样本的响应差异,建立目标函数的约束机制,准确学习目标的外观变化,提升滤波器的鲁棒性;同时引入辅助变量构建优化函数,采用交替求解算法将计算目标问题转化为求滤波器和辅助变量的最优解。将文中算法与其他11种算法在DTB70、UAV123@10fps和UAVDT等3个无人机视频数据库上进行跟踪仿真。实验结果表明,所提算法在跟踪准确度和成功率两个指标上均好于其他算法,且在无人机视角复杂环境下,对光照变化、形变、遮挡和运动模糊等挑战性属性均具有良好的鲁棒性,同时平均速度达到21.7帧/秒,能够满足无人机目标跟踪的实时性需求。

    改进YOLOv3的快速遥感机场区域目标检测
    韩永赛,马时平,何林远,李承昊,朱明明,张飞
    2021, 48(5):  156-166.  doi:10.19665/j.issn1001-2400.2021.05.019
    摘要 ( 410 )   HTML ( 93 )   PDF (4992KB) ( 86 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    遥感机场区域目标的检测有很大的军事意义和民用意义。为了取得快速且精确的检测效果,自主构建了更加符合具体任务的数据集;以一步回归全局检测为基础框架,针对数据集中类别分布不均衡问题,提出使用生成的方法用生成对抗网络进行有针对性的数据扩充,以获得具有领域变换特性、类数据分布更为均衡的数据集。同时,使用改进的双权重特征金字塔网络检测部件,来融合得到深层次可区分性的更加鲁棒的特征。实验结果表明,相比原网络,改进网络带来了4.98%的多类目标平均检测精确度以及8.33%的平均交并比的提升,分别达到了89.07%的多类目标平均检测精度以及61.97%的平均交并比。此外,改进网络的平均检测时间为0.062 5 s,相比类似检测率的RetinaNet-101网络速度约快5.3倍,体现了该网络的有效性以及对具体任务的实用性。

    空间可靠性和相关滤波器联合学习的跟踪算法
    张飞,马时平,张立朝,何林远,仇祝令,韩永赛
    2021, 48(5):  167-177.  doi:10.19665/j.issn1001-2400.2021.05.020
    摘要 ( 227 )   HTML ( 19 )   PDF (4333KB) ( 51 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    判别式相关滤波器采用循环移位产生负样本的方式不可避免带来了边界效应。基于背景感知的相关滤波跟踪算法试图利用裁剪矩阵获取更多真实的负样本,既有效缓解了边界效应的影响,又增强了对背景信息的学习。然而,裁剪矩阵的使用缺乏对空间不同位置可靠性的学习,可能会导致背景信息对滤波器的学习占据主导地位。为解决该问题,将空间可靠性的学习引入相关滤波算法中,通过交替方向法与滤波器进行联合迭代求解,加强了滤波器对空间可靠性区域的学习,增强了滤波器的对目标与背景的判别力。此外,为优化模型更新策略,提出了一种基于感知哈希算法的自适应模型更新方法,提升了滤波器学习的有效性。所提出的算法在标准视觉跟踪数据集上进行了全面评估,验证了该算法在性能上的有效性以及实时性。

    面向高速公路的车辆视频监控分析系统
    毛昭勇,王亦晨,王鑫,沈钧戈
    2021, 48(5):  178-189.  doi:10.19665/j.issn1001-2400.2021.05.021
    摘要 ( 209 )   HTML ( 18 )   PDF (3933KB) ( 47 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    随着视频监控技术在道路安全应用的迅猛发展,为实现高速公路智能化管理,提出一套面向高速公路的车辆视频监控分析系统。通过对监控视频流中的车辆进行检测和跟踪,进一步实现了高速公路相关车辆监测的应用。提出了基于双向金字塔多尺度融合的轻量级车辆检测跟踪算法,基于YOLOv3在主干网络上使用轻量级网络EfficientNet,并且利用双向特征金字塔网络进行多尺度特征融合,使得算法在保证检测实时性的同时提升检测的准确度。通过采集高速公路监测视频,构建了一个多场景高速公路车辆目标数据集。在此数据集上的实验结果表明,所提出的算法检测精度达97.11%,高于原始YOLOv3检测算法16.5%,并且结合DeepSORT模型在车辆跟踪上以31帧每秒的帧速度实时运行。同时,该车辆监测系统可在车流量统计、交通异常事件检测领域进行多路实时监测,具有实际应用价值。

    利用混合双通路神经网络的跨模态行人重识别
    程德,郝毅,周靖宇,王楠楠,高新波
    2021, 48(5):  190-200.  doi:10.19665/j.issn1001-2400.2021.05.022
    摘要 ( 203 )   HTML ( 20 )   PDF (2167KB) ( 53 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    因为红外图像数据可以有效地弥补单一可见光数据在低照度条件下的不足,因此研究跨模态可见光—红外行人重识别将为构建一个全天候、全场景智能视频监控系统提供强有力的技术支撑。跨模态行人重识别的核心问题是构建多模态数据之间的统一共享特征表达,关键在于有效区分跨模态数据中模态共享/特有的特征信息。基于此,提出了一种基于混合双通路神经网络的跨模态行人重识别方法。该方法深入地分析了混合双通路神经网络中模态共享参数层和模态特有非共享参数层对跨模态行人重识别模型的影响,同时充分利用了不同模态数据类内特征分布的一致性约束和类间相关性系数在不同模态间的一致性约束来提升模型精度。针对所设计的整体神经网络架构,该方法采用了混合自适应学习率调整的模型训练策略来提升模型的特征学习能力。最后,通过大量实验分析验证了所提方法的有效性,并且该方法在当前可见光—红外图像行人重识别两个标准数据集(SYSU-MM01和RegDB)上都取得了领先当前主流方法的识别精度。

    联合DD-GAN和全局特征的井下人员重识别方法
    孙彦景,魏力,张年龙,云霄,董锴文,葛敏,程小舟,侯晓峰
    2021, 48(5):  201-211.  doi:10.19665/j.issn1001-2400.2021.05.023
    摘要 ( 310 )   HTML ( 22 )   PDF (3972KB) ( 44 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    对煤矿井下各重要区域多个监控摄像头获取到的视频数据进行管控分析,定位和身份识别视频中的工作人员,对煤矿安全智能化生产具有重要意义。为解决矿井下光线暗淡、光照不均匀,现有常规行人重识别方法不能满足井下人员重识别的问题,提出一种联合双鉴别式生成对抗网络和全局特征的井下人员重识别方法。首先,采用双鉴别式生成对抗网络DD-GAN对井下暗光或光照不均的图像进行增强与复原,为后续重识别提供更具辨别力的图像基础;其次,在图像增强的基础上,设计一种基于全局特征描述的重识别网络以解决井下作业人员的身份识别问题,并使用随机擦除与k互近邻重排序方法来进一步提高重识别网络的鲁棒性和识别精度;最后,构建适用于井下特殊场景的Miner-CUMT数据集,解决了现有样本集场景单一的问题,同时也提高了该方法的泛化性。该方法在构建数据集Miner-CUMT进行了有效性验证,实现了煤矿巷道低照度场景下精准的人员重识别任务,为推进煤矿智能化安全生产的发展打下重要基础。

    深度非对称压缩型哈希算法
    闫佳,曹玉东,任佳兴,陈冬昊,李晓会
    2021, 48(5):  212-221.  doi:10.19665/j.issn1001-2400.2021.05.024
    摘要 ( 212 )   HTML ( 10 )   PDF (1970KB) ( 43 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对图像检索中很多深度监督哈希算法不能有效地利用大型数据集监督信息和困难样本的问题,提出了一种端到端的非对称压缩型哈希算法。该算法将网络的输出空间分为查询集与数据库集,构造数据监督矩阵,并采用非对称的方式使全局监督信息得到有效的利用。同时,在损失函数中对同类哈希码聚拢程度与不同类哈希码的分离程度进行显式的约束,提高训练过程中模型对困难样本的判别能力。首先,改进骨干特征提取网络SKNet-50,通过添加哈希层和阈值化层,输出查询集矩阵;然后,使用交叉方向乘子方法优化损失函数得到数据库集矩阵;最后,利用交替优化的方法完成深度模型的训练。使用48比特哈希码检索图像时,在CIFAR-10和NUS-WIDE数据集上的平均精度均值达到0.946和0.923,在MS-COCO数据集上检索的平均精度均值可以达到0.881。实验结果表明,提出算法可以学习到更加判别紧凑的哈希码,在检索精度上要优于目前主流的算法。

    自监督视频表征学习综述
    田春娜,叶彦妤,单笑,丁宇轩,张相南
    2021, 48(5):  222-230.  doi:10.19665/j.issn1001-2400.2021.05.025
    摘要 ( 501 )   HTML ( 34 )   PDF (1238KB) ( 136 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    学习高质量的视频表征有助于机器更准确地理解视频内容。基于监督学习的视频表征需要标注海量的视频数据,而视频标注极其费时费力,因而不需要标注数据的自监督视频表征方法成为研究的热点。自监督视频表征学习利用海量的未标注数据,将视频自身的时空连续性等作为监督信息来设计辅助任务进行表征学习,并将学习到的视频表征应用于下游任务。鉴于缺少对自监督视频表征学习新进展的综述,首先根据辅助任务采用的信息不同,从时序信息、时空信息和多模态信息方面,对近三年的自监督视频表征学习算法进行分析和总结;然后,在动作识别和视频检索两个下游任务中,对比自监督视频表征学习模型的实验结果,并分析模型性能的优劣及其原因;最后,总结自监督视频表征学习依然存在的问题并对其发展进行展望。

    一种利用量测空间聚类的多帧检测前跟踪算法
    张佳琦,陶海红,张修社,韩春雷
    2021, 48(5):  231-238.  doi:10.19665/j.issn1001-2400.2021.05.026
    摘要 ( 297 )   HTML ( 17 )   PDF (1168KB) ( 44 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    针对现有多帧检测前跟踪算法在相互临近的多目标场景下运算复杂度高的问题,提出一种利用量测空间聚类的多帧检测前跟踪算法。该算法采用跨多帧构建关联集合,依据关联集合对量测点迹进行标签标记,以获取多目标在量测空间的分布信息,实现多帧量测点迹的聚类划分,并在各聚类内独立地运行多帧检测前跟踪算法。通过大量仿真实验和性能分析表明,该算法的检测性能与现有多帧检测前跟踪算法相当,而运算复杂度大幅降低。

    改进NSGA-II算法及监测天线部署优化研究
    杜文占,余志勇,杨剑,姜海滨
    2021, 48(5):  239-248.  doi:10.19665/j.issn1001-2400.2021.05.027
    摘要 ( 243 )   HTML ( 84 )   PDF (2548KB) ( 43 )   收藏
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    为求解地面电磁辐射源监测天线的最佳部署位置,以达到准确监测、高效部署的目的,构建了以最大化覆盖率、最小化冗余率和未被覆盖障碍物数量为目标,以天线间保持连通性为约束条件的多目标优化模型。通过判断每两个障碍物之间的距离与天线工作覆盖范围最大半径的大小关系预设参考点作为若干天线部署位置;通过仿真比较了不同障碍物数量和参考点数量对覆盖率、冗余率等部署效率的影响,验证了障碍物数量对冗余率的影响更大,以增加冗余率为代价可减少天线覆盖区域内的障碍物数量。利用内存存储前几代非支配解的方法改进NSGA-II算法,在改变环境后可以更快地求得新的最优解,提高收敛速度。对模型和改进后的算法进行了仿真分析,结果表明迭代速度平均提高了30%以上,平均迭代一次的时间减少了25%以上,验证了改进算法响应动态变化的有效性;通过算法评价指标mIGDB验证了改进算法的收敛性和多样性。