azyet:利用深度线索的雾天无人机目标检测开源基准hazydet无人机算法飞行

本文介绍了HazyDet,一个在恶劣天气条件下用于无人机目标检测的开源基准数据集,并提出了一种新的深度线索调制检测器(DeCoDet),利用深度信息提升检测性能。

一、研究背景

图1. 恶劣天气下工作的无人机

在计算机视觉领域,COCO和VOC等数据集扮演了至关重要的角色,为目标检测和图像分割等任务提供了丰富的标注数据。近年来,针对无人机视角下,研究者们也开发了多个数据集。例如,CARPK数据集包括 1,448 张无人机拍摄的停车场图像,标注了 89,777 辆汽车。UAVDT数据集提供了约 40,000 张图像,每张图像的分辨率约为 1080×540 像素,标注了城市环境中的汽车、公交车和卡车。VisDrone是最广泛使用的数据集之一,包含 10,209 张图像,详细标注了十个物体类别,包括边界框、遮挡和截断比例。这些数据集的出现极大地推动了深度学习算法的发展,使得研究人员能够在标准化的环境中测试和比较不同的方法。

然而,这些数据集通常集中在清晰、理想的正常天气条件下。随着无人机在恶劣环境中的部署日益增多,对于相关场景的数据需求更加明显。针对大雨、浓雾、暴风雪等极端天气的无人机目标检测数据集相对缺乏,成为了一个亟待解决的研究方向。

图3. 恶劣天气下的无人机目标检测所面临的挑战三、现有方法

尽管通用目标检测领域取得了重要进展,但将这些方法直接应用于恶劣天气下的无人机目标检测往往未能达到预期效果,这主要是由于无人机视角和环境条件所致:

尺度变化:无人机图像由于视角和高度的变化,通常表现出显著的尺度变化,同时小物体的比例更高。

非均匀分布:与常规视角下目标集中于画面中心不同,无人机拍摄的图像中物体分布更为分散。

图像退化:在恶劣天气条件下,大气传输受损,导致能见度降低和图像颜色失真,影响图像质量,进而影响基于视觉的感知。

为应对这些挑战,研究人员提出了一些针对性的设计:

多尺度特征融合[1][2][3]:通过特征金字塔和多分辨率架构捕捉不同尺度的物体,改善检测精度,缓解尺度变化的影响。

粗到细策略[4][5][6][7]:采用粗略检测器识别较大实例,再应用细粒度检测器定位较小目标,提高检测精度和效率。

图像恢复与检测结合[8][9][10]:将图像恢复与检测任务结合,学习从清晰和退化图像中提取域不变特征,增强对恶劣天气场景的理解。

尽管这些方法在某些方面取得了一定进展,但往往忽视了关键的辅助信息,例如场景深度。深度信息能够揭示物体与探测器之间的空间关系,从而帮助我们更好地理解场景中物体的布局和相对位置。此外,现有的检测流程通常表现出较为僵化和繁琐的设计,具体体现在多个方面:首先,许多检测流程需要进行多次前处理和后处理以及特种融合步骤,使得整个流程显得笨重且耗时;其次,结合图像恢复网络的方法往往受退化域数据的限制。此外,由于这检测和复原两种任务的优化目标存在差异,图像复原对检测任务的具体增益也存在不确定性。

四、HazyDet 数据集

图4. HazyDet 中的样本示例

为了解决数据集的空白,我们推出了HazyDet数据集,重点关注雾这种普遍且会严重影响无人机感知的天气状况。HazyDet包含了上万张精心挑选的无人机图像,并为大约 383,000 个不同类别的物体标注了高质量的边界框。据我们所知,这是第一个专门为不利天气场景下的无人机检测设计的大规模数据集。

图5. HazyDet 构建流程

HazyDet包含真实和仿真两种类型的数据。对于真实数据,我们采集了大量的真实雾霾场景下的无人机图像并进行了标注。然而,获取大量恶劣天气下包含目标的无人机图像十分困难,而且标注这些质量较低的图像需要耗费大量的人力和时间成本。因此,我们尝试利用现有已标注数据构建仿真数据。通过大气散射模型(Atmospheric Scattering Model,ASM)和精心设计的仿真参数,我们生成了高质量的仿真数据。

五、DeCoDet

我们提出了一种新的检测框架——深度调制检测器(DeCoDet),如图6所示。DeCoDet 通过利用深度信息,而非显式的图像恢复,来增强雾霾条件下的检测性能。该框架建立在两个观察之上:一是无人机图像中物体特征与深度之间的相关性,二是场景中雾分布与深度的关系。

由于视角和高度的变化,无人机平台下的成像透视效应更加明显,远处物体的视觉尺寸显得更小,而近处物体则显得更大。此现象在常规视角和遥感视角中通常不明显。以往研究主要集中于利用深度数据检测伪装和显著目标,因为深度模态中的物体难以用颜色伪装[11][12][13]。然而,现有研究尚未充分利用深度信息与目标检测的更多联系,例如深度与场景中目标尺度的关系及不同深度下的目标分布。我们认为这些知识对于检测是有益的。

另一方面,在仿真过程中我们发现,雾天图像中的传输图(transmission map)与像素深度之间存在简单的负指数函数关系,也就是说,距离较远区域的传输图衰减程度更强。以往的去雾研究中,很多工作已经注意到深度信息的作用并将其引入到网络中[14][15],但我们认为深度信息的价值不仅限于低级视觉任务中的图像复原,它同样有助于网络在雾霾环境中进行更高阶的视觉感知,例如目标检测。

图6. DeCoDet 网络结构

基于上述发现,我们在现有网络中融合深度信息,并利用学习到的深度线索动态调整检测行为,最终得到深度调制检测器(Depth-cue Conditional Detector,DeCoDet),以有效应对雾霾环境和无人机视角带来的挑战,从而显著提高检测性能。

六、实验

表1. HazyDet 数据集上不同检测器的性能表现

表2. HazyDet 上不同去雾模型的表现七、结论和未来工作的讨论

传统上,处理恶劣天气感知的策略主要有两类。第一类策略利用真实的恶劣天气数据来训练模型以增强其对未知域的适应能力。虽然这种方法较为根本,但由于恶劣天气数据的获取和标注成本较高,其应用受到很大限制。第二类策略则是通过域适应设计来缩小正常天气域与恶劣天气域之间的差异,然而这也仅能在某种程度上缓解问题。

最近,越来越多的工作注意到了在恶劣天气下深度信息的重要性,这些任务包括但不限于图像复原、光流估计以及实例分割,促使我们思考为什么深度信息对于恶劣天气下的感知如此重要。在我们看来,深度信息在恶劣天气下的感知中之所以重要,关键在于它能够提供一种相对稳定的感知基础。

恶劣天气(包括雨雪雾暗光等)的和正常天气的不同场景下,图像中的颜色纹理亮度等与光学成像相关的信息产生了巨大的偏差,这也是导致正产域与退化域差异的原因,但是对于深度信息来说却是不变的。同时,不同恶劣天气对于成像的影响与深度是十分相关的。例如,距离相机较近的对象主要受雨水条纹的影响,更多的光线反射到相机中,而距离较远的对象受雾和弱光条件的影响更大。对于一个模型来说,掌握了深度信息其实是一定程度的以不变应万变,以不变的深度特征来应对多变的但是与深度相关的恶劣天气。

目前,DeCoDet 只是对深度信息在目标检测中应用的粗浅尝试,仍然存在许多局限性,包括缺乏真实深度数据的应用、对基于深度的信息处理网络结构与方法的探索不足,以及未充分将深度信息应用于更广泛任务中(如雨、雪、暗光条件下的分割、场景定位、导航等)。未来工作我们将聚焦于这些方面,也非常欢迎更多同行可以共同探索。

致谢

我们感谢天津视觉计算与智能感知重点实验室(VCIP)提供的宝贵资源。特别感谢天津大学的朱鹏飞教授和 AISKYEYE 团队,他们对数据方面的重要支持对我们的研究工作至关重要。同时,我们对李翔辉、冯钰新及其他研究人员表示深切的感谢,他们在数据仿真和数据集构建方面提出了宝贵的意见。此外,我们也要感谢Metric3D对本文所呈现方法的贡献。

参考文献

[5]: Sutao Deng, Shuai Li, Ke Xie, Wenfeng Song, Xiao Liao, Aimin Hao, and Hong Qin.A Global-Local Self-Adaptive Network for Drone-View Object Detection. IEEE Transactions on Image Processing, 30:1556–1569, 2021.

llustration From IconScout By IconScout Store

-The End-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(

投稿内容

// 前沿资讯解说/心得经历讲述 //

投稿须知

投稿方式

发送邮件到

或添加工作人员微信(yellowsubbj)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域的新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

THE END
0.图像去雾技术解析基于图像复原的去雾方法,使用了大气退化模型进行去雾,相当于图像成像时的逆变换,去雾效果会好于基于图像增强的去雾算法。本文主要讨论基于复原的去雾算法。 2、雾天图像退化模型   在计算机视觉领域,通常使用雾天图像退化模型来描述雾霾等恶劣天气条件对图像造成的影响,该模型是McCartney首先提出。该模型包括衰减模jvzquC41dnuh0lxfp0tfv8z235<96@821cxuklqg1fkucrqu19<769843
1.基于大气散射模型的图像去雾算法研究20250407084604.pdf(2)针对传统图像去雾算法存在对比度下降和颜色偏移等问题,提出一种新 型透射率细化的雾线先验雾霾图像复原算法,并对透射率细化模型进行了理论分 析。该算法首先引入一个受光照影响的透射率补偿项,来补偿场景中由于雾浓度 大时图像亮度下降的影响。其次结合改进的非局部雾线先验分别求得场景透射率 和透射率补偿项,jvzquC41o0hpqt63:0ipo8mvon532;:126681@6243<129;2326687xjvo
2.深度学习去雾方法如何提升图像质量?为提升去雾图像的视觉质量,该方法借鉴了EnhanceNet中的感知损失函数,通过增强图像的纹理与细节,显著提高了图像的PSNR和SSIM等评价指标。这种结合感知损失的去雾策略,为图像质量的提升提供了有力保障。在另一项研究中,提出了一种基于门控融合网络的雾霾图像复原方法。该网络结构采用编码-解码框架,并引入门控机制进行特征jvzquC41ycv/|xq0eqs/ew4cum5ya<582;;957mvon
3.实验室介绍西南财经1、复杂环境下底层图像复原关键技术 解决复杂环境中(低光照、雾霾、雨天等)底层图像质量下降的问题,提升图像在极端条件下的清晰度和可用性。该研究重点在于构建鲁棒性强的模型,适应各种复杂场景下的图像复原需求,比如自动驾驶、无人机监控以及遥感应用等场景。 jvzquC41pkifnjg0uy{gg7jfw0io1|~uim5t{|ou0jzn
4.证据发现数字图司法取证问题研究数字图像的质量受人工操作、设备性能和拍摄环境的综合影响,不可避免会出现变形、模糊、低分辨率、噪声、雾霾等现象,进而导致图像失真、细节特征不明显,影响数字图像的证据能力。基于证据发现的数字图像司法取证以寻找和发现证据为目的,依照法定的技术规范,通过对图像进行增强、降噪、复原、几何变换等处理,还原图像所记载的jvzquC41yy}/i€~qq0ipo8qwpyko1ofzwgrvp€jp1ulmy8723:711?=245>/j}rn
5.改进AOD基于图像复原的去雾方法主要从光学成像的角度, 分析雾霾对图像成像过程的影响, 确定类似大气散射光学模型中的未知参数, 再通过逆运算由雾图推导出清晰图像. 相较第1种方法, 针对性更强, 效果更好. 吴靖等人[6]利用光的偏振特性推算大气散射模型中的参数, 较好地恢复出无雾的清晰图像, 但由于大气散射的时变性,jvzquC41e/y.c7tti0io1qyon1814=431;98:7mvon
6.雾霾天气引起安防担忧海康威视透雾摄像机受关注滚动新闻首先请大家看一下上面两幅对比图像,左边是普通摄像机在雾霾天气下拍摄的监控图像,右边是海康威视透雾摄像机拍摄的透雾后的图像效果,实时视频透雾原理是基于大气透射模型,区分图像不同区域景深与雾浓度进行滤波处理,同时融合图像增强技术与图像复原技术,获得准确、自然的透雾图像。实时视频透雾技术适用于高速公路卡口以及jvzq<84hkpgoen3ukpg/exr0ep5squq142743:5:13764:<487=877xjvor
7.同济教授张林、中山副教授任文琦丨就正有道:物理机理驱动的图像报告题目:图像雾霾分析:模拟、评估和消除 报告嘉宾:任文琦 (中山大学) 报告题目:融合先验知识的图像视频复原方法研究 Panel嘉宾: 张林(同济大学)、任文琦 (中山大学)、刘家瑛 (北京大学)、潘金山 (南京理工大学) Panel议题: 1.从合成数据验证向真实场景应用的过程中,图像恢复与增强方法泛化难的主要因素有哪些,物理机jvzquC41gxkov7gcck4be7hp1ciuknvkgy07;>
8.【中国图象图形学报图图Seminar】恶劣环境图像智能处理技术高端报告简介:在实际应用中,受恶劣成像环境(如雾霾、海水等)的影响,户外或水下计算机视觉系统获取到的图像质量退化,普遍存在对比度低、图像模糊以及颜色失真等问题,严重影响并限制各种智能处理系统(如视频监控、目标探测、无人驾驶等)的性能和应用。对降质图像进行增强和复原是一个经典的计算机视觉任务。从传统的基于先验和jvzquC41yy}/mxzujcxf0lto1nowg8igvcomu87333
9.基于四偏振成像的图像去雾算法嗯,用户现在在找基于四偏振成像的图像去雾算法的资料和实现方法。首先,我需要回忆一下四偏振成像的基本原理。四偏振通常指的是使用四个不同偏振角度的图像,比如0°、45°、90°、135°,通过捕捉不同偏振状态的光线来获取场景的偏振信息。然后,这些信息可以用来估计大气光和各向异性的散射,从而去除雾霾。 jvzquC41ygtlw7hufp4og}4cpu}ft86:fllw:ƒjp
10.信息熵保真度联合度量函数的单幅图像去雾方法【摘要】:为了增强雾霾图像对比度的同时有效地弥补颜色缺失,提出一种信息熵与保真度相结合的单幅图像去雾方法.首先利用四叉树分割的雾霾变换图像估计大气光线;然后构造信息熵与保真度的联合度量目标函数,估计局部图像块的大气透射率;再采用加权的最小二乘方法对大气透射率的初次估计值进行精细化处理;最后根据大气散射模型jvzquC41yy}/ewpk0eun0ls1Ctzjeuj1ELLEVxycn/PTLO723;682:90jvs
11.透雾镜头|电动变倍镜头|高清监控镜头|长焦镜头|YAMAKO数学透雾则是通过摄像机ISP或者后端软件上可实现,是基于人类视觉感知模型设计的后端图像复原技术,并集合了多种图像算法,是较为重要的一类图像处理技术。目前已知的透雾算法大致可以分为两大类:一种是非模型的图像增强方法,通过增强图像的对比度,满足主观视觉的要求来达到清晰化的目的;另一种是基于模型的图像复原方法,jvzq<84yyy4scwp0ejoocƒ3eqo}xy7~cocqp0lto1ktgq8sgyu3j29653k7/j}rn