这是我们2022年的工作,关于雾中的单目自监督深度估计研究:
0.CodeSelf-supervised monocular depth estimation in fog
Bo Tao†, Jiaxin Hu†, Du Jiang, Gongfa Li, Baojia Chen, Xinbo Qian
【资料图】
†These authors contributed equally to this work.
Optical Engineering 2022
我们提供了基于Pytorch的开源代码实现,你可以在此处访问。
1.导读近年来,自监督深度估计方法由于不需要深度标签受到广泛关注,在天气良好的图像测试中取得了显著的效果。然而,在更具挑战的雾天场景中,由于雾的存在导致低对比度与有限可见性,它们的性能受到限制。为了解决这一问题,我们提出一种适用于雾天图像自监督深度估计的端到端的特征分离网络,我们以配对的清晰图和合成雾图为输入,通过正交性损失学习的特征提取器分离干扰信息(光照、雾等)和不变信息(结构、纹理等),并利用不变信息进行深度估计。同时,引入相似性损失,以清晰图像的深度作为伪标签来约束雾天图像深度,并加入基于注意力机制的模块和重建损失细化了输出深度,获得了更好的深度图。然后,我们使用真实世界雾图进行微调,有效地减少了合成与真实数据的域间距。实验表明,我们的方法在合成数据集及Cityscape数据集上产生了先进的结果,证明了我们所提出方法的优越性。
下图(b)展示了雾天图像在Monodepth2上的结果,我们可以看到,由于雾的存在导致低对比度与有限可见性,无法估计深度细节。
2.中心思想我们受这篇paper启发:场景的深度是使用图像中物体的垂直位置来估计获得,而场景中的光照、模糊等起的作用较少。因此,我们提出特征分离框架,将雾天与清晰图像对的信息分为两个互补的集合,集合1包含雾天与清晰图像光照、雾等变化信息,这影响深度估计性能。集合2包含场景结构、纹理等不变信息,利用这些信息来估计深度。由于不配对的雾天与清晰图像包含的信息不一样,会影响自监督深度估计网络,因此参照这篇paper所提出的合成雾方法,将大量不同场景赋予不同浓度的雾建立一个雾天图像数据集,并与清晰图像配对作为网络的输入进行训练,同时考虑到合成与真实的雾天图像之间固有的域偏移,我们接着使用了真实世界的雾图微调我们的网络。具体来说,首先输入配对的连续3帧雾图和清晰图,使用两个特征提取器来提取图像中干扰信息(光照、雾等)和不变信息(结构、纹理等),加入正交损失保证两者尽可能不同,然后对不变信息加入光度损失来估计深度,同时用清晰图估计出的深度图作为伪标签,利用相似性损失实现无监督训练。值得注意的是,我们的网络是直接从合成以及真实的雾图中估计深度信息,是一个端到端的网络。
3.网络结构这是我们的网络结构图,以配对的清晰图像和雾天图像为输入,通过我们设计的特征分离网络结构来消除干扰项的影响
为了增强场景结构感知能力以及突出关键的局部细节信息,我们设计了两个基于注意力机制的模块:通道注意模块、位置注意模块。
4.损失函数我们的总损失函数由光度损失、边缘感知平滑损失、正交损失、相似性损失和重建损失组成,即:其中β1、β2、β3、β4、β5是权重参数,各个损失函数展开为:
5.训练细节我们深度估计网络基于U-Net体系结构,即带跳跃连接的编码器-解码器。首先,使用清晰图像和对应的雾图视为图像对,作为网络的输入来训练模型;之后使用真实世界雾图和用PSD生成的清晰图来微调模型。模型在Pytorch中实现,使用Adam优化器在RTX1080Ti GPU上训练20个epoch,batchsize设为,学习率初始设为le-4,5个epoch后设为1e-5。采用7个指标度量进行测试,包括Abs-Rel、Sq-Rel、RMSE、RMSE-log、&1、&2和&3。
6.实验6.1定量实验这是我们的方法与几个方法之间的定量比较结果。首先在5个能见度(VIZ)合成数据集上评估各个模型的性能,这里,使用的是同一个场景,保证了唯一变量,之后对真实世界中的雾图进行了测试。在上表中,Monodepth2表示使用合成数据集训练和用真实数据集微调的结果,PSD+Monodepth2表示首先去雾,然后估计去雾图像的场景深度,据我们所知,monodepth2是一种对清晰图像很有效的自监督深度估计方法,然而对用雾天图像训练的模型来说,其性能却受限于雾天图像。由于雾天图像整体对比度较低、光照不均匀等等,导致在雾天条件下直接对图像进行深度估计时都会造成不同程度的信息丢失,取得的效果并不好。同时, PSD+Monodepth2可以在一定程度上改善雾天条件下图像的深度估计结果,但由于当前普遍去雾模型都会对去雾后的图像造成不同程度的损伤,又在另一层面影响了图像深度估计结果,其性能也受到限制。如上表所示,本文提出的特征分离框架可以缓解雾模糊带来的影响,在5个能见度和真实的雾图像中,所有的性能指标都可以通过我们的方法得到很大的改善,这证明了我们的方法的优越性。
上表是我们对各个模型测试一张图片所需时间和模型大小进行统计,可见将去雾模型嵌入到深度估计模型前大大增加了模型复杂度,相比之下,我们的模型更加满足实时性。
6.2定性实验雾天图像的定性比较结果如上图所示,其中(a)显示了能见度分别为500m、200m、50m的合成数据集图像以及真实世界雾天图像,(b)为Monodepth2测试的结果,(c)为先用PSD对图像去雾,之后再用Monodepth2测试结果。总的来说,在对清晰图像深度估计取得SOTA的Monodepth2无法生成平滑的深度图,并遗漏了大量的信息。与(b)相比,显然(c)取得了更好的视觉效果,这证明去雾操作对雾天图像深度估计是积极的,但去雾操作会不同程度的损伤图像,使其在深度估计时产生一些奇怪的输出,如(c)中红色框框所示,这在另一层面上影响了深度估计效果。相比之下,我们的方法可以恢复更多的物体轮廓深度细节,获得了更多的视觉效果,更重要的是,在(d)中,我们的模型仍然能够对非常模糊的场景做出合理的预测,这些非常模糊的场景甚至对人眼都是挑战,这证明模型能很好的适应雾天环境。
验证实验为了验证我们的网络的可解释性,我们分别使清晰图像、能见度为200m、50m通过模型,对5个信息量较大的卷积特征图可视化,如上图所示,第一列为对应的输入图像,其余列为特征图。第二、四、六行中的特征图包含明显的结构信息和纹理信息,第一、三、五中的特征图包含的信息是非规则的、平滑的、结构较少的信息,类似于图像的光照、雾等信息,这证明了我们的方法可以有效地分离雾天图像的光照、雾等干扰信息和结构、纹理等不变信息。
消融实验我们进行消融实验,以证明网络各个组件的有效性,结果上表所示。在500m能见度和真实数据集上,正交性损失对提升模型性能表现最好,在两个数据集上分别提升了85.7%和29.5%的Sq Rel,这表明,用于保证干扰特征和不变特征分离的正交性损失可以极大地提升雾天条件下图像的深度估计性能。用于保证干扰和不变特征互补的重建损失、以清晰图像深度作为伪标签来约束雾天图像的相似性损失均进一步改善了雾天图像的深度估计结果。此外,基于注意力机制的通道注意力模块和位置注意力模块获得了更好的场景理解和丰富的特征表示,从而实现了更精确的深度预测。
总结我们提出的端到端的特征分离框架,可以很好的解决雾天图像的深度估计问题,在一些数据集上的测试表明,我们的方法明显由优于其他方法,产生了先进的结果。但在可见度低的场景中,仍然有提高的空间,这将是我们未来的工作。
关键词:
(责任编辑:黄俊飞)推荐内容
- 个人论文一:关于雾中单目自监督深度估计
- 北京双双名列前茅
- 泰香米泰国餐厅,举办中国首届泰国咖喱节
- 探访青海大通“8·18”山洪灾害安置点:
- 陕建机:柴昭一赴河北庞源调研指导工作
- 北新建材:7月6日融资买入403.81万元,融
- 美联储6月的决议分歧严重 现货黄金反弹
- 外媒:北约确认将成立“北约-乌克兰理事
- 司马光砸缸无人不晓,你可知被救小孩是谁
- 市民反映亳州一小区消防栓内没有水,官方
- “泰坦”号潜水器运营公司宣布暂停运营
- 拼出中国式现代化江苏新图景|链主企业接
- 大众tiquan什么车(大众型号tiguan是什么车)
- 顺利中交!巴陵石化在建中石化石化“十条
- 金山办公携旗下WPS AI亮相2023世界人工
- 记者:不同于此前报道,于帕和马兹拉维都
- 中金公司:国有大行盈利能力并不差
- 马粥街残酷史 关于马粥街残酷史的介绍
- 消息称ASML将向中国推出“特供版”DUV光
- 外媒:墨西哥一公交车坠崖 已致29人遇难
- 助力就业!重庆市民政局倡议全市社会组织
- 泰勒弗里茨:毫无疑问,当德约科维奇上场
- 建设银行举办“717美好生活节” 以新金
- 《2022年全国旅游服务质量提升报告》发布
- 一年换一帅!巴黎再度官宣,冠军教头上任
- 2024年九月初五出生文姓女孩名字怎么取生
- 【世界新视野】热门中概股美股盘前下跌
- 热消息:CC2530 ADC配置步骤
- “不赞同率”急速上扬 蔡英文还能继续糊
- 【天天新要闻】青海:推进生物质能等可再
- 7月3日全球最热?7月4日:你起开,让我来
- 六个交易日股价暴涨45% 特斯拉劲敌Rivia
- 第十届中国中小企业投融资交易会在京召开
- 厦门地铁站接驳车来了 已覆盖这四个站点
- c000021a蓝屏无法开机(c000021a)_全球新视野
- 天天新动态:今日消息:中国生物制药:旗
- 2023年7月6日操盘必读:影响外汇市场的利
- 雅本化学:公司2022年度外销收入占营业总
- 厚度33微米 中国科研团队研发出高性能电
- 消息称苹果推迟至 2025 年推出 iPhone SE 4
- 北上资金今日净卖出21.95亿元_环球今日报
- “国家电网”APP?假的!
- 华为手机如何连接别人手机热点(华为手机
- 广电运通刷掌支付产品亮相2023年全球数字
- 纳思达最新公告:拟出资2.89亿美元在香港
- 杰弗里·萨克斯:美国应放弃“领导世界的
- 万里扬(002434.SZ):EV减速器配套客户为
- 华夏智胜新锐股票基金提前结募
- 我儿子毕业后我就让他自己出去独立,他非
- 武汉凡谷:毫米波雷达及相关配件在客户端
- 宝钢股份:宝武原料公司负责整个集团层面
- 数学专业劝退?顶尖数学系两年半毕业直博
- 如何平衡参观需求与校园秩序?
- 天天快资讯:上海启动“2023暑期消费季”
- 三元生物:公司研发的优质甜菊糖(莱鲍迪
- 央媒看四川丨第十九届西博会闭幕:架起沟
- 焦点讯息:西北首家!西安未来人工智能计
- 今日热文:@家长们,暑假期间这些安全知
- 奔四的女人不管穿裤子还是裙子,牢记这3
- 全球实时:万魔谢冠宏:进入运动耳机细分
- 助力就业!重庆市民政局倡议全市社会组织
- 泰勒弗里茨:毫无疑问,当德约科维奇上场
- 建设银行举办“717美好生活节” 以新金
- 《2022年全国旅游服务质量提升报告》发布
- 一年换一帅!巴黎再度官宣,冠军教头上任
- 2024年九月初五出生文姓女孩名字怎么取生
- 【世界新视野】热门中概股美股盘前下跌
- 热消息:CC2530 ADC配置步骤
- “不赞同率”急速上扬 蔡英文还能继续糊
- 【天天新要闻】青海:推进生物质能等可再
- 7月3日全球最热?7月4日:你起开,让我来
- 六个交易日股价暴涨45% 特斯拉劲敌Rivia
- 第十届中国中小企业投融资交易会在京召开
- 厦门地铁站接驳车来了 已覆盖这四个站点
- c000021a蓝屏无法开机(c000021a)_全球新视野
- 天天新动态:今日消息:中国生物制药:旗
- 2023年7月6日操盘必读:影响外汇市场的利
- 雅本化学:公司2022年度外销收入占营业总
- 厚度33微米 中国科研团队研发出高性能电
- 消息称苹果推迟至 2025 年推出 iPhone SE 4
- 北上资金今日净卖出21.95亿元_环球今日报
- “国家电网”APP?假的!
- 华为手机如何连接别人手机热点(华为手机
- 广电运通刷掌支付产品亮相2023年全球数字
- 纳思达最新公告:拟出资2.89亿美元在香港
- 杰弗里·萨克斯:美国应放弃“领导世界的
- 万里扬(002434.SZ):EV减速器配套客户为
- 华夏智胜新锐股票基金提前结募
- 我儿子毕业后我就让他自己出去独立,他非
- 武汉凡谷:毫米波雷达及相关配件在客户端
- 宝钢股份:宝武原料公司负责整个集团层面
- 数学专业劝退?顶尖数学系两年半毕业直博
- 如何平衡参观需求与校园秩序?
- 天天快资讯:上海启动“2023暑期消费季”
- 三元生物:公司研发的优质甜菊糖(莱鲍迪
- 央媒看四川丨第十九届西博会闭幕:架起沟
- 焦点讯息:西北首家!西安未来人工智能计
- 今日热文:@家长们,暑假期间这些安全知
- 奔四的女人不管穿裤子还是裙子,牢记这3
- 全球实时:万魔谢冠宏:进入运动耳机细分
- 焦点速讯:公积金基数上调,究竟是好事还
- 空调有几种类型和图片_空调有几种类型
- 世界报道:容器板附加值表
- 深圳市万邦医疗科技有限公司(关于深圳市
- 每日短讯:国内外新能源市场同步走强:乘
- 环球资讯:你问我爱你有多深歌词 你问我
- 世界快报:郑州博物馆主题旅游项目入选“2
- 录音剪辑怎么用苹果手机剪 录音剪辑 每
- 每日观点:2023四川雅安市退役军人事务局
- 课题写作经验分享:研究重点/难点与研究基
- 今年南山实施五大领域60项改革任务
- 全球最新:原来这样可减免服务费!微信支
- 当前速递!iphone13和12pro买哪个(iphon
- 男子翻墙入他人别墅,在里面连吃带住还喝
- 世界即时:今夏首个!“橙色”高温预警开
- 正力新能“三高一快”eVTOL航空航天电池
- 每日关注!南宁市三美学校、新民中学招生
- 中国驻日大使馆阐述中方对福岛核污染水排
- 案例教程 | rc表格卡方检验|世界观天下
- 速读:13万注释神经元 果蝇大脑连接组