去除摩尔纹,治愈强迫症, 来卷网盘赛,榜评0.55623


数字屏幕在现代日常生活中无处不在:我们在家里有电视屏幕,在办公室有笔记本电脑/台式机屏幕,在公共场所有大尺寸LED屏幕。拍摄这些屏幕的图片以快速保存信息已成为一种惯例。然而,在对这些屏幕拍照的时候通常会出现波纹图像,从而降低了照片的图像质量。当两个重复的图案相互干扰时,出现摩尔纹图案。在拍摄屏幕图片的情况下,相机滤色镜阵列(CFA)会干扰屏幕的亚像素布局。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

去除摩尔纹,治愈强迫症, 来卷网盘赛,榜评0.55623

采用多尺度bandpass 卷积神经网络(MBCNN)来去除摩尔纹。 Image Demoireing with Learnable Bandpass Filters, CVPR2025

百度网盘AI大赛:文档图像摩尔纹消除(赛题一)

一、背景

数字屏幕在现代日常生活中无处不在:我们在家里有电视屏幕,在办公室有笔记本电脑/台式机屏幕,在公共场所有大尺寸LED屏幕。拍摄这些屏幕的图片以快速保存信息已成为一种惯例。然而,在对这些屏幕拍照的时候通常会出现波纹图像,从而降低了照片的图像质量。当两个重复的图案相互干扰时,出现摩尔纹图案。在拍摄屏幕图片的情况下,相机滤色镜阵列(CFA)会干扰屏幕的亚像素布局。

与去噪、去马赛克、颜色恒定、锐化等其他图像修复问题不同,人们对图像去伪存真(demireing)的关注较少,它是指从被摩尔纹污染的图像中恢复基本的干净图像。这个问题在很大程度上仍然是一个未解决的问题,由于摩尔纹图案在频率、形状、颜色等方面的巨大变化。

二、模型设计

华为方舟提出了一种新颖的多尺度bandpass 卷积神经网络(MBCNN)来解决这个问题。作为端到端解决方案,MBCNN分别解决了两个子问题。对于纹理恢复子问题,提出了一个可学习的带通滤波器(LBF),以了解去除摩尔纹之前的频率。对于颜色恢复子问题,提出了两步色调映射策略,该策略首先应用全局色调映射来校正全局色彩shift,然后对每个像素执行颜色的局部微调。

数码相机捕获的含摩尔纹的图像可以建模为:

其中ψ-1是ψ的反函数,在图像处理领域被称为色调映射函数。以此模型建模,图像去摩尔纹任务可以分为两步,即摩尔条纹去除和色调映射。

1、Multiscale bandpass CNN

1.1、 Multi-Branch Encoder

整体的模型在三个scales上工作,并具有三种不同类型的blocks,分别是波纹纹理去除块(MTRB),全局色调映射块(GTMB)和局部色调映射块(LTMB)。

首先将具有h×w×c形状的输入图像I可逆地向下采样为四个h/2×w/2×4c形状的子图像。下面的网络由三个分支组成,每个分支用于恢复特定比例的波纹图像,同时每个分支顺序地执行摩尔纹去除和色调映射,最终输出放大后的图像,并将其融合到更小比例的分支中。在分支I和II中,将当前分支的特征和较粗的缩放分支的输出特征融合后,将其他GTMB和MTRB堆叠在一起,以消除缩放比例引起的纹理和颜色错误。

1.2、Moire texture removal

摩尔纹可以表示为:

按照这种公式,我们可以先估计不同尺度和频率的波纹纹理的分量,然后基于所有估计的分量重建波纹纹理。Block-DCT是处理频率相关问题的有效方法。

其中D表示Block-DCT函数。

Learnable Bandpass Filter

受隐式DCT的启发,可以用深度CNN直接估计 implicit frequency spectrum(IFS) 。由于变换都是线性的,因此可以用一个简单的卷积层来建模。由于Moire纹理的频谱总是有规律的,我们可以使用带通滤波器来放大某些频率,减弱其他频率。然而,在建模之前我们很难得到频谱,因为在不同的尺度上,会有几个频率,而且它们也会相互影响。为了解决这个问题,提出了一种可学习的带通滤波器(LBF)来学习摩尔纹图像的先验。LBF为每一个频率引入了一个可学习的权重。

1.3 Tone mapping 色调映射

RGB颜色空间是一个非常大的空间,包含256的3次方种颜色,因此很难进行逐点色调映射。观察到摩尔纹图像和干净图像之间存在颜色偏移,本文提出了一种两步色调映射策略,其中包含两种类型的色调映射块:全局色调映射块(GTMB)和局部色调映射块(LTMB)。

全局色调映射块Global tone mapping block

注意力机制已经被证明在许多任务中是有效的,并且已经提出了几种通道注意模块。GTMB可以看作是一个通道注意模块。然而,GTMB与现有的通道注意模块在几个方面有所不同。 首先,现有的通道注意力块总是由一个Sigmoid单元激活,而GTMB中的γ没有这样的约束。其次,通道注意力是直接应用在现有通道注意力块的输入上,而GTMB中的γ是应用在局部特征Flocal上。最后,现有的通道注意力模块的目的是进行自适应的channel-wise特征重新校准;GTMB的目标是进行全局的颜色偏移,避免不规则和不均匀的局部颜色伪影。

 

局部色调映射块Local tone mapping block

三、损失函数

将L1损失用作基本损失函数,因为已经证明 L1损失比L2损失对图像恢复任务更有效。但是,L1损失本身是不够的,因为它是无法提供结构信息的逐点损失,而摩尔纹是 structural artifact。特提出了Advanced Sobel Loss(ASL)来解决此问题。

与经典Sobel Loss相比,ASL提供了两个额外的45°方向Loss,它们可以提供更丰富的结构信息。 

总的损失函数为:

四、实验

In [1]
#1.解压数据集#%cd /home/aistudio#!unzip data/data121008/moire_train_dataset.zip -d data/train >/dev/null#!unzip data/data121008/moire_testA_dataset.zip -d data/testA >/dev/null
/home/aistudio
In [4]
%cd /home/aistudio
!unzip data/data126181/moire_testB_dataset.zip -d data/testB >/dev/null
/home/aistudio
In [ ]
#2.数据读取 #!cat work/dataset.py
In [ ]
#3.模型定义#!cat work/model.py
In [ ]
#4.定义训练方式#!cat work/train.py
In [ ]
#5.训练,日志在vdl_log目录下,可用左侧的VisualDL的数据模型可视化功能,查看训练进程#%cd /home/aistudio/#!python work/train.py
In [ ]
#6.预测结果%cd /home/aistudio/
!python work/predict.py --dataset_root /home/aistudio/data/testB/moire_testB_dataset/ --pretrained /home/aistudio/checkpoint/final-640.pdparams
In [ ]
#7.打包提交文件#%cd /home/aistudio/output/#!zip result.zip *.jpg  *.txt

五、总结

项目为了演示目的,只使用了比赛的数据集。

针对比赛任务,模型还有很多优化空间,四个方向供参考:

  1. 数据:利用外部数据集进行预训练或者直接转换预训练模型,然后在比赛数据集上微调;

  2. 模型:针对数据集的特点,优化模型结构;

  3. Loss:采用论文中提出的L1和SoberLoss混合损失来训练;

  4. 训练:调整训练策略和超参数据。

MBCNN当前在TIP2018数据集榜上综合指标排名暂列第一,PSNR为30.03,SSIM为0.893。


# 提出了  # 通滤波器  # 用在  # 在对  # 在家里  # 锐化  # 可以用  # 很难  # 两步  # 是一个  # python  # cnn  # channel  #   # Filter  # red  # 百度  # 百度网盘  # ai  # 电脑 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: N8N自动化营销:无需编程实现AI智能获客  DeepSeek AI:AI通用谜题解题器,解题思路全解析  ChatGPT图像生成器完全指南:文化影响、伦理挑战与商业变革  Claude怎样写引导型提示词_Claude引导提示词写法【方法】  AI时代生存指南:掌握软实力,成为不可替代的人  Mermaid Playground: AI驱动的图表秒速创建指南  为什么你的简历过不了筛选?用AI帮你诊断并修复漏洞  Gemini怎样写细节型提示词_Gemini细节提示词编写【步骤】  GitHub Copilot与Azure AI Foundry模型:加速AI编程实践  使用Go语言构建图像识别系统:完整指南  如何利用文心一言优化知乎高赞回答的逻辑结构  豆包AI怎么评价回答的好坏_点赞与反馈功能使用教程  AI 时代高效开发:版本控制与 AI 协同工作流  探索Roblox:虚拟角色定制与互动乐园  AI论文写作终极指南:DeepSeek与HIX Bypass结合使用教程  使用 DeepSeek 生成符合工业标准的 API 文档  千问怎样用提示词获取健康建议_千问健康类提示词注意事项【指南】  如何在 Google Sheets 中利用 Gemini 自动填充数据  百度ai助手怎么取消 百度ai助手取消显示设置  WorkPPT:AI驱动的PPT制作神器,效率提升不止10倍!  批改网AI检测工具怎样开启实时检测_批改网AI检测工具实时检测开启与延迟设置【指南】  AI图像生成偏见:克服与优化,打造更真实的数字形象  AI赋能保险销售:提升邮件营销效果的终极指南  普通人如何用DeepSeek月入过万?2026最新赚钱路径全解析!  AI赋能副业:五大掘金机会,轻松开启智能创收时代  快速生成PPT工具怎么用_快速生成PPT工具使用方法详细指南【教程】  5分钟教你用AI生成短视频分镜脚本,小白也能拍大片  即梦ai能否生成国风插画_即梦ai国风元素调用与文化符号添加【技巧】  Ocfotech AI 房地产工具:提升房地产投资效率的终极指南  tofai登录入口官网 tofai网页版地址链接  利用 DeepSeek 辅助进行编译器原理课程学习  Logic Pro 11更新全面解析:免费升级、AI功能与音乐制作流程  Speerise亮面体操服测评:舒适与时尚的完美结合  AI社交媒体自动化:n8n与HeyGen打造个性化内容引擎  教你用AI将长视频内容切片,并自动生成短视频文案  百度AI搜索怎样设置搜索偏好_百度AI搜索偏好设置与个性化推荐【技巧】  AI 和 Plagiarism Checker:SEO 内容创作的终极指南  2025 YouTube自动化终极指南:利用AI实现高效内容创作和多平台发布  豆包Ai官方网页版入口地址_豆包Ai官网在线使用入口  冷邮件营销新策略:工作坊模式助力B2B销售增长  百度输入法ai模式怎么关 百度输入法恢复普通模式  tofai官网网页版入口 tofai最新网页版登录链接  ChatGPT一键生成PPT怎么加动画_ChatGPTPPT动画添加【指南】  PlotDot Horizon:AI编剧工具颠覆好莱坞?深度评测  BEILA:用AI驱动的低代码开发平台详解  如何利用 DeepSeek 进行多轮复杂对话的状态管理  豆包Ai在线使用入口_豆包Ai官方网站最新登录地址  都灵裹尸布之谜:AI揭示耶稣基督的真实面貌?  AI数据分析报告生成工具有哪些_一键生成可视化报告的AI工具推荐  Midjourney怎么用一键生成漫画_Midjourney漫画生成方法【攻略】 

 2025-07-18

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.