从传统方法到 AI 驱动的完整流程
从传统方法到 AI 驱动的图像处理技术
| image 图像类型 | pixel 像素表示 | storage 数据量 | apps 典型应用 | thumb_up 优点 |
|---|---|---|---|---|
| 二值图像 | 0 或 1 |
1 bit/像素 | 文档扫描、OCR | 数据量极小,处理简单 |
| 灰度图像 | 0-255 |
8 bit/像素 | 医学影像、工业检测 | 保留亮度信息,计算效率高 |
| RGB 彩色图像 | (R,G,B) |
24 bit/像素 | 摄影、显示 | 符合人眼感知,色彩丰富 |
| 多光谱图像 | 多波段数据 | 可变 | 遥感、农业监测 | 包含不可见光信息 |
| 深度图像 | 距离值 | 16-32 bit/像素 | 3D 重建、机器人导航 | 包含空间深度信息 |
| 神经辐射场 (NeRF) | 隐式表示 | 紧凑 | VR/AR、3D 内容 | 高质量新视角合成 |
| 高斯泼溅 (3DGS) | 3D 高斯分布 | 中等 | 实时 3D 渲染 | 实时渲染、易编辑 |
图像数字化包含两个步骤:空间采样确定像素位置,灰度量化确定像素值。采样不足会导致混叠现象,量化级数过少会产生伪轮廓。
| noise_aware 噪声类型 | insights 概率分布 | build 产生原因 | visibility 视觉特征 | cleaning_services 去噪方法 |
|---|---|---|---|---|
| 高斯噪声 | 正态分布 | 电子电路热噪声 | 均匀分布的细颗粒 | 高斯滤波、维纳滤波 |
| 椒盐噪声 | 脉冲分布 | 信号传输错误 | 随机黑白点 | 中值滤波 |
| 泊松噪声 | 泊松分布 | 光子计数统计 | 与信号强度相关 | 方差稳定变换 |
| 乘性噪声 | 与信号相乘 | 相干成像系统 | 斑点状图案 | 同态滤波 |
像素强度分布图,用于分析图像亮度分布
图像的平均亮度水平
图像对比度的度量
图像信息量的度量
描述图像形状的统计量
传统格式与新一代编码标准
| description 格式 | compress 压缩类型 | transparency 透明度 | pie_chart 典型大小 | target 最佳用途 |
|---|---|---|---|---|
| JPEG | 有损压缩 | close | 小 | 照片、网页图片 |
| PNG | 无损压缩 | check | 中等 | 图形、图标、截图 |
| WEBP | 高压缩 | check | 很小 | 现代网页 |
| AVIF | AI 增强 | check | 极小 | 下一代网页格式 |
| JPEG XL | 可逆 | check | 小 | 专业摄影、存档 |
| HEIC/HEIF | 高效 | check | 很小 | 移动设备 |
| RAW | 无损 | close | 很大 | 专业摄影后期 |
| OpenEXR | HDR | check | 大 | 电影、VFX |
主流图像处理 AI 框架和模型
动态图、易调试,研究首选
生产部署、TPU 支持
高性能计算、函数式编程
跨平台推理引擎
Meta 通用分割模型
实时目标检测
图像生成和编辑
自监督视觉 Transformer
图像处理技术在各行各业的应用
AI 辅助诊断、病理分析、手术导航、药物研发
环境感知、路径规划、行为预测、高精地图
商品识别、虚拟试穿、智能货架、无人商店
缺陷检测、质量控制、预测性维护、机器人引导
人脸识别、行为分析、异常检测、智能追踪
土地利用、灾害监测、城市规划、农业估产