Deep Learning 11 CV Image Segmentation
[TOC]
CV-Image Segmentation 图像分割
传统分割方法
理解:
- 把图像分割成若干个块
- 每个块都有相同点 [可以利用拓广性来进行延伸]
基本方法:
-
基于阈值的图像分割:按照灰度值进行提取,直接归成纯白色和纯黑色
-
基于区域的图像分割:延伸合并 & 分裂 【两个可逆的过程】
- 单个像素点 ==延伸合并==》 一个区域
- 整张图片 ==分裂==》 若干个区域
-
基于边缘检测的图像分割: 直接通过提取边缘,来划定不同的区域。
-
分水岭算法
Image Segmentation 具体方法分析
基于阈值的图像分割
特点:
阈值的影响太大:1) 阈值小 => 对亮的区域/灰度值低的区域 效果好 2) 阈值大 => 对暗的区域/灰度值高的区域 效果好
基于区域的图像分割
- 单个像素点的延伸合并
特点:
若干个单个像素点的选取影响太大。
拓广的规则/策略的设定影响太大。
- 分裂
特点:
基于边缘检测的图像分割
特点:太依赖边缘的话,有可能没法形成一个回路(差一点形成一个回路),或者很多没有规则的线。
基于主动轮廓的图像分割
分水岭算法
特点:对于边缘的分割太过敏感了,容易过度分割
基于GA遗传算法的图像分割
深度学习分割
基于特征编码 - VGGNet 分割
基于特征编码 - ResNet
特点:缓解梯度消失的问题。(类似于序列模型中的GRU(重置门、更新门)和LSTM(有三个门遗忘门、记忆门、输出门),GRU就是)
R-CNN[Target Detection] & Fast R-CNN[Target Detection] & Mask R-CNN[Image Segmentation]
原理:引入恒等映射,允许原始输入信息直接传到后面的层中,在学习过程中可以只学习上一个网络输出的残差F(x)
- R-CNN、Fast R-CNN 目标检测
- Mask R-CNN 目标检测、目标分类、像素级分割(每个像素点进行标注)