第一阶段
一 OCR技术概览
基本情况
应用场景
文本识别
车牌识别
拍照搜题
自然场景文本识别
视频内容审核
内容理解
常见难点
复杂板式
扭曲形变 角度
手写干扰
光的影响 反光,弱光,摩尔纹,模糊
二值化方法
基本流程
预处理
降噪
滤波,光照处理
增强
回复拉伸
二值化
灰度图转二值图
方案
OTSU 大津二值化
MSER (MAXIMALLY STABLE EXTERMAL REGIONS)
倾斜矫正
HOUGH变换、投影法
版面分析
文本行定位
字符分割识别
后处理
事例子
1 通用文本
二值化: 彩色转灰度转黑白 只有(0,255)
连通域分析: 字符框分析
论文