分类标签归档:深度学习

ocr 深入


第一阶段

一 OCR技术概览

基本情况

应用场景

文本识别

车牌识别

拍照搜题

自然场景文本识别

视频内容审核

内容理解

常见难点

复杂板式

扭曲形变 角度

手写干扰

光的影响 反光,弱光,摩尔纹,模糊

image-20220516182713311

二值化方法

基本流程

预处理

降噪

滤波,光照处理

增强

回复拉伸

二值化

灰度图转二值图

方案

OTSU 大津二值化

image-20220517141730344

MSER (MAXIMALLY STABLE EXTERMAL REGIONS)

image-20220517141844354

image-20220517141913503

倾斜矫正

HOUGH变换、投影法

版面分析

文本行定位

字符分割识别

后处理

事例子

1 通用文本

二值化: 彩色转灰度转黑白 只有(0,255)

image-20220516184113454

连通域分析: 字符框分析

论文

Read more

造数据


造数据

图片旋转

# -*- coding: utf-8 -*-
#!/usr/bin/env python
#PROJECT_NAME: PROJECT_NAME
#E_MAIL: renoyuan@foxmail.com
#AUTHOR: reno 

import os
from io import BytesIO
from typing import Union
from PIL import Image


def img_rotate(f_b: bytes, angle:Union[int,float], endstuff="PNG") ->bytes:

Read more