分类目录归档:深度学习

课节1基于深度学习的OCR技术导论


1 百度 aistudio 平台使用

免费算力支持

Notebook中使用Shell命令
    使用pip来安装自己需要的package (但不支持apt-get)
    查看当前环境中安装的package
    持久化安装
        使用git命令来同步代码 (暂时需要Paddle 1.4.1以上)
    文件下载

项目启停

image-20220530140510256

选择算力

执行和调试

image-20220530140631401

image-20220530142100210

image-20220530142121462

Magic命令

Magic命令是Notebook的高级用法了. 可以运行一些特殊的指令. Magic 命令的前面带有一个或两个百分号(% 或 %%),分别代表行 Magic 命令和单元格 Magic 命令。行 Magic 命

Read more

ocr 深入


第一阶段

一 OCR技术概览

基本情况

应用场景

文本识别

车牌识别

拍照搜题

自然场景文本识别

视频内容审核

内容理解

常见难点

复杂板式

扭曲形变 角度

手写干扰

光的影响 反光,弱光,摩尔纹,模糊

image-20220516182713311

二值化方法

基本流程

预处理

降噪

滤波,光照处理

增强

回复拉伸

二值化

灰度图转二值图

方案

OTSU 大津二值化

image-20220517141730344

MSER (MAXIMALLY STABLE EXTERMAL REGIONS)

image-20220517141844354

image-20220517141913503

倾斜矫正

HOUGH变换、投影法

版面分析

文本行定位

字符分割识别

后处理

事例子

1 通用文本

二值化: 彩色转灰度转黑白 只有(0,255)

image-20220516184113454

连通域分析: 字符框分析

论文

Read more

吴恩达深度学习


你将学习本系列课程(专业):

  1. 神经网络和深度学习
  2. 改进深度神经网络:超参数调优、正则化和优化
  3. 构建你的机器学习项目吨/德
  4. 卷积神经网络端到端
  5. 自然语言处理:建立序列模型RNN,LSTM

我的目标

理解深度学习基本原理 常用算法 流程 常用术语 不求算术推导 不求算术推导 不求算术推导 使用深度学习框架

入门介绍

例1 房价预测模型

输入映射输出

监督学习有价值的

图像卷积序列 CNN

时间序列 语言序列 RNN RNNS

深度学习神经网络

数据量和质量处于第一序列胜过算法

算法主要加速学习速率如

sigmod 函数转化为ReLU 函数 梯度下降更快

规模推动深度学习进步 1数据2算力3算

Read more