{$cfg_webname}
主页 > 计算机 > 论文 >

基于深度学习的图片文字识别技术的研究

来源:56doc.com  资料编号:5D27751 资料等级:★★★★★ %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9A5D27751
资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用. 帮助
资料介绍

基于深度学习的图片文字识别技术的研究(任务书,开题报告,论文9000字)
摘  要
文字识别主要包括图像预处理、字符特征的提取、图像的输入、字符的预识别和文本信息的后处理。神经网络识别法是目前主要的文字识别技术之一。在实践中,它通常是和其他文字识别技术相互结合使用的。
卷积神经网络是由隐藏层和输出层组成可以并行、高速地处理数据的前馈神经网络。它以其快速的学习收敛性而备受关注。自学习、自组织、自适应是它最显著的特点。
本文研究和分析了字符识别的相关技术和神经网络技术,同时对常用的图形和字符提取算法进行了比较和分析,设计并实现了一种复杂图像的布局分析算法。使用OpenCV算法和相关的先验知识对段落和行进行分段。最后,利用投影和贪婪算法对字符进行分割,形成图形和文本信息。实现了一种简单的卷积神经网络,系统的输入是提取对象的特征向量,通过对大量文本样本的训练,来达到实现对字符的识别的目标。
关键词:文字识别 卷积神经网络 深度学习 OpenCV
 
Research On Picture Recognition Technology Based On Deep Learning
ABSTRACT
  Text recognition mainly includes image input, image preprocessing, character feature extraction, character pre-identification, and post-processing of text information. Neural network recognition is one of the main text recognition technologies. In practice, it is often used in conjunction with other text recognition technologies.
Convolutional neural network is a feedforward neural network, which consists of a hidden layer and an output layer. It can process data in parallel and at high speed. It has received much attention for its rapid learning convergence. Self-learning, self-organization, and self-adaptation are its most prominent features.
This paper studies and analyzes the related techniques of text recognition and neural network technology. At the same time, it compares and analyzes commonly used graphics and character extraction algorithms, and designs and implements a layout analysis algorithm for complex images. Segments and lines are segmented using the OpenCV algorithm and related prior knowledge. Finally, the projection and greedy algorithms are used to segment the characters to form graphics and text information. A simple convolutional neural network is implemented. The input of the system is to extract the feature vector of the object. Through training a large number of text samples, the target of text recognition can be achieved.
Key words: text recognition; deep learning; Convolutional neural network; OpenCV.
 

基于深度学习的图片文字识别技术的研究


目  录
摘  要    I
ABSTRACT    II
第一章 绪论    1
1.1课题研究的背景与意义    1
1.2国内外研究现状    1
1.3本文的主要工作    2
第二章 深度学习理论    3
2.1深度学习简介    3
2.2卷积神经网络简介    3
2.2.1卷积运算    3
2.2.2神经网络    4
2.3卷积神经网络的基本结构    5
2.3.1卷积层    6
2.3.2池化层    6
2.3.3激活层    7
2.3.4全连接层    8
第三章 神经网络的构建及训练    9
3.1卷积神经网络模型的训练    9
3.1.1数据集的构建    9
3.1.2网络模型的训练    10
3.2卷积神经网络服务的构建    11
3.2.1 TensorFlow模型持久化    11
3.2.2使用socket网络服务提供接口    11
3.3卷积神经网络的部分代码    12
第四章 图像处理    14
4.1图像前期处理    14
4.1.1图像灰度化    15
4.1.2图像二值化    15
4.2倾斜校正    15
4.2.1基于傅里叶变换和霍夫变换的图像矫正    16
4.2.2基于文本轮廓的矩形矫正    16
4.3表格框线处理    18
4.3.1形态学转换    18
4.3.2交点分析    19
4.3.3构建掩模    19
4.4图像版面分析及分割    20
4.4.1轮廓检测    20
4.4.2宽度优先策略    21
4.4.3最大空白区域法    22
4.5字符分割    23
4.5.1投影处理    23
4.5.2 Beam Search算法分割    24
4.6实验结果    25
4.6.1单字符识别结果    25
4.6.2纯文本识别结果    26
4.6.3复杂文本识别结果    27
总结与展望    29
参考文献    30
致  谢    32

推荐资料