本项目基于Pytorch实现CRNN文字识别项目,从零重写项目,学习CRNN实现的细节。
论文地址:https://arxiv.org/abs/1507.05717
参考代码:https://github.com/Sierkinhane/CRNN_Chinese_Characters_Rec
本文使用的是MLT2017的数据集,下载地址:https://download.csdn.net/download/qq_37668436/15045746
- python3 -m pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
- 修改config/config.yml文件中的CHAR_FILE和JSON_FILE参数到你的数据集路径
- python3 train.py --cfg config/config.yml 运行训练
- 或者 bash setup.sh运行训练该命令会在后台运行,并且保存训练的输出到log.txt文件中
说明 | 训练集 | 测试集 | 准确度 |
---|---|---|---|
仅MLT2017 | 4879 | 766 | 0.34375 |
MLT2017+textrender合成的100w数据 | 1114039 | 766 | 0.59240 |
数据集 | 训练集 | 测试集 | 准确度 | 加入attention |
---|---|---|---|---|
MLT2017+textrender合成的100w数据 | 1114039 | 766 | 0.59240 | 0.62630 |