博客
关于我
tf识别非固定长度图片ocr(数字+字母 n位长度可变)- CNN+RNN+CTC
阅读量:740 次
发布时间:2019-03-22

本文共 593 字,大约阅读时间需要 1 分钟。

安装所需库,确保TensorFlow和OpenCV等依赖已满足。下载并解压数据集,注意数据集体积较大,解压完成可能需要一天时间。

使用bash脚本处理图片列表,生成训练集和验证集:

find ./mnt/ | xargs ls -d | grep jpg > image_list_all.txt  image_list_all.txt | head -n 1000 > image_list.txt

将图片文件作为输入,通过TensorFlow生成tfrecord文件:

python create_synth90k_tfrecord.py --image_dir C:\Users\McKay\PycharmProjects\test8\tfdemo\data --anno_file ./image_list.txt --char_map_json_file ../char_map/char_map.json

训练参数设置:

--data_dir ../data/tfrecords/ --model_dir ./model/ --batch_size 32 --char_map_json_file ../char_map/char_map.json

训练过程中遇到GPU资源限制,目前仅获得了7%的准确率。由于时间和资源限制,决定中断后续训练,等待后续GPU资源再进行训练。

转载地址:http://mckwk.baihongyu.com/

你可能感兴趣的文章
Openlayers高级交互(16/20):两个多边形的交集、差集、并集处理
查看>>
Openlayers高级交互(17/20):通过坐标显示多边形,计算出最大幅宽
查看>>
Openlayers高级交互(19/20): 地图上点击某处,列表中显示对应位置
查看>>
Openlayers高级交互(8/20):选取feature,平移feature
查看>>
openlayers:圆孔相机根据卫星经度、纬度、高度、半径比例推算绘制地面的拍摄的区域
查看>>
OpenLDAP(2.4.3x)服务器搭建及配置说明
查看>>
OpenLDAP编译安装及配置
查看>>
OpenMCU(一):STM32F407 FreeRTOS移植
查看>>
OpenMCU(三):STM32F103 FreeRTOS移植
查看>>
OpenMCU(二):GD32E23xx FreeRTOS移植
查看>>
OpenMetadata 命令执行漏洞复现(CVE-2024-28255)
查看>>
OpenMMLab | S4模型详解:应对长序列建模的有效方法
查看>>
OpenMMLab | 【全网首发】Llama 3 微调项目实践与教程(XTuner 版)
查看>>
OpenMMLab | 面向多样应用需求,书生·浦语2.5开源超轻量、高性能多种参数版本
查看>>
OpenMV入门教程(非常详细)从零基础入门到精通,看完这一篇就够了
查看>>
OpenObserve云原生可观测平台本地Docker部署与远程访问实战教程
查看>>
openoffice使用总结001---版本匹配问题unknown document format for file: E:\apache-tomcat-8.5.23\webapps\ZcnsDms\
查看>>
OpenPPL PPQ量化(4):计算图的切分和调度 源码剖析
查看>>
OpenPPL PPQ量化(5):执行引擎 源码剖析
查看>>
openpyxl 模块的使用
查看>>