博客
关于我
tf识别非固定长度图片ocr(数字+字母 n位长度可变)- CNN+RNN+CTC
阅读量:740 次
发布时间:2019-03-22

本文共 593 字,大约阅读时间需要 1 分钟。

安装所需库,确保TensorFlow和OpenCV等依赖已满足。下载并解压数据集,注意数据集体积较大,解压完成可能需要一天时间。

使用bash脚本处理图片列表,生成训练集和验证集:

find ./mnt/ | xargs ls -d | grep jpg > image_list_all.txt  image_list_all.txt | head -n 1000 > image_list.txt

将图片文件作为输入,通过TensorFlow生成tfrecord文件:

python create_synth90k_tfrecord.py --image_dir C:\Users\McKay\PycharmProjects\test8\tfdemo\data --anno_file ./image_list.txt --char_map_json_file ../char_map/char_map.json

训练参数设置:

--data_dir ../data/tfrecords/ --model_dir ./model/ --batch_size 32 --char_map_json_file ../char_map/char_map.json

训练过程中遇到GPU资源限制,目前仅获得了7%的准确率。由于时间和资源限制,决定中断后续训练,等待后续GPU资源再进行训练。

转载地址:http://mckwk.baihongyu.com/

你可能感兴趣的文章
Vue element 动态添加表单验证
查看>>
OO第一次blog
查看>>
OO第四单元总结
查看>>
OO第四次博客作业
查看>>
OO面向对象编程:第三单元总结
查看>>
Opacity多浏览器透明度兼容处理
查看>>
OPC在工控上位机中的应用
查看>>
VSCode在终端中使用yarn命令
查看>>
OPEN CASCADE Curve Continuity
查看>>
Open Graph Protocol(开放内容协议)
查看>>
Open vSwitch实验常用命令
查看>>
Open WebUI 忘了登入密码怎么办?
查看>>
open***负载均衡高可用多种方案实战讲解02(老男孩主讲)
查看>>
Open-E DSS V7 应用系列之五 构建软件NAS
查看>>
Open-Sora代码详细解读(1):解读DiT结构
查看>>
Open-Sora代码详细解读(2):时空3D VAE
查看>>
Open-Source Service Discovery
查看>>
open-vm-tools-dkms : 依赖: open-vm-tools (>= 2:9.4.0-1280544-5ubuntu3) 但是它将不会被安装
查看>>
open3d-Dll缺失,未找到指定模块解决
查看>>
openai Midjourney代理服务 gpt大模型第三方api平台汇总 支持国内外各种大模型 持续更新中...
查看>>