博客
关于我
tf识别非固定长度图片ocr(数字+字母 n位长度可变)- CNN+RNN+CTC
阅读量:740 次
发布时间:2019-03-22

本文共 593 字,大约阅读时间需要 1 分钟。

安装所需库,确保TensorFlow和OpenCV等依赖已满足。下载并解压数据集,注意数据集体积较大,解压完成可能需要一天时间。

使用bash脚本处理图片列表,生成训练集和验证集:

find ./mnt/ | xargs ls -d | grep jpg > image_list_all.txt  image_list_all.txt | head -n 1000 > image_list.txt

将图片文件作为输入,通过TensorFlow生成tfrecord文件:

python create_synth90k_tfrecord.py --image_dir C:\Users\McKay\PycharmProjects\test8\tfdemo\data --anno_file ./image_list.txt --char_map_json_file ../char_map/char_map.json

训练参数设置:

--data_dir ../data/tfrecords/ --model_dir ./model/ --batch_size 32 --char_map_json_file ../char_map/char_map.json

训练过程中遇到GPU资源限制,目前仅获得了7%的准确率。由于时间和资源限制,决定中断后续训练,等待后续GPU资源再进行训练。

转载地址:http://mckwk.baihongyu.com/

你可能感兴趣的文章
ol3 Demo2 ----地图搜索功能
查看>>
OLAP、OLTP的介绍和比较
查看>>
OLAP在大数据时代的挑战
查看>>
oldboy.16课
查看>>
OLEDB IMEX行数限制的问题
查看>>
ollama 如何删除本地模型文件?
查看>>
ollama-python-Python快速部署Llama 3等大型语言模型最简单方法
查看>>
Ollama怎么启动.gguf 大模型
查看>>
ollama本地部署DeepSeek(Window图文说明)
查看>>
ollama运行多模态模型如何进行api测试?
查看>>
OMG,此神器可一次定一周的外卖
查看>>
Omi 多端开发之 - omip 适配 h5 原理揭秘
查看>>
On Error GOTO的好处
查看>>
onclick事件的基本操作
查看>>
oncopy和onpaste
查看>>
onCreate中的savedInstanceState作用
查看>>
onCreate()方法中的参数Bundle savedInstanceState 的意义用法
查看>>
One good websit for c#
查看>>
One-Shot学习/一次学习(One-shot learning)
查看>>
OneASP 安全公开课,深圳站, Come Here, Feel Safe!
查看>>