时间:2022-10-09 17:43:23 | 浏览:4108
今天给大家介绍一个超级简单且强大的OCR文本识别工具:easyocr.
这个模块支持70多种语言的即用型OCR,包括中文,日文,韩文和泰文等。
下面是这个模块的实战教程。
1.准备
请选择以下任一种方式输入命令安装依赖:
1. Windows 环境 打开 Cmd (开始-运行-CMD)。
2. MacOS 环境 打开 Terminal (command+空格输入Terminal)。
3. 如果你用的是 VSCode编辑器 或 Pycharm,可以直接使用界面下方的Terminal.
pip install easyocr
它会安装除了模型文件之外的所有依赖,模型文件则会在运行代码的时候下载。
对于Windows,如果在安装 Torch 或 Torchvision 时报错了,请按照https://pytorch.org 的官方说明安装 Torch 和 Torchvision。
如果你想使用显卡进行计算,你需要搜索下载CUDA,并在Pytorch网站上,确保选择正确的CUDA版本。如果仅打算在CPU模式下运行,请选择CUDA = None。
2.实战教程
这个模块用起来真的非常简单,三行代码完事了:
import easyocr
reader = easyocr.Reader(["ch_sim","en"])
result = reader.readtext("test.png")
运行的过程中会安装所需要的模型文件,像下面这样:
不过它的下载速度非常慢,而且经常会失败,因此这里给出第二个解决方案:先下载好模型文件,再将其放置到所需要的位置:
上滑查看更多
文字检测模型(CRAFT)(必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/craft_mlt_25k.zip
中文(简体)模型(识别中文必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese_sim.zip
中国(传统)模型
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese.zip
拉丁模型
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/latin.zip
日本模型
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/japanese.zip
韩文模型
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/korean.zip
泰文模型
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/thai.zip
阿拉伯文模型
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/arabic.zip
如果下载速度太慢,请在Python实用宝典公众号后台回复:easyocr, 下载我上传到微云网盘的文字检测模型(CRAFT)和中文简体模型文件包。
下载完模型后,将文件放到下面这个位置。
Windows:C:Users用户名.EasyOCRmodel
Linux:~/ .EasyOCR / model
如下图所示:
重新执行脚本不会再提醒下载模型了:
import easyocr
reader = easyocr.Reader(["ch_sim"])
result = reader.readtext("test.png")
print(result)
我随便截了一个直播弹幕的图片保存在脚本所在的文件夹下,命名为test.png:
结果如下:
基本上所有应该识别的文字都识别出来了,效果非常不错。
另外也可以看到,输出采用列表格式,每个item分别表示对应文字的边界框,识别文本结果和置信度。
这个模块还能识别多语种的情况:
我将这张图片命名为test2.jpg,修改代码中对应的图片名称:
import easyocr
reader = easyocr.Reader(["ch_sim","en"])
result = reader.readtext("test2.jpg")
print(result)
效果如下:
这张图片很复杂,而且是中英文混杂在一起的情况,但是可以看到模型除了左上角的水印,图片中的文字基本都是识别出来了,尽管有部分文字识别错误,但还在可以接受的范围之内。
不过需要注意的是,虽然可以一次性识别许多种语言,但并非所有语言都可以一起用,通常是公共语言和一个特殊语种可以一起识别,相互兼容,比如英语和日语。
如果你的电脑没有GPU或者显存不足,可以加一个gpu=false的参数仅使用CPU运行:
reader = easyocr.Reader(["ch_sim","en"], gpu = False)
另外,这个模块还支持直接使用命令行运行,相当方便,大家可以试试:
easyocr -l ch_sim en -f test.png --detail=1 --gpu=True
我们的文章到此就结束啦,如果你喜欢今天的Python 实战教程,请持续关注我们!记得给个三连哦!
Python 是一门对初学者友好的编程语言,是一种多用途的、解释性的和面向对象的高级语言。它拥有非常小的程序集,非常易于学习、阅读和维护。其解释器可在Windows、Linux 和 Mac OS 等多种操作系统上使用。它的可移植性和可伸缩性
【51CTO.com快译】在本文中,我们将逐一介绍目前人气较高的三种编程语言:PHP、Ruby和Python。我们将分析它们是如何工作的,它们彼此有何不同,谁在使用它们,以及每种语言受欢迎的程度。一、 PHP:互联网上最受欢迎的脚本语言PH
TIOBE 编程社区指数是编程语言流行程度的指标。该指数每月更新一次。评级基于全球熟练工程师、课程和第三方供应商的数量。谷歌、必应、雅虎、维基百科、亚马逊、YouTube 和百度等流行搜索引擎用于计算评分。需要注意的是,TIOBE 指数与最
IT行业现在依然是求职转行人群的首选,那么当下的IT培训机构中IT技术课程类目繁多,尤其是Java培训,PHP培训,Python培训以及前端培训最火,零基础人员如何选择一种适合自己的编程开发语言课程去学习入行呢?前三者属于后端的开发语言,我
近年来,越来越低龄化和普遍化的近视困扰着很多家长和孩子,为迎合治疗近视的急切心态,市面上一些打着“康复”“降低近视”旗号的技术和仪器不断推出。实际上,“近视不可逆”这一结论早已得到医学界的证实,而家长的侥幸心理恰恰让所谓的治疗近视产品得以滋
逆转近视眼没“神器” 尽早发现并采取干预是关键一组数据,让人揪心。2020年,我国6岁儿童近视率为14.3%,小学生为35.6%,初中生为71.1%,高中生为80.5%。也就是说,幼儿园大班平均7个娃娃中就有1个需要戴眼镜。在7月13日国家
央广网北京7月13日消息(记者车丽)据中央广播电视总台中国之声《新闻晚高峰》报道,7月上旬,学生陆续开始放假,如何让孩子们度过一个安全健康的暑假是每个家庭面临的实际问题。让他们在外面疯玩,家长们担心其安全问题;把他们关在家里,家长又为其沉迷
13日,国家卫健委举行新闻发布会,介绍我国儿童青少年近视防控和暑期学生健康有关情况。据悉,2020年上半年全民居家抗疫减少了户外活动和放松眼睛的时间,为全面评估近视率的情况,2020年9月到12月开展了近视专项调查,覆盖了全国8604所学校
因疫情防控,近期大部分学生都需要在家上网课。随之而来的是针对儿童青少年的“防蓝光眼镜”,受到广大家长们的青睐,许多商家为了推销产品甚至利用“预防近视”这样的广告用语来忽悠消费者。“防蓝光”眼镜到底能不能防蓝光?又是否真的能“预防近视”呢?案
最新数据显示全国儿童青少年总体近视率为52.7%其中小学生为35.6%初中生为71.1%高中生为80.5%目前我国的总体近视已呈现出低龄高发的态势你家小孩戴眼镜吗?据央视财经消息现在市场上除了框架眼镜还有一种俗称“OK镜”的角膜塑形镜医生介