今天刚好找到一个有趣的文字识别模型,想来和大家介绍一下~
PaddleOCR是百度研究出来的文字识别模型,主要可以把图片当成input然後判断里面的文字,实际用python操作起来非常的容易,大家有空可以自己玩一下,因为本身模型非常小,用cpu也是可以跑得动的呦!接下来就直接来用python实作吧!
下载paddleocr之前需要先装paddle,可以把它想像成是基础架构,如果用gpu跑的人记得把code换成:
!python -m pip install paddlepaddle**-gpu**==2.0.0 -i https://mirror.baidu.com/pypi/simple
# GitHub repo installation of paddle
!python3 -m pip install paddlepaddle==2.0.0 -i https://mirror.baidu.com/pypi/simple
接下来下载paddleocr
!pip install "paddleocr>=2.0.1" # Recommend to use version 2.0.1+
from paddleocr import PaddleOCR,draw_ocr
from matplotlib import pyplot as plt
import cv2 #opencv
import os
直接开始盖model,使用gpu的把use_gpu改成True,或是删掉因为default就是True,另外paddleocr支援多国语言识别,大家也可以把lang换掉玩玩看
# Setup model
ocr_model = PaddleOCR(lang='en',use_gpu=False)
放入一张图片分析一下:
img_path = os.path.join('.', 'test.jpg')
# Run the ocr method on the ocr model
result = ocr_model.ocr(img_path)
来看看识别结果,回传的资料为文字的位置,文字内容,与准确度:
result
也可以单独把文字列出来,最後放上原图比较:
for res in result:
print(res[1][0])
这个方便程度还有准确度真的是非常的神奇啊~
[reference]
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/doc/doc_en/quickstart_en.md#paddleocr-quick-start
https://pypi.org/project/paddleocr/
https://www.youtube.com/watch?v=t5xwQguk9XU
<<: 【程序】在职进修 转生成恶役菜鸟工程师避免 Bad End 的 30 件事 - 17
在我们进入React的环节之前,需要先理解一些会很常听到、看到的关键字 CSR(SPA) SSR S...
Youtube连结:https://bit.ly/2L88JSm 这次我们将精确定位出,在整个演算...
UI设计 UI设计要考量的因素有很多,既要考量到介面的功能,又要考量到使用者的感官,所以在UI设计时...
接续上一篇,第二种改善R^2的经验。 2 . 减少极端值的影响 所谓的模型输出的准确性,也可以这麽想...
第一次发文,不知道会不会触犯版规,如有错误欢迎告知,谢谢。 OS:XP SP3 编译器: DEV C...