[Python]文字识别模型-PaddleOCR

今天刚好找到一个有趣的文字识别模型,想来和大家介绍一下~

PaddleOCR

PaddleOCR是百度研究出来的文字识别模型,主要可以把图片当成input然後判断里面的文字,实际用python操作起来非常的容易,大家有空可以自己玩一下,因为本身模型非常小,用cpu也是可以跑得动的呦!接下来就直接来用python实作吧!

下载paddleocr之前需要先装paddle,可以把它想像成是基础架构,如果用gpu跑的人记得把code换成:
!python -m pip install paddlepaddle**-gpu**==2.0.0 -i https://mirror.baidu.com/pypi/simple

# GitHub repo installation of paddle
!python3 -m pip install paddlepaddle==2.0.0 -i https://mirror.baidu.com/pypi/simple

接下来下载paddleocr

!pip install "paddleocr>=2.0.1" # Recommend to use version 2.0.1+
from paddleocr import PaddleOCR,draw_ocr
from matplotlib import pyplot as plt 
import cv2 #opencv
import os 

直接开始盖model,使用gpu的把use_gpu改成True,或是删掉因为default就是True,另外paddleocr支援多国语言识别,大家也可以把lang换掉玩玩看
https://ithelp.ithome.com.tw/upload/images/20210930/20142004e9toifBNdV.png

# Setup model
ocr_model = PaddleOCR(lang='en',use_gpu=False)

放入一张图片分析一下:

img_path = os.path.join('.', 'test.jpg')
# Run the ocr method on the ocr model
result = ocr_model.ocr(img_path)

来看看识别结果,回传的资料为文字的位置,文字内容,与准确度:

result

https://ithelp.ithome.com.tw/upload/images/20210930/20142004SiwWAhBGNr.png

也可以单独把文字列出来,最後放上原图比较:

for res in result:
    print(res[1][0])

https://ithelp.ithome.com.tw/upload/images/20210930/20142004ROeay6yKaZ.png

https://ithelp.ithome.com.tw/upload/images/20210930/20142004PlVHagn0NV.jpg

这个方便程度还有准确度真的是非常的神奇啊~

[reference]
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/doc/doc_en/quickstart_en.md#paddleocr-quick-start
https://pypi.org/project/paddleocr/
https://www.youtube.com/watch?v=t5xwQguk9XU


<<:  【程序】在职进修 转生成恶役菜鸟工程师避免 Bad End 的 30 件事 - 17

>>:  第12章:SSH远端连线设定与原理介绍(一)

Day18-React起步

在我们进入React的环节之前,需要先理解一些会很常听到、看到的关键字 CSR(SPA) SSR S...

【最完整!演算法学习路线图】 入门|介绍|教学|LeetCode|资料结构

Youtube连结:https://bit.ly/2L88JSm 这次我们将精确定位出,在整个演算...

企划实现(9)

UI设计 UI设计要考量的因素有很多,既要考量到介面的功能,又要考量到使用者的感官,所以在UI设计时...

改善R^2 (2) | ML#Day25

接续上一篇,第二种改善R^2的经验。 2 . 减少极端值的影响 所谓的模型输出的准确性,也可以这麽想...

0 day 安全笔记 第一章 1.4 crack 小实验

第一次发文,不知道会不会触犯版规,如有错误欢迎告知,谢谢。 OS:XP SP3 编译器: DEV C...