百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 文章教程 > 正文

Python实现图片中的文字识别-ocr技术

xsobi 2024-12-08 19:32 1 浏览

如何才能从图片中识别出文字呢,今天我们将使用 飞桨的 PaddleOCR 进行图片文字识别。

官网地址: https://www.paddlepaddle.org.cn/hub/scene/ocr

学到什么

  • python 图片文字提取
  • 文件目录或文件更新监控

主题:

使用 PaddleOCR 提取图片中的文字,图片由其他程序进行下载或者人工保存到文件夹,使用 watchfiles 进行文件目录,检测新保存的文件进行文字提取


关键词:

  • Python 图片文字识别
  • Python 监控文件和目录变化

安装相关库

pip3 install paddlepaddle paddleocr
pip3 install watchfiles

使用 OCR 提取图片中的文字

ocr = PaddleOCR(use_angle_cls=True, lang='ch')


def image_ocr(path):
    """ 图片文字识别
    :param path: 图片路径
    :return: List[str]
    """
    result = ocr.ocr(str(path), det=True)
    return result

上面我们对图片中的中文进行提取结果

文件监控部分

使用watchfiles监控文件变更 主要是watch 函数

  • path 监控目录路径
  • rust_timeout 超时时间 超时后返回空changes
  • watch_filter 自定义文件过滤
def watch_image(*path: str) -> Generator[Tuple[Change, str], None, None]:
    """文件监控
    :param path: 监控目录 可输入多个目录
    :return:
    """
    for changes in watch(*path, debounce=1000, rust_timeout=300_000, watch_filter=ImageFilter()):
        for event, change_file in changes:
            logger.info(f'{event.name} {change_file}')
            yield event, change_file

最后贴出出完整代码 如需定制或者制作应用程序(可提供)

# _*_coding: utf-8 _*_
# @Time    : 2019/12/18 15:54
# @Author  : Taihui

import pathlib
import pprint
from typing import Generator, Tuple

from paddleocr import PaddleOCR
from loguru import logger
from watchfiles import watch, Change, DefaultFilter


ocr = PaddleOCR(use_angle_cls=True, lang='ch')


def image_ocr(path):
    """ 图片文字识别
    :param path: 图片路径
    :return: List[str]
    """
    result = ocr.ocr(str(path), det=True)
    return result


class ImageFilter(DefaultFilter):
    allowed_extensions = ['.png', '.jpg', '.jpeg', '.gif']

    def __call__(self, event: Change, path: str) -> bool:
        """ 过滤无效扩展名
        :param event: 文件变更事件 add、modify、delete
        :param path: 文件路径
        :return: bool
        """
        if not pathlib.Path(path).suffix in self.allowed_extensions:
            return False
        return super().__call__(event, path)


def watch_image(*path: str) -> Generator[Tuple[Change, str], None, None]:
    """文件监控
    :param path: 监控目录 可输入多个目录
    :return:
    """
    for changes in watch(*path, debounce=1000, rust_timeout=300_000, watch_filter=ImageFilter()):
        for event, change_file in changes:
            logger.info(f'{event.name} {change_file}')
            yield event, change_file


def main(*path):
    for event, change_file in watch_image(*path):
        if event == Change.added or event == Change.modified:
            try:
                pprint.pp(image_ocr(change_file))
            except FileNotFoundError:
                pass


if __name__ == '__main__':
    main('images/')

相关推荐

好用的云函数!后端低代码接口开发,零基础编写API接口

前言在开发项目过程中,经常需要用到API接口,实现对数据库的CURD等操作。不管你是专业的PHP开发工程师,还是客户端开发工程师,或者是不懂编程但懂得数据库SQL查询,又或者是完全不太懂技术的人,通过...

快速上手:Windows 平台上 cURL 命令的使用方法

在工作流程中,为了快速验证API接口有效性,团队成员经常转向直接执行cURL命令的方法。这种做法不仅节省时间,而且促进了团队效率的提升。对于使用Windows系统的用户来说,这里有一套详细...

使用 Golang net/http 包:基础入门与实战

简介Go的net/http包是构建HTTP服务的核心库,功能强大且易于使用。它提供了基本的HTTP客户端和服务端支持,可以快速构建RESTAPI、Web应用等服务。本文将介绍ne...

#小白接口# 使用云函数,人人都能编写和发布自己的API接口

你只需编写简单的云函数,就可以实现自己的业务逻辑,发布后就可以生成自己的接口给客户端调用。果创云支持对云函数进行在线接口编程,进入开放平台我的接口-在线接口编程,设计一个新接口,设计和配置好接口参...

极度精神分裂:我家没有墙面开关,但我虚拟出来了一系列开关

本内容来源于@什么值得买APP,观点仅代表作者本人|作者:iN在之前和大家说过,在iN的家里是没有墙面开关的。...

window使用curl命令的注意事项 curl命令用法

cmd-使用curl命令的注意点前言最近在cmd中使用curl命令来测试restapi,发现有不少问题,这里记录一下。在cmd中使用curl命令的注意事项json不能由单引号包括起来json...

Linux 系统curl命令使用详解 linuxctrl

curl是一个强大的命令行工具,用于在Linux系统中进行数据传输。它支持多种协议,包括HTTP、HTTPS、FTP等,用于下载或上传数据,执行Web请求等。curl命令的常见用法和解...

Tornado 入门:初学者指南 tornados

Tornado是一个功能强大的PythonWeb框架和异步网络库。它最初是为了处理实时Web服务中的数千个同时连接而开发的。它独特的Web服务器和框架功能组合使其成为开发高性能Web...

PHP Curl的简单使用 php curl formdata

本文写给刚入PHP坑不久的新手们,作为工具文档,方便用时查阅。CURL是一个非常强大的开源库,它支持很多种协议,例如,HTTP、HTTPS、FTP、TELENT等。日常开发中,我们经常会需要用到cur...

Rust 服务器、服务和应用程序:7 Rust 中的服务器端 Web 应用简介

本章涵盖使用Actix提供静态网页...

我给 Apache 顶级项目提了个 Bug apache顶级项目有哪些

这篇文章记录了给Apache顶级项目-分库分表中间件ShardingSphere提交Bug的历程。说实话,这是一次比较曲折的Bug跟踪之旅。10月28日,我们在GitHub上提...

linux文件下载、服务器交互(curl)

基础环境curl命令描述...

curl简单使用 curl sh

1.curl--help#查看关键字2.curl-A“(添加user-agent<name>SendUser-Agent<name>toserver)”...

常用linux命令:curl 常用linux命令大全

//获取网页内容//不加任何选项使用curl时,默认会发送GET请求来获取内容到标准输出$curlhttp://www.baidu.com//输出<!DOCTYPEh...

三十七,Web渗透提高班之hack the box在线靶场注册及入门知识

一.注册hacktheboxHackTheBox是一个在线平台,允许测试您的渗透技能和代码,并与其他类似兴趣的成员交流想法和方法。它包含一些不断更新的挑战,并且模拟真实场景,其风格更倾向于CT...