百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 文章教程 > 正文

一款专为.NET开发者打造的OCR利器

xsobi 2024-12-08 19:32 1 浏览



引言

随着人工智能技术的飞速发展,OCR(光学字符识别)技术在我们的日常生活中扮演着越来越重要的角色。为了满足.NET开发者对于高效、便捷OCR工具的需求,今天推荐一款专为.NET开发者打造的OCR工具类库——PaddleOCRSarp

PaddleOCRSarp简介

PaddleOCRSarp充分利用了百度飞桨PaddleOCR的强大功能,通过C++代码修改和封装,为.NET开发者提供了一个简单易用、功能强大的OCR工具类库。无论是文字识别、车牌识别还是表格识别,PaddleOCRSarp都能轻松应对,帮助开发者快速实现OCR功能。

PaddleOCRSharp封装极其简化,实际调用仅几行代码,极大的方便了中下游开发者的使用和降低了PaddleOCR的使用入门级别,同时提供不同的.NET框架使用,方便各个行业应用开发与部署。Nuget包即装即用,可以离线部署,不需要网络就可以识别的高精度中英文OCR。

本项目支持官方所有公开的通用OCR模型,PPOCRV2、PPOCRV3、PPOCRV4。如果使用v2模型,请设置OCR识别参数OCRParameter对象的属性rec_img_h=32,本项目默认使用V3模型,默认rec_img_h=48:

本项目只能在X64的CPU上编译和使用,只能在avx指令集上的CPU上使用。

本项目目前支持以下.NET框架:

net35;net40;net45;net451;net452;net46;net461;net462;net47;net471;net472;net48;net481;
netstandard2.0;netcoreapp3.1;
net5.0;net6.0;net7.0;net8.0

PaddleOCRSarp特点

  • ? 高度集成PaddleOCRSarp将百度飞桨PaddleOCR的核心功能完美集成到.NET平台,让开发者无需关心底层实现,只需调用相应接口即可实现OCR功能。

  • ? 性能卓越:得益于百度飞桨PaddleOCR的高效算法和C++代码的优化,PaddleOCRSarp在保持高度集成的同时,也保证了卓越的性能表现。

  • ? 易于使用PaddleOCRSarp提供了丰富的API接口和详细的文档说明,让开发者能够轻松上手,快速实现OCR功能。

  • ? 扩展性强PaddleOCRSarp支持自定义模型加载和训练,开发者可以根据自己的需求进行模型扩展和优化。

PaddleOCRSarp源码文件夹结构

PaddleOCRSharp //该文件夹包含.NET对PaddleOCR封装类库项目
PaddleOCRDemo //该文件夹包含OCR示例Demo文件夹
|--PaddleOCRCppDemo //C++调用示例项目
|--PaddleOCRSharpDemo //.NET调用示例项目
|--python //python调用示例项目
|--Go //Golang调用示例项目

PaddleOCRSarp应用场景

PaddleOCRSarp适用于各种需要OCR技术的.NET开发场景,如文档数字化处理、自动识别表单数据、车牌识别等。无论是企业级应用还是个人开发者,PaddleOCRSarp都能提供强大的OCR支持。

如何开始使用

要开始使用PaddleOCRSarp,只需按照以下步骤操作:

下载并安装PaddleOCRSarp库

在您的.NET项目中引入PaddleOCRSarp库;

调用PaddleOCRSarp提供的API接口进行OCR操作;

根据需要自定义模型或调整参数。

OCR识别示例

OpenFileDialog ofd = new OpenFileDialog();
ofd.Filter = "*.*|*.bmp;*.jpg;*.jpeg;*.tiff;*.tiff;*.png";
if (ofd.ShowDialog() != DialogResult.OK) return;
//使用默认中英文V4模型
PaddleOCRSharp.OCRModelConfig config = ;
//使用默认参数
PaddleOCRSharp. OCRParameter oCRParameter = new PaddleOCRSharp.OCRParameter();
//识别结果对象
PaddleOCRSharp.OCRResult ocrResult = new PaddleOCRSharp.OCRResult();
//建议程序全局初始化一次即可,不必每次识别都初始化,容易报错。 PaddleOCRSharp.PaddleOCREngine engine = new PaddleOCRSharp.PaddleOCREngine(config, oCRParameter);
{
ocrResult = engine.DetectText(ofd.FileName);
}
if (ocrResult != ) MessageBox.Show(ocrResult.Text, "识别结果");

表格识别示例

public void Test()
{
OpenFileDialog ofd = new OpenFileDialog();
ofd.Filter = "*.*|*.bmp;*.jpg;*.jpeg;*.tiff;*.tiff;*.png";
f (ofd.ShowDialog() != DialogResult.OK) return;

//模型配置,使用默认值
StructureModelConfig structureModelConfig = ;

//表格识别参数配置,使用默认值
StructureParameter structureParameter = new StructureParameter();
//初始化表格识别引擎
PaddleStructureEngine engine = new PaddleOCRSharp.PaddleStructureEngine(, structureParameter);
//表格识别,返回结果是html格式的表格形式
string result = engine.StructureDetectFile(ofd.FileName);
//添加边框线,方便查看效果
string css = "<style>table{ border-spacing: 0pt;} td { border: 1px solid black;}</style>";
result = result.Replace("<html>", "<html>" + css);
//保存到本地
string name=Path.GetFileNameWithoutExtension(ofd.FileName);
if (!Directory.Exists(Environment.CurrentDirectory + "\\out"))
{ Directory.CreateDirectory(Environment.CurrentDirectory + "\\out"); }
string savefile = $"{Environment.CurrentDirectory}\\out\\{name}.html";
File.WriteAllText(savefile, result);

//打开网页查看效果
Process.Start("explorer.exe", savefile);
}

结语

PaddleOCRSarp作为一款基于百度飞桨PaddleOCR的.NET OCR工具类库,为.NET开发者提供了强大的OCR功能支持。还有更多好玩的内容,感兴趣的自行去体验吧。

源码地址

https://gitee.com/raoyutian/paddle-ocrsharp



版权声明:本文来源于网络素材收集整理或网友供稿,版权归版权所有者所有,如有侵权请联系小编予以删除


相关推荐

好用的云函数!后端低代码接口开发,零基础编写API接口

前言在开发项目过程中,经常需要用到API接口,实现对数据库的CURD等操作。不管你是专业的PHP开发工程师,还是客户端开发工程师,或者是不懂编程但懂得数据库SQL查询,又或者是完全不太懂技术的人,通过...

快速上手:Windows 平台上 cURL 命令的使用方法

在工作流程中,为了快速验证API接口有效性,团队成员经常转向直接执行cURL命令的方法。这种做法不仅节省时间,而且促进了团队效率的提升。对于使用Windows系统的用户来说,这里有一套详细...

使用 Golang net/http 包:基础入门与实战

简介Go的net/http包是构建HTTP服务的核心库,功能强大且易于使用。它提供了基本的HTTP客户端和服务端支持,可以快速构建RESTAPI、Web应用等服务。本文将介绍ne...

#小白接口# 使用云函数,人人都能编写和发布自己的API接口

你只需编写简单的云函数,就可以实现自己的业务逻辑,发布后就可以生成自己的接口给客户端调用。果创云支持对云函数进行在线接口编程,进入开放平台我的接口-在线接口编程,设计一个新接口,设计和配置好接口参...

极度精神分裂:我家没有墙面开关,但我虚拟出来了一系列开关

本内容来源于@什么值得买APP,观点仅代表作者本人|作者:iN在之前和大家说过,在iN的家里是没有墙面开关的。...

window使用curl命令的注意事项 curl命令用法

cmd-使用curl命令的注意点前言最近在cmd中使用curl命令来测试restapi,发现有不少问题,这里记录一下。在cmd中使用curl命令的注意事项json不能由单引号包括起来json...

Linux 系统curl命令使用详解 linuxctrl

curl是一个强大的命令行工具,用于在Linux系统中进行数据传输。它支持多种协议,包括HTTP、HTTPS、FTP等,用于下载或上传数据,执行Web请求等。curl命令的常见用法和解...

Tornado 入门:初学者指南 tornados

Tornado是一个功能强大的PythonWeb框架和异步网络库。它最初是为了处理实时Web服务中的数千个同时连接而开发的。它独特的Web服务器和框架功能组合使其成为开发高性能Web...

PHP Curl的简单使用 php curl formdata

本文写给刚入PHP坑不久的新手们,作为工具文档,方便用时查阅。CURL是一个非常强大的开源库,它支持很多种协议,例如,HTTP、HTTPS、FTP、TELENT等。日常开发中,我们经常会需要用到cur...

Rust 服务器、服务和应用程序:7 Rust 中的服务器端 Web 应用简介

本章涵盖使用Actix提供静态网页...

我给 Apache 顶级项目提了个 Bug apache顶级项目有哪些

这篇文章记录了给Apache顶级项目-分库分表中间件ShardingSphere提交Bug的历程。说实话,这是一次比较曲折的Bug跟踪之旅。10月28日,我们在GitHub上提...

linux文件下载、服务器交互(curl)

基础环境curl命令描述...

curl简单使用 curl sh

1.curl--help#查看关键字2.curl-A“(添加user-agent<name>SendUser-Agent<name>toserver)”...

常用linux命令:curl 常用linux命令大全

//获取网页内容//不加任何选项使用curl时,默认会发送GET请求来获取内容到标准输出$curlhttp://www.baidu.com//输出<!DOCTYPEh...

三十七,Web渗透提高班之hack the box在线靶场注册及入门知识

一.注册hacktheboxHackTheBox是一个在线平台,允许测试您的渗透技能和代码,并与其他类似兴趣的成员交流想法和方法。它包含一些不断更新的挑战,并且模拟真实场景,其风格更倾向于CT...