本文将介绍如何使用C#代码来实现OCR功能。
一、在VS中新建一个控制台应用,选择.net框架,.net6.0~8.0均可。
创建好的项目如下图,然后在配置管理器中修改活动解决方案平台为x64,以及项目平台设置为x64。
二、安装 PaddleOCRSharp包
在nuget包管理器中,搜索PaddleOCRSharp,并安装最新版本,当前最新版本4.4.0.2。
三、编写代码
在main()方法中,键入以下代码:并准备好一张用于测试的图片,
//使用缺省OCR模型(PPOCR中英文V4模型)进行文字识别,并输出结果
Console.WriteLine(new PaddleOCRSharp.PaddleOCREngine().DetectText("D:\\test.jpg").Text);
//等待输入,用于控制台不直接退出。
Console.ReadKey()
然后按F5运行,查看识别结果。
你学会了吗?赶快动手实践吧!!!
四、PaddleOCRSharp简介
PaddleOCRSharp 是一个基于百度飞桨PaddleOCR的开源代码修改并优化的.NET版本OCR可离线使用类库。项目核心组件PaddleOCR.dll,由C++编写,根据百度飞桨PaddleOCR的C++代码修改并优化而成。目前已经支持C++、.NET、Python、Golang、Rust等众多开发语言的直接API接口调用。项目包含文本识别、文本检测、表格识别功能。本项目针对小图识别不准的情况下做了优化,同时做了其他优化,比飞桨原代码识别准确率有所提高,速度更快。包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持中英文、纯英文以及多种语言文本检测识别。
PaddleOCRSharp封装极其简化,实际调用仅几行代码,极大的方便了中下游开发者的使用和降低了PaddleOCR的使用入门级别,同时提供不同的.NET框架使用,方便各个行业应用开发与部署。Nuget包即装即用,可以离线部署,不需要网络就可以识别的高精度中英文OCR。
本项目支持官方所有公开的通用OCR模型,PPOCRV2、PPOCRV3、PPOCRV4。如果使用v2模型,请设置OCR识别参数OCRParameter对象的属性rec_img_h=32 ,最新版本默认使用V4模型,默认rec_img_h=48:
本项目支持在x86的CPU上使用,CPU指令集需要包含avx指令集。
★windows系统支持:win7SP1、win10、win11、winserver2012R2、winserver2016、winserver2019、winserver2022等
★linux系统支持(有偿服务):统信UOS、麒麟、ubuntu、CentOS8等绿色离线部署。
本项目目前支持以下.NET框架:
net35;net40;net45;net451;net452;net46;net461;net462;net47;net471;net472;net48;net481;
netstandard2.0;netcoreapp3.1;
net5.0;net6.0;net7.0;net8.0
五、结束语
PaddleOCR部署采用C++编码,具有以下特点:
高性能:
PaddleOCR基于PaddlePaddle深度学习框架,后者具有强大的计算性能和高效的并行计算能力。这使得PaddleOCR能够快速处理大规模的文本识别任务,尤其适用于需要高速处理大量图像数据的场景。
通过C++的部署方案,PaddleOCR能够进一步利用C++的高性能特性,优化内存管理和计算效率,从而提升整体性能。
多功能性:
PaddleOCR支持多种文本识别任务,包括文字检测、文字识别、场景文字识别等。这些功能通过C++的部署方案同样可以得到支持,满足不同场景下的文字识别需求。
此外,PaddleOCR还支持多种语言和手写体的识别,进一步扩展了其应用场景。
易用性:
PaddleOCR提供了简洁易用的API接口,方便开发者在C++环境中快速部署和使用OCR功能。
同时,PaddleOCR还提供了详细的文档和示例代码,帮助开发者快速上手并进行二次开发。
开源免费:
PaddleOCR是开源项目,其代码和模型都可以免费获取和使用。这意味着开发者可以根据自己的需求自由修改和定制PaddleOCR,以满足特定的应用场景。
支持定制化和扩展:
开发者可以根据自己的需求选择合适的PaddleOCR模型,并进行定制化和扩展。例如,可以通过训练自己的模型来优化特定场景下的识别效果。
此外,PaddleOCR还支持多种后端和前端技术的集成,方便开发者将其嵌入到自己的应用系统中。
通过结合PaddlePaddle深度学习框架的强大功能和C++的高性能特性,PaddleOCR能够为用户提供高效、准确、易用的OCR解决方案。
其他文章:
超赞!PaddleOCR在国产麒麟系统中的离线绿色部署
如何5分钟上手使用PaddleSeg人像抠图
图像处理技术OpencvSharp入门课程