引言
随着人工智能技术的飞速发展,OCR(光学字符识别)技术在我们的日常生活中扮演着越来越重要的角色。为了满足.NET开发者对于高效、便捷OCR工具的需求,今天推荐一款专为.NET开发者打造的OCR工具类库——PaddleOCRSarp
。
PaddleOCRSarp简介
PaddleOCRSarp
充分利用了百度飞桨PaddleOCR的强大功能,通过C++代码修改和封装,为.NET开发者提供了一个简单易用、功能强大的OCR工具类库。无论是文字识别、车牌识别还是表格识别,PaddleOCRSarp
都能轻松应对,帮助开发者快速实现OCR功能。
PaddleOCRSharp
封装极其简化,实际调用仅几行代码,极大的方便了中下游开发者的使用和降低了PaddleOCR的使用入门级别,同时提供不同的.NET框架使用,方便各个行业应用开发与部署。Nuget包即装即用,可以离线部署,不需要网络就可以识别的高精度中英文OCR。
本项目支持官方所有公开的通用OCR模型,PPOCRV2、PPOCRV3、PPOCRV4。如果使用v2模型,请设置OCR识别参数OCRParameter对象的属性rec_img_h=32,本项目默认使用V3模型,默认rec_img_h=48:
本项目只能在X64的CPU上编译和使用,只能在avx指令集上的CPU上使用。
本项目目前支持以下.NET框架:
net35;net40;net45;net451;net452;net46;net461;net462;net47;net471;net472;net48;net481;
netstandard2.0;netcoreapp3.1;
net5.0;net6.0;net7.0;net8.0
PaddleOCRSarp特点
? 高度集成:
PaddleOCRSarp
将百度飞桨PaddleOCR的核心功能完美集成到.NET平台,让开发者无需关心底层实现,只需调用相应接口即可实现OCR功能。? 性能卓越:得益于百度飞桨PaddleOCR的高效算法和C++代码的优化,PaddleOCRSarp在保持高度集成的同时,也保证了卓越的性能表现。
? 易于使用:
PaddleOCRSarp
提供了丰富的API接口和详细的文档说明,让开发者能够轻松上手,快速实现OCR功能。? 扩展性强:
PaddleOCRSarp
支持自定义模型加载和训练,开发者可以根据自己的需求进行模型扩展和优化。
PaddleOCRSarp源码文件夹结构
PaddleOCRSharp //该文件夹包含.NET对PaddleOCR封装类库项目
PaddleOCRDemo //该文件夹包含OCR示例Demo文件夹
|--PaddleOCRCppDemo //C++调用示例项目
|--PaddleOCRSharpDemo //.NET调用示例项目
|--python //python调用示例项目
|--Go //Golang调用示例项目
PaddleOCRSarp应用场景
PaddleOCRSarp
适用于各种需要OCR技术的.NET开发场景,如文档数字化处理、自动识别表单数据、车牌识别等。无论是企业级应用还是个人开发者,PaddleOCRSarp都能提供强大的OCR支持。
如何开始使用
要开始使用PaddleOCRSarp
,只需按照以下步骤操作:
下载并安装PaddleOCRSarp库
;
在您的.NET项目中引入PaddleOCRSarp
库;
调用PaddleOCRSarp
提供的API接口进行OCR操作;
根据需要自定义模型或调整参数。
OCR识别示例
OpenFileDialog ofd = new OpenFileDialog();
ofd.Filter = "*.*|*.bmp;*.jpg;*.jpeg;*.tiff;*.tiff;*.png";
if (ofd.ShowDialog() != DialogResult.OK) return;
//使用默认中英文V4模型
PaddleOCRSharp.OCRModelConfig config = ;
//使用默认参数
PaddleOCRSharp. OCRParameter oCRParameter = new PaddleOCRSharp.OCRParameter();
//识别结果对象
PaddleOCRSharp.OCRResult ocrResult = new PaddleOCRSharp.OCRResult();
//建议程序全局初始化一次即可,不必每次识别都初始化,容易报错。 PaddleOCRSharp.PaddleOCREngine engine = new PaddleOCRSharp.PaddleOCREngine(config, oCRParameter);
{
ocrResult = engine.DetectText(ofd.FileName);
}
if (ocrResult != ) MessageBox.Show(ocrResult.Text, "识别结果");
表格识别示例
public void Test()
{
OpenFileDialog ofd = new OpenFileDialog();
ofd.Filter = "*.*|*.bmp;*.jpg;*.jpeg;*.tiff;*.tiff;*.png";
f (ofd.ShowDialog() != DialogResult.OK) return;
//模型配置,使用默认值
StructureModelConfig structureModelConfig = ;
//表格识别参数配置,使用默认值
StructureParameter structureParameter = new StructureParameter();
//初始化表格识别引擎
PaddleStructureEngine engine = new PaddleOCRSharp.PaddleStructureEngine(, structureParameter);
//表格识别,返回结果是html格式的表格形式
string result = engine.StructureDetectFile(ofd.FileName);
//添加边框线,方便查看效果
string css = "<style>table{ border-spacing: 0pt;} td { border: 1px solid black;}</style>";
result = result.Replace("<html>", "<html>" + css);
//保存到本地
string name=Path.GetFileNameWithoutExtension(ofd.FileName);
if (!Directory.Exists(Environment.CurrentDirectory + "\\out"))
{ Directory.CreateDirectory(Environment.CurrentDirectory + "\\out"); }
string savefile = $"{Environment.CurrentDirectory}\\out\\{name}.html";
File.WriteAllText(savefile, result);
//打开网页查看效果
Process.Start("explorer.exe", savefile);
}
结语
PaddleOCRSarp
作为一款基于百度飞桨PaddleOCR的.NET OCR工具类库,为.NET开发者提供了强大的OCR功能支持。还有更多好玩的内容,感兴趣的自行去体验吧。
源码地址
https://gitee.com/raoyutian/paddle-ocrsharp
版权声明:本文来源于网络素材收集整理或网友供稿,版权归版权所有者所有,如有侵权请联系小编予以删除