发布时间:2023-02-08 09:20:55 来源:本站 作者:admin
从图像中提取文本是许多应用程序的常见任务。在本篇文章中,我们将介绍如何使用 AWS Textract 服务执行此操作。它不需要机器学习/人工智能专业知识,也不需要建立基础设施。您使用 SDK 调用服务,传递图像进行分析。响应包含从图像中提取的文本。
第一篇文章将从单个图像中提取文本,即一本书的第一页。
我们使用 Blazor 加载图像,将其发送到 Textract,在页面上显示图像,并显示提取的文本。在查看代码时请记住,我们的 Blazor 技能非常有限。
将文件上传到 Web 服务器而不仅仅是将其直接发送到 Textract 的原因是允许我们在处理之前在页面上显示图像(默认情况下,您无法提供位于 wwwroot 文件夹之外的文件)。
附加的 zip 包含完整的源代码,因此我们不会在这里一一介绍,而是仅显示 Textract 部分。
使用提取
创建客户端 -
private IAmazonTextract textractClient = new AmazonTextractClient();
私有检测文档文本响应?检测文档响应;
在后续文章中,我将展示如何使用依赖注入来创建客户端。
将上传的图片发送到 Textract -
detectDocumentResponse 包含提取的文本。
我们使用一些简单的 Blazor 代码在源图像旁边显示提取的文本。
结论
开始使用 Textract 很容易,但它可以做的不仅仅是从图像中提取文本。在后续文章中,我们将展示您可以使用 Textract 做的其他一些有趣和有用的事情。