Azure AI 中的文章

训练自定义表单识别器并对其进行基准测试

image

步骤概述

定制的 OCR 解决方案提供了在文档或图像中定义唯一类别的功能。通过与各种客户合作开发定制 OCR 解决方案,我们经常听到这样的问题:“此解决方案在我的数据上表现如何?我们开发了一种方法,允许使用表单识别器工作室根据自定义数据对 Microsoft 的表单识别器进行基准测试,并在一个过程中使用基本事实批注训练自定义模型。

使用表单识别器工作室批注基本事实

在训练自定义表单识别器模型之前,必须具有标记或批注的数据集,也称为基本事实。为了提供注释过程的示例,我们创建了一个扫描的手写邮政地址的示例图像。真实名称为“John Doe”,地址为“000 Fifth Ave, NY 10065, USA”,如下图所示:

……

阅读全文

AI 预测你在视频中可能购买哪些服装

Azure 视频索引器很高兴地宣布推出一项名为“特色服装”的新功能,该功能现已推出公共预览版。

借助此功能,发布商和广告主可以利用深入的上下文理解,在观看者最容易接受与广告互动的最相关时间投放最相关的广告。

这种洞察力使用先进的人工智能来深入了解关键时刻、主要角色、重要场景和所显示的情感,所有这些都是为了识别视频中出现的关键服装项目。对于这些服装商品,我们会提供它们出现的确切帧以及更多信息(例如边界框和时间码),这些信息可以帮助广告主和发布商匹配类似服装商品的相关广告,并将其放置在该商品在视频中展示的确切时刻。

……

阅读全文

使用 Azure 表单识别器生成可搜索的 PDF

PDF文档广泛用于业务流程。数字创建的 PDF 使用起来非常方便。可以搜索、突出显示和批注文本。不幸的是,许多PDF是通过扫描图像或将图像转换为PDF来创建的。这些 PDF 中没有数字文本,因此无法搜索它们。在这篇博文中,我们演示了如何使用简单易用的代码和 Azure 表单识别器将此类 PDF 转换为可搜索的 PDF。

Azure 表单识别器概述

Azure 表单识别器是一种基于云的 Azure 应用 AI 服务,它使用深度机器学习模型从文档中提取文本、键值对、表和表单字段。在这篇博文中,我们将使用表单识别器提取的文本将其添加到 PDF 中,使其可搜索。

……

阅读全文

利用 AutomatedML 模型背后的训练代码

概述

我们很高兴地宣布正式发布自动化机器学习 (AutoML) 训练代码生成。借助此功能,用户可以查看其 AutoML 模型背后的训练脚本,以确保他们对模型的训练方式完全透明。用户还可以使用该脚本根据其用例的需要自定义/调整训练,从而使他们能够快速将 AutoML 模型转移到生产环境中。

为什么这很重要?

AutoML对于数据科学家来说是一个非常强大的工具。他们需要做的就是提供数据并配置基本作业参数,AutoML 会迭代适用的 ML 算法,以根据提供的数据和所选的准确性指标训练理想的模型。然而,我们经常听到 AutoML 是一个黑匣子——禁止数据科学家生产 AutoML 模型。

……

阅读全文

在 Azure Machine Learning 中使用 Azure Container for PyTorch 启用深度学习

概述

由于AzureML是许多PyTorch开发人员的首选平台,我们开发了新的Azure Container for PyTorch(ACPT),这是一个精心策划的环境,包括最好的Microsoft技术,用于在Azure上使用PyTorch进行训练。我们很高兴地宣布 Azure 机器学习 (AzureML) 中的 ACPT 公共预览版。这个新的特选环境是一个轻量级的独立环境,其中包含在 AzureML 上有效运行大型模型优化训练所需的组件。默认情况下,AzureML 特选环境在用户的工作区中可用,并由使用最新版本的 AzureML SDK 的缓存 Docker 映像提供支持。它有助于降低准备成本并缩短部署时间。

……

阅读全文

Azure Cognitive Search 支持交换索引

搜索索引是不可变的,这意味着如果需要更新索引,通常需要删除并重新生成索引或创建新索引,然后迁移应用程序。像这样交换搜索索引会增加管理搜索索引的复杂性,如果最终需要在多个位置更新应用程序设置或需要重新部署代码,则可能会很困难。

为了帮助更轻松地交换索引,Azure 认知搜索现在支持预览版提供的索引别名。别名是辅助名称,可用于引用索引以进行查询、索引和其他文档操作。您可以通过 REST APIVisual Studio Code 扩展SDK 创建别名。

POST https://[service name].search.windows.net/aliases?api-version=2021-04-30-Preview

1
2
3
4
{
   "name": "my-alias",
   "indexes": ["hotel-samples-index"]
}

如果您发现自己相当频繁地更新搜索索引,则可能会从使用别名中受益。下图显示了在应用程序中使用索引别名的典型工作流。 image

……

阅读全文

Azure 机器学习与 H2O.ai 的新集成

在当今复杂的云环境中,公司使用来自多个来源的技术是很常见的。云计算平台通常是企业IT环境的基础,由独立软件供应商和满足业务和工业垂直需求的产品补充。通过 H2O.ai 和 Azure 机器学习之间的集成,我们使客户能够使用类似 SaaS 的工具实现模型创建民主化,并选择符合其企业要求的部署技术。

使用 H2O.ai 的 AzureML 集成,H2O.ai 中构建的模型现在显示为 AzureML 工作区中的已部署模型。这意味着任何用户或产品现在都可以通过简单的 API 调用利用 AzureML 中托管的 H2O.ai 模型的推理终结点。这使得组织模型的采用更加容易,允许用户访问整个企业 IT 环境中的模型,而无需更改现有的部署策略。

……

阅读全文