利用 WebSocket 实现 GPT-4o-transcribe 和 GPT-4o-mini-transcribe 的实时语音转录

Azure OpenAI 最近增强了其语音识别产品,推出了两款令人印象深刻的模型:GPT-4o-transcribe 和 GPT-4o-mini-transcribe。它们的一个关键特性是利用 WebSocket 连接进行实时音频流转录。这为开发者们提供了构建语音转文本应用的先进工具。本文将深入探讨这些模型的工作原理,并提供一个用 Python 实现的实用示例。

……

阅读全文

[译]基于模型的机器学习 - 1.1 整合证据

贝叶斯博士彻底搜查了整个豪宅。她发现可用的武器只有一把装饰性匕首和一把旧军用左轮手枪。“凶器一定是其中之一”,她得出结论。

到目前为止,我们只考虑了一个随机变量murderer(凶手)。但现在我们有了关于可能凶器的新信息,我们可以引入一个新的随机变量 weapon(武器)来表示凶器的选择。这个新变量可以取两个值:revolver(左轮手枪)或 dagger(匕首)。有了这个新变量,下一步就是使用概率来表达它与我们现有的 murderer 变量之间的关系。这将让我们能够推理这些变量如何相互影响,并在破案中取得进展。

……

阅读全文

使用 PydanticAI 构建智能代理系统:从 MCP 到智能工单助手

在人工智能快速发展的今天,智能代理(Agentic AI) 成为了一个热门话题。本文将介绍如何使用 PydanticAI 构建智能代理系统,包括与 MCP(Model Context Protocol) 的集成以及一个实际的智能工单助手应用案例。

PydanticAI 与 MCP 简介

PydanticAI 是一个强大的 Python 库,它允许开发者以类型安全的方式定义和使用 AI 代理。它与 Pydantic v2 完美集成,提供了清晰的数据验证和模式定义能力。而 MCP(Model Context Protocol) 则是一个标准化协议,用于定义 LLM 如何与工具交互。

……

阅读全文

[译]基于模型的机器学习 - 第一章 谋杀之谜

谋杀之谜

当老都铎王朝豪宅的午夜钟声敲响时,一场狂风暴雨嘎嘎作响地敲响了百叶窗,房子里充满了雷声。布莱克先生的尸体倒在图书馆的地板上,鲜血仍在从致命伤口中渗出。很快赶到现场的是著名的侦探贝叶斯博士,他观察到谋杀时豪宅里只有另外两个人。那么是谁犯下了这种卑鄙的罪行呢?是格雷少校那根正直的柱子吗?还是神秘而诱人的蛇蝎美人奥本小姐?

……

阅读全文

[译]基于模型的机器学习 - 如何用机器学习解决我的问题?

作为机器学习研究人员,我们几乎每天都会被问到这样一个问题:

“机器学习如何解决我的问题?”

在本书中,我们将通过实例来回答这个问题。我们不仅仅列举机器学习技术和概念,而是通过一系列案例研究,从问题陈述到工作解决方案的全过程来说明。在解决每个问题的过程中,我们会逐步解释所涉及的机器学习概念。我们展示的案例研究都是来自微软的真实例子,以及一个介绍核心概念的初始案例研究。我们还会探讨在每个案例研究中遇到的实际问题,以及它们是如何被发现、诊断和解决的。我们的目标不仅是解释机器学习方法是什么,还要说明如何创建、调试和改进它们来解决你的问题。

……

阅读全文

[译]基于模型的机器学习 - 前言

如今,机器学习正被应用于越来越多的领域,面临着各种各样的问题。在进行机器学习时,一个根本性的挑战是将某种机器学习技术的抽象数学与具体的现实问题联系起来。本书通过“基于模型的机器学习”方法来应对这一挑战。

基于模型的机器学习是一种关注于理解机器学习系统中所蕴含假设及其对系统行为影响的方法。其实践过程是将对现实世界的假设与实现机器学习所需的详细算法数学分离开来。这种方法不仅有助于理解机器学习系统的行为,也便于与他人沟通。

……

阅读全文

[译]基于模型的机器学习 - 目录

  • 前言

    本书简介、适用读者及阅读方法

  • 如何用机器学习解决我的问题?

    什么是基于模型的机器学习及其如何帮助解决问题

    1. 谋杀之谜

    通过解决一起谋杀案介绍基于模型的机器学习的核心概念

    关键词:概率、随机变量、概率推断、概率模型、因子图、贝叶斯定理

    1. 评估人的技能

    基于模型的机器学习的第一个应用:根据测试答案评估一个人具备哪些技能

    关键词:消息传递算法、循环置信传播、可视化、评估指标、ROC曲线

    ……

阅读全文

使用 Semantic Kernel Python 集成 Google A2A协议

Google的Agent-to-Agent(A2A)协议旨在实现不同AI代理之间的无缝互操作性。而微软的**Semantic Kernel(SK)**是一个开源平台,用于协调智能代理的交互。本文将介绍如何将Semantic Kernel代理集成到A2A生态系统中,并作为A2A服务器高效地路由代理调用到专业服务。

……

阅读全文

使用 TypeScript 构建 Azure AI Agent 的 MCP 服务器

简介

这篇文章将带你了解如何使用 TypeScript 构建一个 Model Context Protocol (MCP) 服务器,以连接 Azure AI Agent 和 Claude Desktop 或其他支持 MCP 的客户端。通过本文,你将学习搭建服务器、配置连接以及以编程方式处理 AI Agent 的交互。


为什么需要 MCP 服务器?

Azure AI Agent 是 Azure AI Foundry 生态系统的一部分,提供强大的对话式 AI 功能。然而,要将这些 Agent 集成到桌面应用程序中,往往需要定制化的解决方案。MCP 提供了一个标准化协议,可以无缝连接 Azure AI Agent 和支持 MCP 的客户端(如 Claude Desktop)。

……

阅读全文

通用模型与推理模型:Azure OpenAI 的选择指南

随着大型语言模型(LLM)的普及,市场上涌现了许多不同类型的模型,满足从日常聊天到高级科学推理的各种任务需求。如果你熟悉 GPT-3.5 和 GPT-4,你会知道它们在通用 AI 领域设立了高标准。然而,随着技术的发展,模型之间的差异也变得更加显著。

本文将从以下几个方面探讨通用模型与推理模型的区别,并结合 Azure OpenAI 提供的具体模型进行说明:

……

阅读全文