Azure AI 中的文章

使用 PydanticAI 构建智能代理系统:从 MCP 到智能工单助手

在人工智能快速发展的今天,智能代理(Agentic AI) 成为了一个热门话题。本文将介绍如何使用 PydanticAI 构建智能代理系统,包括与 MCP(Model Context Protocol) 的集成以及一个实际的智能工单助手应用案例。

PydanticAI 与 MCP 简介

PydanticAI 是一个强大的 Python 库,它允许开发者以类型安全的方式定义和使用 AI 代理。它与 Pydantic v2 完美集成,提供了清晰的数据验证和模式定义能力。而 MCP(Model Context Protocol) 则是一个标准化协议,用于定义 LLM 如何与工具交互。

……

阅读全文

使用 Semantic Kernel Python 集成 Google A2A协议

Google的Agent-to-Agent(A2A)协议旨在实现不同AI代理之间的无缝互操作性。而微软的**Semantic Kernel(SK)**是一个开源平台,用于协调智能代理的交互。本文将介绍如何将Semantic Kernel代理集成到A2A生态系统中,并作为A2A服务器高效地路由代理调用到专业服务。

……

阅读全文

使用 TypeScript 构建 Azure AI Agent 的 MCP 服务器

简介

这篇文章将带你了解如何使用 TypeScript 构建一个 Model Context Protocol (MCP) 服务器,以连接 Azure AI Agent 和 Claude Desktop 或其他支持 MCP 的客户端。通过本文,你将学习搭建服务器、配置连接以及以编程方式处理 AI Agent 的交互。


为什么需要 MCP 服务器?

Azure AI Agent 是 Azure AI Foundry 生态系统的一部分,提供强大的对话式 AI 功能。然而,要将这些 Agent 集成到桌面应用程序中,往往需要定制化的解决方案。MCP 提供了一个标准化协议,可以无缝连接 Azure AI Agent 和支持 MCP 的客户端(如 Claude Desktop)。

……

阅读全文

通用模型与推理模型:Azure OpenAI 的选择指南

随着大型语言模型(LLM)的普及,市场上涌现了许多不同类型的模型,满足从日常聊天到高级科学推理的各种任务需求。如果你熟悉 GPT-3.5 和 GPT-4,你会知道它们在通用 AI 领域设立了高标准。然而,随着技术的发展,模型之间的差异也变得更加显著。

本文将从以下几个方面探讨通用模型与推理模型的区别,并结合 Azure OpenAI 提供的具体模型进行说明:

……

阅读全文

用 CSnakes 把 MarkItDown 嵌入到 .NET 应用程序中

最近在开发智能文档搜索的工作中,我需要将各种文件转换为 Markdown 格式,然后通过向量化计算,把它们创建到向量数据库中,以便实现语义搜索文档的功能。并结合 LLMs 和 RAG(Retrieval Augmented Generation)来获取与搜索目标相关的文档内容完成二次创作。由于多模态下需要处理的文档类型太多了,我曾用 python 写了几个工具方法,使用 MarkItDown 来统一处理的。但现实问题是 MarkItDown 目前没有 .NET 版本的实现,而我的应用是 .NET 的程序,如果能有一个办法将 python 脚本无缝嵌入到我的 .NET 应用程序中那就太棒了,这就是我为什么要使用 CSnakes 的原因。

……

阅读全文

基于Azure AI搜索和GPT-4o实时音频的语音化RAG

本文介绍了一种简单的语音生成式 AI 应用架构,通过结合新的 gpt-4o-realtime-preview 模型和 Azure AI Search,实现了 RAG 模式。新的 Azure OpenAI gpt-4o-realtime-preview 模型以其语音到语音的功能,为更自然的应用程序用户界面打开了大门。这种新的基于语音的界面也带来了一个有趣的新挑战:如何在使用音频作为输入和输出的系统中实现检索增强生成 (RAG)?

RAG 是一种将语言模型与您自己的数据相结合的流行模式。我们将介绍一种简单的语音生成式 AI 应用架构,该架构支持在实时音频 API 之上进行 RAG,并支持来自客户端设备的全双工音频流,同时安全地处理对模型和检索系统的访问。

……

阅读全文

使用MLX调用Phi-4模型

在当今的AI技术浪潮中,微软推出的Phi-4模型无疑是一个令人瞩目的创新。作为小型语言模型(SLM)的最新成员,Phi-4以其14B参数的强大性能和卓越的复杂推理能力,展示了AI技术在数学、编程和长文本处理等领域的巨大潜力。本文将详细介绍如何使用MLX框架调用Phi-4模型,并探讨其在不同应用场景中的实际效果。

……

阅读全文

Magentic-One:用于解决复杂任务的通用多代理系统

微软研究团队推出了一个新开发的多智能体系统——Magentic-One。这个系统能够解决各种领域的开放性网络和文件任务,是朝着开发能够完成人们在工作和生活中遇到的各种任务的智能体迈出的重要一步。他们还在微软的AutoGen框架上发布了Magentic-One的开源实现。

现场1

未来的AI将更加注重行动。AI系统正在从简单的对话转变为实际完成任务,这将是AI价值的真正体现。比如,从推荐晚餐选项的生成性AI,到能够自主下单和安排送餐的代理助手。从总结研究论文到积极搜索和整理相关研究以完成全面的文献综述。

……

阅读全文

使用 GPT-4o 实时 API 构建一个语音机器人

语音技术正在改变我们与机器互动的方式,使与AI的对话感觉比以往任何时候都更加自然。随着 GPT-4o 实时API的公开测试版发布,开发人员现在可以使用这些工具在应用程序中创建低延迟、多模态的语音体验,从而为创新开辟了无限的可能性。

过去构建语音机器人需要将多个模型拼接在一起,用于语音识别、推理和文本转语音等操作。而现在借助实时API,开发者只需通过一个API调用即可完成整个过程,从而实现流畅、自然的语音对话。这对于客户支持、教育和实时语言翻译等行业来说是一个重大变革,因为在这些行业中,快速、无缝的交互至关重要。

……

阅读全文

检索增强微调:使用 GPT-4o 微调 GPT-4o mini 模型以适用于特定领域应用

对企业来说,生成式AI最具影响力的应用之一是创建自然语言界面,这些界面已根据特定领域和使用场景的数据进行了定制,以提供更准确、更准确的响应。这意味着回答与银行、法律和医疗等特定领域相关的问题。

我们经常谈到实现这一目标的两种方法:

  1. 检索增强生成(RAG):将这些文档存储在向量数据库中,在查询时根据它们与问题的语义相似度来检索文档,然后将它们作为LLM的上下文。
  2. 监督微调(SFT):在一组代表特定领域知识的提示和响应上对现有的基线模型进行训练。

虽然大多数尝试使用RAG的组织都试图通过其内部知识库来扩展LLM的知识,但许多组织在没有进行显著优化的情况下未能达到预期效果。同样,精心挑选一个足够大且高质量的数据集用于微调也是一项具有挑战性的任务。这两种方法都有局限性:微调将模型限制在其已训练的数据上,使其容易受到近似和幻觉的影响,而RAG虽然可以使模型落地,但它仅根据查询与文档的语义接近程度来检索文档——这可能与查询无关,并导致给出的解释不充分。

……

阅读全文