跳到主要内容

Azure AI

介绍

Mistral AI 的开源模型和商业模型可以通过两种方式部署在 Microsoft Azure AI 云平台上

  • 按用量付费的托管服务:使用模型即服务(MaaS)无服务器 API 部署,按端点使用量计费。部署不需要 GPU 容量配额。

  • 实时端点:根据您选择部署的底层 GPU 基础设施,按配额计费。

本页面重点介绍 MaaS 服务,其中提供以下模型

  • Mistral Large (24.11, 24.07)
  • Mistral Small (24.09)
  • Ministral 3B (24.10)
  • Mistral Nemo

更多详细信息,请访问模型页面。

入门

以下部分概述了在 Azure AI MaaS 平台上部署和查询 Mistral 模型的步骤。

部署模型

按照Azure 文档中的说明,为您选择的模型创建新的部署。部署后,记下其对应的 URL 和密钥。

查询模型

部署的端点暴露了一个 REST API,您可以使用 Mistral 的 SDK 或纯 HTTP 调用来查询。

要运行以下示例,请设置以下环境变量

  • AZUREAI_ENDPOINT: 您的端点 URL,格式应为 https://your-endpoint.inference.ai.azure.com/v1/chat/completions
  • AZUREAI_API_KEY: 您的密钥。
curl --location $AZUREAI_ENDPOINT/v1/chat/completions \
--header "Content-Type: application/json" \
--header "Authorization: Bearer $AZURE_API_KEY" \
--data '{
"model": "azureai",
"messages": [
{
"role": "user",
"content": "Who is the best French painter? Answer in one short sentence."
}
]
}'

深入了解

更多详细信息和示例,请参考以下资源