Mistral AI 推出用于文本和图像处理的 Pixtral 12B

首页 > 图文 > 正文

发布时间：2024-09-13 12:39:02 来源：本站作者：admin

总部位于巴黎的人工智能初创公司 Mistral AI 推出了其首个多模态模型 Pixtral 12B。该模型旨在处理文本和图像，标志着该公司取得了显著的进步。

Pixtral 12B 概述

Pixtral 12B 在 Mistral 之前的文本模型 Nemo 12B 的基础上添加了一个 4 亿参数的视觉适配器。使用增强功能可以通过 URL 或文本中的 base64 编码进行图像处理。它拥有 120 亿个参数，大小约为 24GB，可以执行图像字幕和对象识别等任务。

在功能方面，Pixtral 12B 与其他多模态模型（如 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4）并驾齐驱。它旨在在图像分析任务中表现出色，包括生成字幕、识别对象和回答与图像相关的问题。

访问和许可

开发人员可以通过 GitHub 和 Hugging Face 平台上的种子链接获取 Pixtral 12B。它根据 Apache 2.0 许可证分发，允许不受限制地使用和定制。开源策略旨在促进广泛采用和修改。

虽然 Mistral 没有指定用于训练 Pixtral 12B 的确切数据集，但生成式 AI 模型利用大量公开可用的数据是很常见的。Mistral 的方法引发了法律争论，特别是围绕版权材料的使用。一些人声称公共数据抓取属于“合理使用”，这一观点仍然存在争议，并导致了涉及知名 AI 公司的法律纠纷。

Mistral 最近获得了由 General Catalyst 牵头的 6.45 亿美元融资，目前估值为 60 亿美元。该公司部分由微软拥有，旨在成为 OpenAI 的欧洲替代品。Mistral 的战略包括免费提供开放模型，同时将托管版本和咨询服务货币化。

此次合作标志着微软迈出了重要的一步，因为它正寻求扩展其 AI 产品，让 Azure AI 客户能够访问 Mistral AI 开发的大型语言模型。此次合作始于将 Mistral 的大型语言模型 (LLM) 集成到 Azure AI 服务中，现在，Mistral 小型 LLM 也已向客户开放。

热门城市：