Pixtral 12B - Mistral
法国人工智能初创公司 Mistral 最近推出了其首个多模态模型 Pixtral 12B,该模型可同时处理图像和文本。Pixtral 12B 以 Mistral 的 Nemo 12B 文本模型为基础,拥有 120 亿个参数(大小为 24GB),使其能够执行为图像添加字幕和计算照片中的物体数量等任务。
该模型可在 GitHub 和 Hugging Face 上下载,遵循 Apache 2.0 许可,允许无限制使用,包括微调和商业应用。
Pixtral 12B 可与其他多模态模型(如 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4)相媲美,能够使用 URL 或 base64 编码格式回答基于图像的问题。虽然在发布时没有提供网络演示,但 Mistral 计划很快通过其聊天机器人和 API 平台推出测试。
此次发布是该公司完成 6.45 亿美元融资之后的又一举措,凸显了 Mistral 通过专注于开放模型和企业咨询服务与主要 AI 公司竞争的雄心。
第一个多模式模型:Mistral 的 Pixtral 12B 可以处理文本和图像,扩大了其适用性。
参数量大:Pixtral 12B 拥有 120 亿个参数,可提供增强的问题解决能力。
开源可用性:该模型在 Apache 2.0 许可下可用,允许不受限制地使用和微调。
可下载的平台:Pixtral 12B 可以从 GitHub 和 Hugging Face 下载,从而轻松访问。
未来测试计划:Mistral 将很快在其聊天机器人和 API 服务平台 Le Chat 和 Le Plateforme 上为 Pixtral 12B 提供测试。
1) 什么是 Pixtral 12B?
Pixtral 12B 是 Mistral 第一个同时处理图像和文本的多模式模型。
2) Pixtral 12B 有多大?
该模型有120亿个参数,对应大小约为24GB。
3) 我可以在哪里下载 Pixtral 12B?
Pixtral 12B 可通过 GitHub 和 Hugging Face 下载。
4) Pixtral 12B 是根据什么许可发布的?
Pixtral 12B 在 Apache 2.0 许可下分发,允许不受限制地使用。
5) Pixtral 12B 何时可以进行测试?
Mistral 计划很快在其聊天机器人和 API 平台 Le Chat 和 Le Plateforme 上提供 Pixtral 12B 的测试。