微软推出首款 AI 图像生成器，以这些特殊功能挑战 OpenAI Sora

October 15, 2025 Editorialge Chinese Desk

您可以打开目录 show

微软在人工智能（AI）领域迈出了重要一步，推出了首个由公司自主开发的 AI 图像生成器——MAI-Image-1。该模型由微软位于美国华盛顿州雷德蒙德的工程团队完全独立研发，未依赖任何外部合作伙伴。这一发布标志着微软在人工智能领域的一个重大里程碑，因为公司长期以来一直致力于减少对像 OpenAI 这样的第三方的依赖。自 2024 年底两家公司合作关系终止后，微软便开始专注于强化自家的 AI 研发能力。

据微软官员介绍，MAI-Image-1 的首要目标是为创作者、设计师和内容制作者带来真正的价值。该 AI 工具旨在解决其他模型常见的问题，例如图像重复或风格单一等限制创意的现象。微软在开发过程中，广泛听取了专业艺术家、摄影师和设计专家的反馈，确保生成的作品尽可能真实实用。举例来说，如果你想生成一幅复杂的自然风景图，这一工具不仅能提供准确的细节，还能增加画面的层次感，这与传统的 AI 工具截然不同。

微软新图像生成器的特点

微软明确表示，MAI-Image-1 专注于生成照片级真实感图像，这是其最大的独特卖点（USP）。它能精准地再现光照条件、自然反射以及精细的景观细节。设想你想创作一张日落时分的海景照片——此模型不仅能捕捉正确的色彩，还能逼真地呈现水面的光晕、天空的渐变光线以及轻微的薄雾。微软声称，该模型在生成速度上也表现卓越，为创作者节省大量时间，提高生产力。根据微软的内部测试，MAI-Image-1 在速度和质量方面均优于许多更大但运算缓慢的模型。

尽管微软没有点名竞争对手，但目前 AI 图像生成领域由 OpenAI 和谷歌等巨头主导。微软试图与 OpenAI 拉开距离，因为两者关系近期有些紧张——OpenAI 坚持独立发布部分技术，而微软则希望以投资换取独家使用权。如今，微软正致力于建立 AI 独立生态，这一举措或将有利于其企业级应用。

为了了解竞争格局，OpenAI 已在美国和加拿大的 Apple App Store 上架了其 Sora 应用。该应用基于 Sora 2 引擎，让用户可以生成自己的 AI 视频，比如创建在虚拟场景中漫步的个人化头像。用户还能将这些视频分享到社交媒体，从而简化创意内容的制作。但 Sora 主要专注于视频生成，而 MAI-Image-1 则专攻静态图像。

另一方面，谷歌凭借其实验性图像生成引擎——Nano Banana 引起了广泛关注。社交媒体用户使用这一工具制作各种流行趋势内容，比如搞笑表情包或艺术特效。据报道，印度拥有该工具的最大用户群，每天有数百万用户在使用谷歌的 AI 工具。谷歌的优势在于其与搜索和云服务的无缝集成，而微软的优势则在于企业级 AI 生态系统的整合能力。

微软表示，MAI-Image-1 已进入 LMSYS Arena（原 LMArena）的前十名模型榜单。LMSYS Arena 是一个权威的 AI 基准测试平台，人工评审者会通过盲测比较不同 AI 模型的输出结果，并根据质量、相关性和创意性进行投票。这项排名表明，MAI-Image-1 不仅具备竞争力，而且已做好实际应用的准备。

与微软其他 AI 项目的整合

该新模型已与微软的其他内部 AI 项目实现联动。例如，MAI-Voice-1 是一个自然语音生成器，可生成逼真的语音输出；MAI-1-preview 则是一款能应对复杂问题的聊天机器人。此外，微软最近还将 Anthropic 的 AI 模型（如 Claude）整合进 Microsoft 365 的功能中，为 Word 与 PowerPoint 等生产力工具提供 AI 辅助。这一策略使微软能灵活采用多供应商的 AI 方案，在市场上建立更强的竞争力。

公开发布日期

目前，MAI-Image-1 仅在 LMSYS Arena 上开放试用，任何用户都可以进行测试并反馈体验。微软官方宣布，该模型将很快整合进 Copilot（微软 AI 助手）和 Bing 图像生成器中。届时，用户可通过 Copilot 的聊天界面直接生成图像，而 Bing 图像生成器则会提供基于搜索的创作功能。