Magic
Magic 是一家人工智能研究公司,致力于构建前沿的代码模型,以自动化软件工程和研究。团队相信,实现安全通用人工智能(AGI)的最有前途的路径是通过自动化人工智能研究和代码生成,让模型能够自我增强,而对齐工作也能超越人类单独完成的范围。他们的网站将这项工作定位为通向AGI的基础性研究,而非简单的SaaS产品。
这项技术的赌注结合了前沿规模的预训练、特定领域的强化学习、超长上下文和推理时的计算能力。Magic 的 LTM(Long-Term Memory,长时记忆) 架构特别针对软件开发:使模型在推理过程中能够同时持有完整的代码库、文档和私有库,而无需仅依赖训练中的模糊记忆。
Magic 已经筹集了5.15亿美元,在谷歌云的超级计算机上运行数千个 NVIDIA GB200 GPU,并通过与 METR 共同制定的 AGI readiness 政策发布了安全承诺。公司是一个小型的工程与研究团队,总部位于旧金山,正在招聘内核、预训练系统、推理、强化学习和安全方面的专家。
LTM-2-mini 在1亿个tokens中运行,大约相当于1000万行代码
HashHop基准测试通过压力测试检索,无简单语义捷径
定制的CUDA训练和推理堆栈,未使用torch autograd构建
Google Cloud GB200 NVL72集群可扩展至数万台Blackwell GPU
AGI准备政策通过METR指导跟踪危险能力
原型模型无人工辅助编辑了像Documenso这样的真实开源仓库
LTM 架构以极低的标准注意力内存成本实现 1 亿标记上下文。
发布了包含 METR 输入和明确危险能力阈值的 AGI 准备政策。
获得 5.15 亿美元资金及谷歌云 GB200 超级计算机,支持大规模训练。
在研究原型中展示了对真实开源代码库的无辅助代码编辑。
HashHop 基准解决了流行长上下文评估中的已知弱点。
截至调研日期,magic.dev 上无公开产品、定价页面或自助访问。
Frontier 模型仍处于研究阶段;博客中指出原型合成质量尚未具备竞争力。
以招聘为主的网站对消费者或企业的可用时间表提供的细节有限。
Magic 是做什么的?
Magic 构建前沿的代码模型和自主代理,旨在实现软件工程和人工智能研究的自动化。其 LTM(长期记忆)模型专注于超长上下文窗口,因此代码合成在推理时可以看到完整的代码仓库、文档和库,而不仅仅是训练中记住的内容。
Magic 的上下文窗口有多大?
Magic 的 LTM-2-mini 模型在推理时支持多达 1 亿个 token 的上下文,Magic 认为这大约相当于 1000 万行代码或 750 本小说。早期在 Magic 博客宣布的 LTM-1 模型拥有 500 万个 token 的上下文窗口。
Magic 融资规模是多少?
根据其主页和 2024 年 8 月的研究更新,Magic 总共筹集了 5.15 亿美元资金。投资者名单包括 Nat Friedman、Daniel Gross、CapitalG、Elad Gil、Sequoia、Jane Street、Eric Schmidt 和 Atlassian。
Magic 是否有公开定价或注册?
Magic 的网站没有列出产品定价或公开的自助注册入口。网站重点展示研究更新、安全政策和招聘信息。抓取的网站导航中也没有定价页面。
Magic 如何看待 AI 安全?
Magic 发布了由 METR 协助制定的《AGI 准备政策》(版本 1.0,2024 年 7 月)。该政策承诺在部署前沿编码模型前进行危险能力评估,涵盖网络攻击、AI 研发加速、自主复制和生物武器协助等威胁模型。安全相关咨询请发邮件至 [email protected]。
Magic 总部在哪里?
Magic 总部位于旧金山。magic.dev 上的招聘信息显示,大部分工程和研究职位在旧金山,部分核心和基础设施岗位支持远程工作。
HashHop 是什么?
HashHop 是 Magic 开发的长上下文评估基准,使用随机哈希对代替语义明显的“needle”。Magic 设计它是因为现有基准如 Needle In A Haystack 允许模型通过识别异常文本作弊,Magic 已在 GitHub 上发布 HashHop 供他人使用。

