当Fable 5全球下架,GLM 5.2逼近Opus 4.8“意义重大”

华尔街见闻06-17

中国开源大模型GLM-5.2的发布,与Anthropic两款前沿模型因美国出口管制被紧急下架,在同一时间节点形成对照,凸显AI行业正在同时经历技术供给与监管边界的重塑。

智谱AI发布的GLM-5.2在长程编程基准FrontierSWE上取得74.4分,仅落后Anthropic顶级闭源模型Opus 4.8约1个百分点,并超过GPT-5.5。该模型采用MIT协议开源,成为目前最强开源权重模型之一,显示开源阵营正在进入与闭源前沿模型正面竞争的区间。

几乎同步,据彭博报道,美国商务部长Howard Lutnick致信Anthropic,援引出口管制法规,要求其在向全球任何外国人提供Fable 5和Mythos 5访问权限前取得政府许可证。Anthropic随后紧急关闭两款模型的全球访问权限。

这一组合事件正在改变投资者对AI产业链的判断。开源模型的性能追赶,正在削弱闭源模型的定价权和可替代性优势;而美国监管对前沿模型的直接干预,则提高了闭源商业模型的可获得性风险。东方证券认为,开源模型有望获得更多份额,国内模型迭代也将继续支撑算力与Token服务需求高增。

GLM-5.2逼近闭源前沿模型,开源首次进入核心竞争区

GLM-5.2的关键意义,不在于单项指标领先,而在于其把开源模型推入了前沿闭源模型的竞争半径。

根据发布数据,GLM-5.2参数规模为753B,配备1M token稳定上下文窗口,采用MIT协议完全开源。在FrontierSWE基准上,GLM-5.2得分74.4,Opus 4.8为75.1,差距约1个百分点,同时超过GPT-5.5的72.6,也显著高于Opus 4.7。

在PostTrainBench这一测试Agent训练小模型能力的基准中,GLM-5.2以34.3分排名第二,仅次于Opus 4.8的37.2,高于GPT-5.5的28.4。这意味着GLM-5.2不仅在代码任务上表现突出,也在Agent相关能力上接近前沿闭源模型。

差距仍然存在。在最高难度的SWE-Marathon基准上,GLM-5.2得分13.0,Opus 4.8为26.0,仍有明显落后。但在开源阵营内部,GLM-5.2保持优势,同类开源模型Gemini 3.1 Pro在该基准上得分为4.0。

AI研究机构Proximal评价称,GLM-5.2是“第一个真正缩小了Anthropic/OpenAI与其他模型提供商之间巨大技术鸿沟的模型”。从工程部署看,GLM-5.2引入的IndexShare技术将超长上下文计算量压缩至三分之一,使1M上下文的实际落地具备更强成本可行性。

Fable 5下架,模型能力“武器化”风险触发监管执行

Anthropic事件显示,前沿模型的监管已从政策讨论进入行政执行阶段。

据彭博报道,Howard Lutnick援引《出口管理条例》第744.22(b)条款,以Anthropic模型存在被外国军事情报机构利用的“不可接受风险”为由,要求其在向全球任何外国人提供Fable 5和Mythos 5访问权限前必须取得商务部许可证,否则将面临刑事及民事处罚。Anthropic随后关闭两款模型的全球访问权限。

东方证券研报援引媒体报道称,亚马逊致电美国政府官员并提交报告,称其研究人员成功突破Anthropic旗下Mythos模型的安全限制,访问到被认定构成国家安全威胁的内容;同时,在特定提示词引导下,Fable 5模型能够挖掘出至少四款软件程序中的安全漏洞。这被认为是美国商务部对Fable 5及Mythos 5实施出口管制,并禁止境外和外籍用户访问的重要原因。

这一变化表明,当前模型能力增强后,安全问题不再只是产品缺陷或合规问题,而开始被纳入国家安全和产业安全框架。东方证券认为,未来模型安全检测有望成为必要需求和刚性环节。

Anthropic公开表示反对这一举措,认为政府应对“不成比例”,并指出相关漏洞“简单且普遍存在于其他公开可用模型中”。公司警告,如果同等标准扩展至全行业,所有前沿模型的新部署可能实质上陷入停滞。据华尔街见闻报道,Anthropic技术团队已于本周一赴商务部与官员举行会谈。

闭源模型可获得性受压,开源份额有望提升

Anthropic两款模型的“闪电封禁”,暴露出闭源商业模型在可获得性与稳定性上的短板。

对全球开发者和企业而言,依赖闭源前沿模型意味着核心业务可能因政策指令而突然中断。这种不确定性会削弱技术栈的可靠性,尤其是在模型能力已嵌入开发、Agent、代码生成和安全分析等关键流程之后。

相比之下,开源模型具备开放权重、自主可控、可本地部署等特征。东方证券认为,这些特征使开源模型成为规避地缘政治风险、保障业务连续性的更优选择。未来下游用户可能不再只追求模型性能,而会更多转向稳定可用、自主掌控、持续可及的模型体系。

这将直接利好开源生态。GLM-5.2在性能上接近闭源前沿模型,同时具备开源授权和本地部署条件,使其在企业替代选择中的吸引力上升。若出口管制框架继续扩展,受影响最深的可能是依赖全球商业化收入的闭源模型提供商,而高性能开源模型反而可能加速渗透。

OpenAI表态显示,人才与合规压力正在外溢

Anthropic事件的影响已经扩散至其他AI实验室。

据The Information报道,OpenAI首席战略官Jason Kwon在周六的内部Slack消息中告知员工,公司已“强烈”向政府表明,构建AI“需要来自全球各地的最优秀人才”,这“是美国在AI领域保持领先的重要原因之一”。Kwon同时表示,OpenAI仍在评估政府针对Anthropic行动的影响,称这是“一个快速演变、存在大量未知因素的局面”。

OpenAI总法律顾问Che Chang在另一条内部消息中提醒员工,“不应尝试协调回应,或直接通过Anthropic或其他实验室的联系人解决问题”,理由是“这里适用反垄断规则”。这一表态显示,在共同面对监管不确定性时,各AI实验室仍需要避免形成协调行动的合规风险。

外籍研究人员的集中度,使政策风险进一步具备产业结构含义。据MacroPolo数据,2024年在AI顶级学术会议上发表论文的研究人员中,38%本科就读于中国高校,高于五年前的29%,其中近四分之三目前在美国工作。战略与国际研究中心Wadhwani AI中心主任Aalok Mehta表示,政府对在前沿AI模型上工作的外籍公民尤为担忧,尤其关注AI实验室是否建立了强有力的管控机制。

算力需求仍是主线,国产模型调用量有望继续增长

GLM-5.2的发布与Anthropic模型下架,并不只影响模型竞争格局,也会影响算力和Token服务需求。

东方证券认为,国内多家模型公司产品在全球模型性能榜单上处于较领先位置,且多数保持开源。GLM-5.2被评估为迄今能力最强的开源模型,支持真正可用的1M上下文,并在长程任务中保持领先,在Coding能力上保持国内领先,对Anthropic模型形成较强替代效应。

由于国内模型性能领先、多数开源、API调用成本较低,中国模型已在OpenRouter等Token分发平台上占据领先位置。叠加Anthropic两款领先模型下架,国产模型API调用量有望进一步提升,基于国产模型的算力与Token服务需求预计将维持较好增速和景气度。

高盛One-Delta交易台负责人Rich Privorotsky在报告中指出,AI板块正面临两股力量:一方面是更广泛的应用普及与算力需求上升;另一方面是代币通缩加剧、货币化前景存疑以及股票供给持续扩大。市场当前正更加关注后者。

但从中长期产业逻辑看,成本下降与访问门槛降低,可能推动代币消耗量和算力需求同步扩张。开源模型性能提升,将降低企业使用AI的门槛,也可能放大推理、Agent和长上下文任务的调用规模。对投资者而言,开源模型份额提升与算力需求高增,正在成为AI产业链重估的核心变量。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Comments

We need your insight to fill this gap
Leave a comment