AI自主决策权扩大,Anthropic为Claude Code引入自动模式

华尔街见闻03-25

Anthropic正在赋予其AI编程工具更大的自主权,同时试图在效率与安全之间寻求平衡。

3月24日,Anthropic宣布为Claude Code推出"自动模式"(auto mode),允许AI自行判断哪些操作可以直接执行,无需等待用户逐一确认。

这一功能目前以研究预览版形式面向团队计划用户开放,未来数日内将扩展至企业版及API用户。

新功能的核心在于内置安全机制,每项操作在执行前均会经过AI安全层的审查,系统将自动放行被判定为安全的操作,并拦截存在风险的行为。

Anthropic表示,该安全层还可检测提示注入攻击,即恶意指令被隐藏在AI正在处理的内容中,试图诱导模型执行非预期操作。

该公司建议用户在隔离的沙盒环境中使用这一新功能,以防止潜在风险蔓延至生产系统。

开发者痛点驱动产品迭代

对于当前使用AI编程工具的开发者而言,一个普遍困境是,要么对AI的每一步操作全程监督,要么放手让模型自行运行,由此承担不可预知的风险。

Anthropic的自动模式本质上是对Claude Code现有的"不会再向用户请求确认(dangerously-skip-permissions)"命令的升级延伸。

该命令原本将所有决策权完全交由AI处理,而新模式则在此基础上叠加了一层安全过滤机制。

通过让AI而非用户来决定何时需要申请权限,Anthropic试图在不牺牲执行效率的前提下,为开发者提供更高程度的安全保障。

GitHub、OpenAI等公司已相继推出能够代替开发者执行任务的自主编程工具,Anthropic此次的举措在此基础上进一步推进,将权限决策的主导权从用户一侧转移至AI本身。

自动模式的发布,紧随Anthropic近期一系列产品更新之后,包括用于在代码合并前自动捕捉缺陷的Claude Code Review,以及允许用户将任务委派给AI代理处理的Dispatch for Cowork。

这一系列布局显示,Anthropic正系统性地构建面向企业开发者的自主化AI工作流产品矩阵

关键细节尚待厘清

尽管如此,这一功能仍存在值得关注的不确定性。

Anthropic目前尚未公开其安全层判定操作风险等级的具体标准,而这恰恰是开发者在大规模采用该功能前最需要了解的核心信息。

此外,自动模式目前仅支持Claude Sonnet 4.6与Opus 4.6两款模型,且仍处于研究预览阶段,意味着该产品尚未最终定型。

对于考虑在生产环境周边部署这一功能的企业用户而言,上述限制与信息不透明之处或将是其审慎评估的重要依据。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Comments

We need your insight to fill this gap
Leave a comment