对话Chance AI创始人:看见世界的另一条路,走出“大模型同质化”的围墙

华尔街见闻03-31

在当下规模空前的AI竞争里,“大模型”成了所有公司的默认答案。大家都在升级算力、打榜、抢占各种入口。然而就在行业叙事越来越收敛时,一家几乎把所有主流做法都否定掉的创业公司出现了——Chance AI。创始人曾熙把输入框从首页删掉,做了个不需要你发问的AI App,只用抬手一拍,就能帮你以文字解读任何看到的东西,这更符合直觉。

现场,曾熙用拍了一对球鞋Air Jordan 1的图片,Chance AI告诉我们它值30万美金,为什么?这是在乔丹当年总决赛穿的那一对;它还能帮女生看穿搭。出门前自拍一张,App能告诉她,这个搭配如果换一个颜色的围巾, 或者再加一个什么颜色的包搭配度更高。

很快,在被北美大学生圈粉后,团队又奔着年轻一代的呼声,开发了点评OOTD(每日穿搭)、看手相、看肤质、毒舌点评等一系列功能。光解读不算完,用户还可以一键分享到Chance AI自带的社区,“所见”成了用户自己的谈资,一群18-25岁的年轻人也由此聚到了一起。

CTO吴晓凡向华尔街见闻透露,Chance AI已经在全球吸引了25万左右的用户。由此,一个Google Lens+小红书、Instagram的形态渐渐成型,Chance AI也初步集齐了爆款要素。而且年轻人用得越多,就越是能捕捉到他们真实的需求,曾熙说,“我们二十多万用户,每个北美女生平均每天会拍2.8次穿搭,这个数据量是多么恐怖”。手握大厂和电商们梦寐以求的富矿,但曾熙和团队却没急于变现,也不打算盲目追眼下大火的AI硬件之风,甚至暂时不敢搞更大规模的宣传,怕基建一时撑不起“泼天的富贵”。他们打算继续打磨自家的视觉Agent,把这个“视觉大脑”开发得更强大,继而积累更丰富的数据,形成视觉社区,加速起“滚雪球”。在AI产品逐渐同质化的当下,曾熙成了逃离主流叙事的少数派,却挖到了人类直觉的共识:如果人类有70%的大脑带宽用于处理视觉,那AI的未来入口就不应该继续被一个输入框垄断。Chance AI的选择或许激进,但在一个日益内卷的赛道里,反而因为稀缺显得更值得观察。

把交互拉回视觉本能

当行业已经习惯用“人提问,AI回答”的方式来定义产品边界时,Chance AI创始曾熙向华尔街见闻提出一个问题:“为什么眼睛不长在屁股上?”因为在人类的进化逻辑里,视觉才是第一性原理,而语言只是更晚出现的编码系统。曾熙提到,从进化角度来看,人类大脑中约有 70% 的信息处理与视觉相关——在语言出现之前,人类已经依靠视觉来识别环境、判断危险与机会。过去十年,所有主流交互方式都被输入框标准化了。用户必须提前知道问题是什么,必须把需求翻译成语言,再把语言交给一个模型。对大多数人来说,这种方式并不自然。人在街上看到奇特的建筑、看到陌生的艺术、看到一个模糊的符号,第一反应是“被吸引”,而问题则是在注意力之后产生的。曾熙就说:“提示词是为懒惰的AI准备的。”他的意思并不是攻击prompt生态,而是认为,大部分时候prompt是人在帮模型工作,是在补齐模型缺失的推理链条。如果AI真够聪明,它不应该依赖人教它“怎么问”,它应该能够通过视觉线索主动理解用户的关注点。曾熙向华尔街见闻讲了一个故事。他说自己是艺术爱好者,两年前曾经自己为办展而做了一个AI扫描讲解的小程序。然而撤展后,曾熙发现居然还有1500多人在用那个小程序,调研后他发现,用户这些用户已经形成肌肉记忆,用它来扫描各种花草、电影、服饰,继续跟AI聊。事实上,曾熙身上就有很重的设计师责任感,“我们的使命就是消除科技和人之间的隔阂。AI 在很多人眼里可能有点‘高冷’,但我的目标是让它变得更自然、更贴近人类的本能需求——用视觉去理解和探索世界。” 基于这个判断直接决定了产品形态。Chance AI从第一天起就把输入框从核心界面移除。“看”成为默认动作,“问”变成可选动作。用户不需要组织语言,不需要提前构造问题,也不需要费力去寻找“AI最喜欢的提问方式”。在行业几乎所有人都在加强语言交互时,这个决定显得非常逆势。但也正因如此,它避开了大多数模型挤在一起的赛道。输入框代表的是目的性,而视觉代表的是本能;输入框强调解决问题,而视觉强调触发好奇。Chance AI的交互方式与其说像工具,不如说更像一种认知肌肉的训练。然而,先行者也承担着风险。眼下行业已经在语言交互上建立了完整的用户路径,从搜索到电商再到助手模式,用户也被训练得越来越依赖“提问题”。视觉能否真正成为新的入口并没有确定答案,硬件形态也没有成熟。但在一个高度统一的赛道上,Chance AI至少试图让问题重新变得开放,而不是跟着所有人一起继续把交互压成一个框。

从识别到意义推理

Chance AI真正的非共识之处,并不在于它使用了摄像头,而在于它把“解释意义”当成了AI的核心能力。曾熙说,他创办 Chance AI 的灵感要追溯到小时候对《蒙娜丽莎》的一次观摩。“当我站在尺幅比想象中小很多的她面前,满怀期待却完全看不懂其中的意义,‘不就是这么小一张画,有什么了不起的’,匆匆看了一眼就走了”。“人类是视觉动物,也是故事动物,我们天生会被眼前的景象吸引,但真正触动我们的是其背后的故事”。后来,当曾熙有机会深入了解了达芬奇和这幅画背后的故事,终明白它为何被称为人类文明的瑰宝。曾熙说,Chance AI 的使命是用科技帮助人们发现这些隐藏的故事,消除人与世界之间的隔阂。至于 “Chance” 这个名字,它并不仅代表“机会”,更代表“偶然性”(contingency)。在他看来,生物进化的过程依赖于偶然性,而人类知识与创意的诞生,也常常来源于这些偶然的碰撞。Chance AI 希望通过连接视觉与故事,加速这些知识的交汇,让每一次视觉体验都更加深刻而有意义。回溯来看,过去一年整个行业在多模态方向大幅前进,主流模型对图像的识别、标注、描述都变得越来越准确。然而在曾熙看来,所有这些能力几乎都有一个共同的上限:它们能说清“这是什么”,但很难进一步解释“它为什么重要”。人类对世界的理解从来不是停留在事实层面。无论是电影解说、球赛评论、旅行导览还是艺术讲解,人之所以需要这些角色,是因为它们帮助我们把事实转化为意义,把信息解压成故事,把看到的东西与更大的文化体系建立联系。在这个意义上,视觉就是一种推理方式。Chance AI的产品在这里做了一个明显的选择。它并不满足于给出一个客观描述,而试图把一个物件的知识背景、文化语境、社会共识都调动起来。曾熙向华尔街见闻举例:一个石头不再只是“混凝土上放着的巨石”,而是洛杉矶LACMA的LevitatedMass,是花了一千三百万美元运输的公共艺术,是关于美国城市阶层结构的隐喻。一栋楼不只是“未来主义摩天大楼”,而是扎哈·哈迪德的遗作之一,是紫荆花含苞待放的象征。这种解释并并非模型自动生成的,而是一种主动的意义推理。它的前提是模型愿意介入、愿意解释、愿意冒一定的主观风险。这恰恰是主流模型最不愿意做的。在业内人士看来,大厂模型的策略极其保守,更倾向于提供安全、标准化、无争议的信息;而解释本身意味着主观性,也意味着争议,这对于大型商业产品来说会放大风险。这也是为什么“意义推理”一直是行业的灰色地带。大公司不做,并不代表它们不能做,而是做了反而可能带来成本。Chance AI的定位让它有能力承担这些“不确定的解释”,也让它在“视觉理解”这条路上走得比别人更远。但这种模式的局限也显而易见。文化语境可能出现偏差,意义叙述可能变成一种新的“AI算命”。模型越往“解释”走,越需要在深度和准确性之间找到平衡。对大厂来说,这是不能冒的险,对Chance来说,这是必须承担的边界。但正因为它站在巨头最不愿意涉足的区域,它反而拥有一个罕见的时间窗口。它试图回答的是“AI能否提升人的理解力”。它确实击中了一部分人真正的需求:在一个溢满信息的世界里,判断比答案更稀缺,理解比速度更重要。Chance AI的问题在于,它的路线需要耐心,需要生态,需要硬件,需要文化习惯的迁移。它的优势在于,它比别人更早意识到,AI的下一次入口变化,可能发生在视觉。在一个所有公司都押注语言模型的时代,这个判断显得孤独,但也因此值得被记录。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Comments

We need your insight to fill this gap
Leave a comment