


大模子正堕入一场“武备竞赛”式的狂欢。参数领域从千亿到万亿,高下文窗口从1万到100万,各家厂商你追我赶,仿佛谁投更多算力、堆更大参数,谁就能赢下这场AI竞赛。但商讨标明,单纯增多参数带来的性能莳植正在急剧递减。
斯坦福大学发布的《大模子领域定律》指出,当参数朝上5000亿后,模子在推理才智、知识一语气等中枢主张上的莳植幅度从早期的30%以上降至不及5%,而考研老本和能耗却呈指数级增长。
企业确切需要的,是一个参数天文数字的“万能选手”,照旧一个饱和理智、饱和低廉、能实实在在干活的“专科搭档”?
6月8日,云知声发布自主研发的下一代原生智能体模子U2,一款有近3000亿参数的MoE稀疏模子,声称能在无数任务上并列万亿参数模子。更重要的是,其推理老本权贵低于同尺寸领域大小模子。
当大无数玩家还在比谁的模子“更大更强”,云知声采取了一条“强而小、强而省、强而能落地”的相反化旅途。这条旅途的逻辑是什么?底气从哪来?能否撑起“国产第一梯队”的地点?
1
大模子界的
“反内卷选手”
现在主流的万亿参数级别大模子,动辄需要上千张GPU卡才能跑起来,单次推理的电力老本和算力老本高到让大部分企业长颈鸟喙。而U2的近3000亿总参数,激活参数目唯有百亿级别,按照MoE架构的稀疏特质,每次推理只调用约十分之一的人人参数。
这背后的底层公式,是云知声独创东谈主黄伟提议的一个见地:AI公司行业价值=智能密度×Token价值。
什么叫“智能密度”?黄伟的讲明是:不是单纯强调模子小,而是在模子性能达到群众第一梯队水平后,进一步斟酌每单元参数里承载了若干知识、推理才智和任务贬责效用。
用一句更直白的话说:你用十个参数耀眼别东谈主一百个参数的活儿,你的智能密度就更高。
而“Token价值”则是另一个被行业疏远的维度。昔日两年,大模子厂商可爱比“生成多快”“生成若干”,黄伟把这个逻辑反过来问:如果生成的Token莫得业务价值,那它不是收入,是老本。Token价值不是看数目,是看每次调用能否确切转换为业务闭幕。
U2是云知声自研、基于快慢念念考会通的稀疏搀杂人人(MoE)架构通用大语言模子,从设想之初就锚定“为实践而生”,而非“为生成而生”。

其领有许多技能亮点,举例在高智能密度方面,通过知识高超编码、语义压缩优化,近3000亿参数的U2在无数纯文本任务接近以至突出国内万亿参数模子,参数效用接近后者约5倍。用更少参数承载更高密度知识与推理才智,告别无效参数堆砌。
“Agent+Harness协同演进”是U2的另一个重要标签。
传统大模子本色上是“嘴强王者”,能修起问题、能写著作,但真要让它去完成一个复杂的多步地任务,比如自主调用器具、磋议旅途、实践操作并验收闭幕,就得在外面包上一层厚厚的“应用壳”。
U2的器具调用、现象料理、多步磋议均为模子原生才智,可自主一语气地点、拆解任务、调用器具、实践验收,适配复杂长程任务,而非靠外挂终了智能体效果。主淌若依赖旅途磋议实践与harness协同演进,更动设想原生推理旅途蒸馏机制,构建磋议-环境探索-实践-验收全链路闭环才智,高效左右复杂长程任务。
具体而言,U2将模子原生Agent才智的莳植与Harness(任求实践脚手架)的迭代优化纳入吞并考研闭环,变成双向强化的协同演进机制。一方面,Harness字据现时模子才智规模与特质捏续迭代,为模子提供更精确的任务环境与响应接口;另一方面,模子讹诈优化后的Harness复返的高质地轨迹数据,捏续强化多步磋议、器具调用、历程纠错与闭幕验收才智。
这种底层考研机制的换骨夺胎,在直不雅的应用层带来了全新的使用体验。哪怕是在纯当然语言的交互场景下,它的原生实践力也体现得长篇大论。以我最近测试的一个前端开拓任务为例,笔者算作又名文科生,从来不会写任何代码,我只需要在U2对话框里输入一段指示:帮我写一个单文献的网页小游戏,比赛下注app2026世界杯中国官方下载模拟烟花飞到空中然后灵通。条目画面荒谬炫酷,五颜六色的线条轨迹,况兼我不错用鼠标去互动。
令东谈主惊喜的不仅是它在不到2分钟内一次性托付了无Bug的制品代码,更在于它在生成历程中展现出的“原生磋议感”——它无需外部教导,便自主完成了从底层canvas逻辑构建、五彩线条轨迹的物理模拟,到鼠标交互事件的精确挂载。全程单次交互便达到验收圭表,直不雅考据了其内化的任务理会与实践才智。

个东谈主的惊艳体验并非孤例,领域化的评测数据也为这种“高实践力”提供了严谨的佐证。U2在最新的综合评测中展现了荒谬求实、面向真实企业级落地场景优化的纷乱实力。评测深度遮掩了智能体才智(AgenticCapacity)、实战化智能体专项(ClawSpecific)、长文本才智(LongContext)、知识与推理(Knowledge&Reasoning)以及指示除名(InstructionFollowing)五大中枢维度,遮掩范围与U2的中枢设想取向高度契合。
让东谈主惊喜的是,在6月10日国外巨擘AI模子评测平台LLMStats更新的榜单中,云知声U2登上两项重要评测:在LLMStatsScore综合才智榜单中参加模子总榜前30,按厂商最好模子收货位列群众模子厂商第九。此外,LongBench-V2评测名次中,U2的长文本才智以54.4%的准确率突出ClaudeOpus4.7(53.9%),仅逾期GPT-5.4(55.6%)1.2个百分点,名次群众第二。意味着其中枢的高下文信息索要、跨段落推理才智已达到群众第一梯队水平。


此外,评测闭幕全面印证了U2“双高+原生智能体”的中枢主张,建造了其算作新一代高效Agent模子的行业地位。领先是三大基础才智全面夺魁,印证“高智能密度”;其次是代码工程与Agent实战稳居第一梯队,彰显“原生智能体”本色;终末是极致能效带来压倒性降本上风,践行“低老本高产出”战术。

「枪弹财经」发现,U2的底层逻辑,是先达到一流智能水平,再把老本打到最低。如同造车不是马力越大越好,而是在保证速率与安全前提下作念到最省油。
黄伟的譬如直白又精确:“我不需要一个中国科学院院士来开滴滴。好多任务场景不需要最高智能,硕士博士水平就够了。”
2
十几年的“长征路”
好多东谈主对云知声的印象还停留在“作念语音识别”,这个解析偏差其实不小。
在AI1.0时期,它的着名度远不如商汤、旷视那批“AI四小龙”。但黄伟有一个很挑升义的不雅点:云知声不是从语音走向大模子,ag·真人(官网)平台而是从智能交互走向大模子。
翻开时候轴,不错看到云知声的一条发展干线:语音仅仅进口,背后是意图一语气,再背后是任求实践。
2012年创立,同庚攻克“5米远讲”技能;
2013年发布业内首款语音电子病历,走进协和病院;
2014年推出语义云,业内首提“云表芯”一体化战术;
2018年自研AI芯片“雨燕”面世;
2023年发布山海通用大模子;
2026FIFA世界杯赛事官网入口2024年山海医疗大模子登顶MMDU、MedBench等群众榜首;
2025年6月,云知声在港交所挂牌上市,被誉为“AGI第一股”。

这十多年里,云知声简直在每个技能周期王人提前下了注,只不外“踩早”是有代价的。黄伟我方说得坦率:“踩早总比踩晚好。踩早了你付出的是时候老本,踩晚了你连入场的契机王人莫得。”
上市近一周年,首份年报交出的数据颇有看头。2025年全年,云知声总营收12.11亿元,同比增长29.0%。其中大模子有关业求终了收入6.1亿元,同比增长逾10倍,占全体营收比重攀升至50%以上。大模子业务从早期的技能探索阶段,改动为复旧云知声发展的中枢驱能源。
还有一个值得眷注的数字,2026年5月,云知声Token调用收入的ARR环比暴涨600%,预测6月将不息保捏高增长。这意味着公司收入与客户AI使用强度已深度绑定,业务的领域天花板全面大开。
贸易落地的案例最能证据问题。云知声业务聚焦灵敏医疗和灵敏生存两大中枢领域:在医疗端,其AI援助病历生成系统已在北京友谊病院等多家三甲病院领域化应用,旧年仅顺义院区就生成朝上45万份病历,平直援用率超90%;在金融端,其车险理赔AI贬责决议匡助头部保障公司控费率莳植3%,每年神圣保费约一二十亿元。这些落地效果充分考据了云知声技能的贸易价值。
站在更大的视角看,云知声在AI医疗领域的探索还是有近十年。罢休2025年末,公司已累计与寰宇近450家病院合营,寰宇综合名次A++及以上病院遮掩率接近35%。

这些数字背后是一个真实的贸易逻辑:模子不是靠参数堆出来的,是靠场景喂出来的。
黄伟将其概述为“模数共振”,模子的性能离不开高质地数据,而好的模子如果不落地,既无法创造价值,也难以在真实场景中取得高质地数据来股东技能迭代。如今,云知声的灵敏医疗业务已平凡应用于智能电子病历、临床援助会诊等中枢场景,恰是“模数共振”的典型案例。
这个正响应一朝运行,就很难停驻来。
3
大模子第一梯队,
凭什么有云知声?
大模子下半场的竞争焦点,还是从“谁更强”转向“谁能以更低老本、更安适样式托付饱和强的才智”。在这个新维度上,云知声正凭借多年蕴蓄的数据壁垒、工程化才智和贸易化考据,置身大模子第一梯队。
行业时势远不决型——这是黄伟反复强调的判断。他说:“2018年东谈主们也觉得时势已定,然后好多公司就死掉了。”AI2.0时期留在牌桌上的公司比1.0时期少得多,但阛阓空间比以前大多了。
黄伟把昔日三年界说为“热身赛”:2023到2025年,国内企业和OpenAI的差距从3—5年消弱到3—6个月,但Agent仅能完成单步轻佻任务。2026年才是“正赛”的伊始,AI从生成式升级为“分娩力AI”,Agent能孤苦完成复杂任务,贸易化窗口确切大开。
开源模子能贬责70%—80%的平时问题,但剩下20%专科用户的20%专科问题,才是确切的护城河。高价值行业的“终末一公里”,一定是通用模子加上行业know-how来共同贬责。
云知声可能是少数几家确切有履历这样说,也额外据这样作念的公司之一。
领先是数据壁垒。云知声在医疗领域深耕了十三年,蕴蓄了超10亿条合规脱敏的医疗病历数据,这些数据在互联网上搜不到,是跑过真实业务、经过医师现实使用千里淀下来的。在物联网领域,合营伙伴朝上2万家,端侧AI芯片出货量打破1亿颗。十几年的场景数据不是想买就能买、想抄就能抄的。

其次信任壁垒雷同遑急。云知声干事了朝上400家三甲病院,合营病院中85%为三级病院,三分之一合营年限朝上3年。在B端阛阓,替换老本极高,一朝切入就锁定了后续收入。这变成了一种飞轮效应:越多的行业数据,带来越好的模子效果;越好的模子效果,带来越多的客户信任;越多的客户信任,又千里淀越多的行业数据。
终末是工程化壁垒。云知声能把大模子压缩到零点几B的大小跑在离线终局芯片里,车载场景下,大模子蒸馏至0.5B参数即可终了端侧无损交互。复杂声学环境下的定向识别、多东谈主语言分别技能,国内能作念到的公司仅两三家。

有了U2,云知声的贸易模式正在发生质变。ToB端,兽牙智能体平台正在加快落地,中标遮掩医疗、医保、交通、客服、工牌等多个领域;ToC端,公有云MaaS的OPC生态捏续产生Token收入。一个款式托付周期从3个月裁汰到1周,老本数落80%。
4
收尾
回看云知声走过的十几年,从语音识别到智能交互,从AI芯片到大模子,每一次技能波浪莅临前,它王人在牌桌上。但“踩早”的代价也很现实。
从U2的“智能密度”道路,到年报里大模子收入暴增10倍的考据,再到400多家三甲病院的信任托底,云知声用一种不太“互联网”的样式,走到了大模子第一梯队的门口。它莫得选最淆乱的路,但选了一条最难被复制的路。
正赛哨声已响。问题不再是云知声能不成坐上这张桌子,而是当大模子的竞争从“写得好”变成“干得好”AG·真人(官方)网址,这张桌子上的法例,会不会被改写?