

大家好,我是码农财经。这两天科技圈最热闹的,莫过于谷歌和字节跳动这两大巨头在AI推理能力上的“神仙打架”。如果说之前的AI大模型是在比拼谁更“聪明”,那么现在,它们正在比拼谁更“省钱”。
就在今天(2月20日),谷歌正式推出了Gemini 3.1 Pro模型。这次升级的核心关键词是“推理”。在严苛的ARC-AGI-2基准测试中,它的得分达到了77.1%,推理性能直接翻倍,能够为复杂课题提供可视化解释,解决实际棘手难题。
无独有偶,就在几天前的2月14日,字节跳动也官宣了豆包大模型2.0系列。该模型针对大规模生产环境进行了系统性优化,特别强调了推理和代码能力的提升。它支持思考长度可调节,且各思考长度下的Tokens效率都有大幅提升。
这两条新闻释放了一个强烈的信号:AI大模型正在从“训练时代”全面转向“推理时代”。
:就像是“造火箭”。需要集中全球最顶尖的工程师和材料,投入巨资(通常是数亿甚至数十亿美元)建造一个庞然大物。这个过程虽然昂贵,但频率很低,可能几年才造一次。
:就像是“卖车票”。火箭造好了,现在要把它商业化,让成千上万的乘客(用户)每天都能买票乘坐。这个过程虽然单次成本低,但频率极高,每天可能有数亿次请求。
过去几年,资本市场的焦点都在“造火箭”上(英伟达的GPU、光模块等)。但进入2026年,随着大模型进入应用落地期,“卖车票”的生意变得比“造火箭”更重要。
相比训练阶段的高度集中,推理阶段的算力需求更加分散、高频、长尾,且对低延迟、高吞吐、边缘部署等能力提出更高要求。这意味着,算力硬件的主战场正在从“训练集群”向“推理集群”迁移。
推理算力对成本极其敏感。企业不可能像训练时那样不计成本地堆砌GPU。因此,谁能提供“更便宜、更稳定、更易部署”的推理算力,谁就能在下一轮竞争中胜出。
:作为国产算力龙头,中科曙光在算力基础设施和算力服务方面具有深厚积累。在推理算力需求爆发的背景下,其服务器和算力租赁业务有望直接受益。
:全球领先的服务器厂商,深度绑定国内外主流云厂商。推理需求的爆发将直接拉动服务器采购量的增长,特别是针对推理优化的专用服务器。
:旗下新华三集团在云计算基础设施领域布局广泛,能够提供从计算到存储再到网络的全栈式解决方案,满足推理算力对低延迟和高吞吐的要求。
:作为全球最大的服务器制造商之一,工业富联在AI服务器代工领域占据重要地位。推理算力需求的增长将直接转化为其订单量的提升。
这场推理算力的竞争才刚刚开始。目前,大模型的推理成本仍然是阻碍其大规模商用的主要障碍之一。未来,我们可能会看到以下几个趋势:
:为了降低单位推理成本,像谷歌TPU、华为昇腾、寒武纪等专用AI芯片将在推理场景中发挥更大作用。
:为了满足低延迟需求,越来越多的推理任务将从云端下沉到边缘侧(如手机、汽车、工厂设备)。
:企业会将敏感数据留在本地(私有云)进行推理,而将非敏感数据或训练任务放在公有云,形成混合云架构。
2026年,云计算的主旋律不再是“堆参数”,而是“降成本”。推理算力的爆发,意味着AI正在从实验室的“奢侈品”变成千家万户的“日用品”。对于投资者而言,关注那些能够提供高性价比推理算力的公司,或许是在AI下半场抓住机会的关键。
云南省纪委监委于2026年2月18日至2月22日期间,对该省党员、公职人员涉嫌酒驾应当受到党纪政务处分和违规使用公务用车、私车公养的典型问题进行集中通报。
什么是幸福?这个看似简单的问题,却像一把钥匙,开启了无数人心底最深的渴望和困惑。有人说,幸福是金钱带来的安全感;有人认为,幸福是家庭的温暖和陪伴;还有人坚信,幸福是实现梦想的那一刻。
国家队康复师珑博士,干货教学