智通财经APP获悉,中信建投发布研报称,英伟达发布FY27Q1业绩,业绩超市场预期,AI算力景气度持续。预计VeraRubin机柜产品于3季度起批量交付,CPU、互联、交换等环节价值量同步提升,未来AI基础设施升级将围绕全环节展开。算力网定位国家级基础设施,年建设投入规模有望破万亿,覆盖算力建设、管理、调度、运营多个环节,运营商作为算力网建设主力军,已推出token套餐,探索token运营C端落地。GoogleI/O2026显示谷歌AI产业布局已进入“算力基础设施+模型+应用入口+端侧设备”的全栈化阶段——TPU8t/8i验证训练与推理算力需求长期向上,Gemini3.5Flash和GeminiOmni强化模型速度、成本和多模态能力。
1)重视以阿里/字节为代表的国内互联网大厂Capex投资和生态圈玩家,包括国产芯片链企业、isv厂商,以及以大厂为主要客户的基础设施服务供应商、算力服务商。2)Pre-AI的收入率先落地。国内企业数据治理相对海外落后,AI应用落地需要更多前期准备工作。3)部分细分垂直场景AI收入更快。其中创收关注工业、医疗、教育、市场营销侧产品。4)本地推理逐步起量,利好服务和云厂商。5)推荐关注端侧AI和相关产业链。
中信建投主要观点如下:
英伟达(NVDA.US)FY27Q1业绩再超预期,AI算力景气度持续。英伟达发布FY27Q1业绩,单季度实现营收816.2亿美元(同比+85%;环比+20%),超出分析师一致预期的791.9亿美元。核心业务数据中心收入达到752亿美元(同比+92%),其中计算业务约600亿美元、网络业务约150亿(同比+199%),反映客户需求已从单纯GPU采购逐步转向涵盖交换、互联在内的全栈环节,并首次按超大规模云服务(Hyperscale)与AI云、工业及企业市场(ACIE)进行拆分。展望下一季度,公司给出910亿美元(±2%)指引,对应增速约同比+95%、环比+11%,毛利率基本持平。
公司CEO黄仁勋表示,对Blackwell和Rubin芯片在2025年至2027年期间实现1万亿美元收入的预测充满信心。此前北美CSP厂商陆续上调全年资本开支指引,四大厂商合计全年AI领域总资本开支约72050亿美元,反映下游客户需求持续强劲。此外,英伟达的VeraRubin整机柜产品预计将于6月试产,并于三季度起大规模量产并向头部云厂商首批交付。其NVL72机柜内存占比相较上代GB300提升至约26%,CPU、互联、交换等环节价值量同步提升,未来AI基础设施升级将围绕全环节展开。

算力网定位国家级基础设施,算力建设与运营市场空间广阔。4月28日中央政治局会议首次将算力网纳入“六张网”表述,与水网、新型电网、新一代通信网、城市地下管网、物流网并列。5月以来,国家对于算力网密集表态,9日国常会上国务院总理李强表示加强六张网规划建设,结合两会期间发改委主任郑栅洁表示2026年六张网总投资超7万亿元,算力网定位进一步提升。本周,丁薛祥副总理调研京、冀、蒙三地算力枢纽,提出要按“十五五”规划部署,加快全国一体化算力网,围绕自立自强、算电协同等维度,同时强化安全底线。
截至2026年3月,我国日均词元调用量突破140万亿,两年内增长超1000倍,超越美国成为全球调用量最高的国家。然而当前我国智算中心仍存在供需错配现象,部分算力资源闲置,其背后原因在于缺乏算力调度平台、缺乏对于异构算力的兼容能力、缺乏算电协同的一体化体系。因此,围绕算力网建设未来不仅仅在于算力基础设施投资,针对算力资源管理、调度、运营以及与电网的协同能力建设也将成为重点。
此外,运营商作为算力网建设的重要参与者,一方面加强基础设施建设,另一方面也创新商业模式,将原有的流量付费向token付费转化,中国电信于5月17日推出试商用token套餐,最低9.9元/月包含1000万token;中国移动(600941.SH)、中国联通(600050.SH)也在部分省级公司推出试点,加速算力运营业务落地。

GoogleI/O2026密集发布TPU、Gemini模型、Search/Gemini/YouTube/Maps等应用入口以及AndroidXR智能眼镜,AI全栈布局进一步清晰。北京时间5月20日,Google在I/O大会披露,当前全平台月处理Token量已从2024年5月的9.7万亿、2025年I/O时的约480万亿,提升至超过3.2千万亿,约为去年同期7倍;API每分钟处理Token超过190亿,超过850万名开发者每月使用GoogleAI模型构建应用。用户侧,Google已有13个产品用户数超过10亿,其中5个超过30亿;AIOverviews月活超过25亿,AIMode月活超过10亿;GeminiApp月活从去年I/O的4亿提升至超过9亿,日请求量同比增长超过7倍。AI正在从单一聊天入口,快速嵌入Google原有搜索、视频、地图、办公、移动端和硬件生态。

算力基础设施层:第八代TPU采用训练与推理双芯片架构。TPU8t面向大规模预训练,单个Superpod可扩展至9600颗芯片、2PB高带宽共享内存,计算性能较上一代提升近3倍,并可通过JAX、Pathways和Virgo网络实现最高百万芯片级逻辑集群扩展,将前沿模型训练周期从数月压缩至数周。TPU8i面向推理,重点解决Agent多步推理和多Agent协同时的低延迟与内存瓶颈,配备288GB高带宽内存和384MB片上SRAM,性能/美元较上一代提升80%。两款TPU性能功耗比较上一代最高提升2倍,预计年内正式可用。TPU8t/8i的拆分显示,AI基础设施正在从训练大模型,转向训练、推理、Agent长期运行并重。

模型层:Gemini3.5Flash发布,Gemini3.5Pro将于6月推出。Gemini3.5Flash定位为兼具前沿智能、低延迟和Agent执行能力的模型,已成为GeminiApp和SearchAIMode默认模型,并面向GoogleAntigravity、GeminiAPI、AndroidStudio和企业平台开放。根据Google披露,Gemini3.5Flash在多项编程和Agentic任务上超过Gemini3.1Pro,输出速度约为其他前沿模型4倍,同时调用成本具备优势,有助于企业降低Token使用成本,若年token消耗量达到万亿的企业将80%原本运行在其他前沿模型上的工作流迁移至Gemini3.5Flash,预计每年可节约10亿美金的token成本。同步更新的GeminiOmniFlash模型则进一步强化多模态生成能力,可融合文本、图片、视频和音频输入生成高质量视频,并支持通过自然语言进行多轮视频编辑,推动多模态模型从内容生成走向交互式创作。

应用层:Google“搜索框”升级为横跨多应用的自然语言入口。SearchAIMode升级至Gemini3.5Flash,支持文字、图片、文件、视频、Chrome标签页等多模态输入,并引入InformationAgents、生成式UI、购物Agent等能力。YouTube推出AskYouTube,用户可用自然语言提出复杂问题,系统返回结构化回答及对应视频片段;Maps此前已推出AskMaps,支持用户用自然语言搜索现实世界地点、路线与周边服务。GeminiApp方面,Google推出NeuralExpressive设计语言、DailyBrief、GeminiSpark、GeminiOmni和macOSApp等功能,其中GeminiSpark可连接Gmail、Docs、Slides等Workspace工具,在用户授权下执行长周期任务。Google的AI应用落地路径已不再局限于独立App,而是通过原有高频入口重构用户搜索、办公、创作和消费路径。
端侧设备层:AndroidXR与AI眼镜成为本次I/O重要看点。Google宣布与Samsung、Qualcomm共建AndroidXR平台,并与GentleMonster、WarbyParker合作推出智能眼镜设计。产品形态包括先上市的音频眼镜和后续显示眼镜,音频眼镜预计今年秋季推出,可通过“HeyGoogle”或镜腿触控调用Gemini,支持识别眼前内容、导航、电话短信、拍照视频、实时翻译、背景任务执行以及Uber、DoorDash等应用调用,并可同时配对Android与iOS手机。AI眼镜作为轻量级、全天候、第一视角的端侧入口,有望推动端侧多模态感知、低功耗芯片、摄像头/声学/显示模组及应用生态协同发展。
风险提示:应收账款坏账风险;行业竞争加剧;国际环境变化影响。