智通财经APP获悉,浙商证券发布研报称,近期,OpenAI推出o4-mini和满血版o3模型,工具使用能力提升有望实现模型在复杂场景下的任务处理,而谷歌发布一系列多模态模型更新,跨模态能力提升有望大幅延伸AI应用场景;在生态侧,近期国内外多家厂商宣布接入MCP协议,谷歌也推出A2A协议旨在构建多智能体协同应用生态,通用大模型以及产品型AI应用厂商有望深度受益。
浙商证券主要观点如下:
OpenAI推出o4-mini和满血版o3模型,多模态能力及智能水平大幅提升
o4-mini和o3是两款多模态模型,能同时处理文本、图像和音频,并且能作为Agent智能体自动调用网络搜索、图像生成、代码解析等工具以及深度思考模式(思维链中可以思考图像),工具使用能力的实现使得模型能够处理更加复杂的任务场景,而不仅仅局限于简单的文本生成。在可用性方面,除了ChatGPTPlus、Pro和Team用户可以调用模型外,满血o3和o4-mini也通过Chat Completions API和Responses API向开发者开放。ResponsesAPI支持推理摘要功能,能够在函数调用时保留推理标记以提升性能,并且很快将支持内置工具,包括网页搜索、文件搜索和代码解释器,以增强模型的推理能力。
谷歌发布一系列多模态模型更新,跨模态能力大幅提升
近期,谷歌在Google Cloud Next 25大会上发布一系列AI重大更新,跨模态能力再次实现大幅迭代,有望大幅拓展AI应用场景并满足用户不同需求,其中:
(1)视频生成模型Veo2:现在Veo2模型支持P视频、关键帧生成视频、扩展画面、镜头控制等特性;(2)音频理解与生成模型Chirp3:Chirp3提供了超过35种语言(含中文)的自然逼真语音,模型可通过10秒的短录音就生成非常逼真的自定义语音,并且可以区分音频中的说话人身份、提升音频转文本的易用性;(3)音乐生成模型Lyria:可制作高保真音频,精准捕捉细微差别,并呈现丰富细腻的音乐作品,涵盖各种音乐类型,可帮助企业提升品牌体验并简化内容创作。(4)图像生成模型Imagen3:模型提升了编辑/修复功能效果,能够快速移除、重绘图像中不需要的对象或瑕疵。
MCP+A2A协议有望推动Agent应用生态繁荣,关注价值链投资机遇
MCP允许AI模型从业务工具、软件、数据库以及应用开发环境等来源中获取数据完成任务。自去年11月Anthropic将MCP服务协议开源后,至今年2月已有超过1000个由社区构建的MCP服务器可供使用。近期,OpenAI宣布其Agents SDK支持MCP服务协议(Chat GPT桌面应用和Responses API很快也将支持);而国内,近日阿里云百炼上线业界首个全生命周期MCP服务,无需用户管理资源、开发部署、工程运维等工作,5分钟即可快速搭建一个连接MCP服务的Agent(智能体),同时腾讯云也迅速跟进,正式发布“AI开发套件”,支持MCP插件托管服务,帮助开发者最快5分钟搭建业务型AI Agent。
4月10日,谷歌在Google CloudNext 25大会上开源了首个标准智能体交互协议——Agent 2 Agent Protocol(简称A2A),A2A有望打破系统孤岛,对智能体的能力、跨平台、执行效率产生质的改变,支持Intuit、Mongo DB、Salesforce、SAP、Service Now和Workday等主流企业应用平台。在实际应用中,客户端Agent负责制定和传达任务,而远程Agent则根据这些任务采取行动,以提供正确的信息或执行相应的操作,同时Agent可以相互发送消息(可以包含上下文信息、回复或者用户指令),使其能够更好地协同工作,共同完成复杂的任务。
建议关注标的
该行认为,在大模型各方面性能加速迭代,叠加MCP和A2A等数据和执行层协议的完善和应用厂商的加入,AI智能体应用生态有望加速构建,关注通用大模型及产品型应用厂商的投资机遇:
Agent应用:科大讯飞、焦点科技、光云科技、税友股份、鼎捷数智、卓易信息、彩讯股份、迈富时、泛微网络;
AI垂类应用:金山办公、福昕软件、万兴科技、合合信息、昆仑万维、虹软科技、润达医疗、美图公司、商汤-W;
风险提示:1、AI技术迭代不及预期的风险;2、AI商业化产品发布不及预期;3、政策不确定性带来的风险;4、下游市场不确定性带来的风险。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com