【申万TMT】20251119:谷歌Gemini3正式发布,重申对入口之争、多模态、AI编程的重视 [太阳]谷歌正式发布Gemini3 Pro,推理、多模态、编码等方面大幅提升。 直观的跑分来看综合能力较强: [礼物]推理能力:HLE测试无工具得分37.5%,有工具得分45.8%;ARC-AGI-2得分31.1%,较大幅领先GPT5.1和Claude Sonnet4.5。 [礼物]数学能力:AIME2025无工具得分95%,有工具100%,小幅领先。 [礼物]多模态能力:MMMU-Pro得分81%;屏幕理解ScreenSpot-Pro得分72.7%,大幅领先。 [礼物]编程能力:竞技场LiveCodeBench Pro得分2439,智能体编程补齐,SWE得分76.2%,竞技领先,智能体编码能力补齐。 重点提升推理思考、多模态、智能体编码、人机交互 [庆祝]DeepThinking引入慢思考机制,显著降低幻觉和错误率 [庆祝]多模态理解的极致:强调自己多模态能力的护城河,对长视频、复杂文档、音频、代码具备优异综合理解能力。‘ [庆祝]AI IDE:对抗cursor、windsurf等推出google antigravity,对编辑器、终端和浏览器具有访问权限,能够自主规矩、执行复杂任务、端到端软件开发。 [庆祝]生成式UI交互:重构人机交互界面,chatbot不再单一返回文本答案,例如做旅游预算规划,生成一个可拖拽、可计算的预算小程序进行交互。 模型能力依旧重要:测试反馈来看目前Agent对多模态任务、复杂任务完成度仍低,需要底层模型能力的提升。 入口的重塑:浏览器等传统入口和AI工具界线开始模糊,可能被AI重塑,从信息工具变为任务执行工具。 AI编程仍是当前聚焦重点之一:原生AI IDE、AI按需即时生成各类网站等。 [红包]核心推荐: 云:金山云、阿里巴巴; AI编程:卓易信息; Agent:鼎捷数智、泛微网络、汉得信息、金蝶国际、税友股份、迈富时、新大陆、焦点科技; 其他AI应用:易点天下、美图、腾讯、快手、哔哩哔哩、焦点、恺英、华通、巨人。
【申万TMT】20251119:谷歌Gemini3正式发布,重申对入口之争、多模
丹萱谈生活文化
2025-11-19 16:15:59
0
阅读:3