文章摘要
谷歌在Gemini 3.5 Flash中引入了计算机使用功能,使用户能够通过自然语言指令直接操控电脑界面,执行任务。
文章总结
谷歌在Gemini 3.5 Flash中内置了“计算机使用”功能,使开发者能构建跨平台交互的智能代理。该功能现已成为模型的原生工具,支持浏览器、移动端和桌面环境,可执行持续软件测试、专业应用自动化等长周期企业任务。为保障安全,模型通过对抗训练降低提示注入风险,并推出两项可选企业防护系统:要求用户确认敏感操作,以及自动拦截间接提示注入。开发者可通过Gemini API和Gemini Enterprise Agent平台使用该功能。
评论总结
根据评论内容,总结如下:
主要观点与论据:
功能缺失与竞争劣势:用户指出Gemini应用缺乏MCP支持(评论1),且UI不如Claude CoWork或Codex(评论4),被视为“雾件”(vaporware)。
- 关键引用:
- "There's still no MCP support in the Gemini app" (satvikpendem)
- "No UI like their competitors Claude CoWork or Codex. This is vaporware" (beastman82)
- 关键引用:
性能与成本争议:有评论认为Gemini 3.5 Flash在基准测试中被Opus 4.8和GPT 5.5超越,但图表显示误导性优势(评论3);另一评论则称其性能令人印象深刻,且比GPT 5.5便宜3倍(评论7)。
- 关键引用:
- "Gemini 3.5 Flash is beat hands down by both Opus 4.8 and GPT 5.5" (mlmonkey)
- "performance is quite impressive given that its 3x cheaper than 5.5" (zuzululu)
- 关键引用:
安全与可靠性问题:用户批评“计算机使用”功能缓慢、不安全、易出错(评论2);另有人反映Gemini过度限制,拒绝处理简单任务(评论9),甚至因错误阈值放弃任务(评论10)。
- 关键引用:
- "Computer use is such a terrible idea. It's slow, insecure, error prone, expensive" (airstrike)
- "I kept running into refusals... it reminds me of the dark days where you couldn't use ai for much of anything" (revolvingthrow)
- "I'm sorry, I cannot do this simple task, I've exceeded my error threshold" (smallstepforman)
- 关键引用:
其他关注点:用户询问3.5 Pro版本缺失(评论6)、广告跳过能力(评论5)及TUI构建表现(评论8)。
平衡性总结:
评论呈现两极分化——部分用户认可Gemini的成本效益和性能,但多数批评集中在功能缺失、安全限制、可靠性不足及竞争劣势上。整体认可度较低,负面反馈占主导。