Hacker News 中文摘要

RSS订阅

双子座3.1专业预览版 -- Gemini 3.1 Pro Preview

文章摘要

谷歌推出Gemini 3.1 Pro预览版,这是其最强大的多模态AI模型,具备100万token上下文窗口,在代码生成、复杂推理和指令遵循方面显著提升。相比前代2.5 Pro版本,该模型通过"思考式推理"提高了输出准确性和效率,现可通过Vertex AI和Gen AI SDK使用。

文章总结

以下是经过编辑整理后的中文内容:

Gemini 3.1 Pro预览版发布公告

核心特性 • 当前最强大的智能代理与编程模型 • 支持100万token的超长上下文窗口 • 具备复杂多模态理解能力

版本升级亮点 相较于Gemini 2.5 Pro的改进: 1. 显著提升复杂指令执行能力 2. 输出效率优化提升 3. 新增"中等"思维模式(低/中/高三档可调) 4. 强化跨轮次对话的上下文保持能力 5. 新增多模态函数响应和流式函数调用支持

技术参数 | 属性 | 规格 | |------|------| | 输入支持 | 音频/图像/视频/文本/PDF | | 输出格式 | 文本 | | 输入token上限 | 1,000,000 | | 输出token上限 | 64,000 |

功能支持 • 三档思维模式(速度优先/平衡模式/深度推理) • Google搜索增强 • 代码执行能力 • 结构化输出 • 上下文缓存

使用方式 1. 通过Vertex AI控制台直接体验 2. 使用Gen AI SDK(支持Python/Go语言) 3. 通过API集成到现有应用

注意事项 • 当前版本不支持模型调优 • 媒体分辨率默认设置变更(详见技术文档) • 不再兼容旧版thinking_budget参数

家族模型对比 | 模型名称 | 主要特点 | 阶段 | |---------|---------|-----| | Gemini 3 Pro | 前沿多模态模型 | 预览 | | Gemini 2.5 Pro | 代码与知识处理 | 正式版 | | Gemini 2.5 Flash | 速度与推理平衡 | 正式版 |

快速开始指南 1. 启用Vertex AI API服务 2. 通过控制台或API密钥认证 3. 支持cURL命令和Python SDK调用 4. 提供详细的开发者文档参考

(注:已移除重复的技术参数说明和冗余的操作步骤描述,保留核心功能特性和关键升级点,优化了技术参数的表格呈现方式)

评论总结

以下是评论内容的总结:

  1. 版本迭代争议

    • 认为3.1版本相比3.0改进有限,版本号提升不合理
    • "Appears the only difference to 3.0 Pro Preview is Medium reasoning...increasing the number for such a minor change is not a move in the right direction."
    • "Anyone noticed that models are dropping ever faster...This is what recursive self-improvement with human support looks like."
  2. 性能评价

    • 部分用户报告3.1版本在编码等方面有明显提升
    • "3.1 was a big step up for coding over 3.0 (which I already found very good)"
    • "Surprisingly big jump in ARC-AGI-2 from 31% to 77%...now ahead"
    • 也有用户认为实际使用体验不如竞争对手
    • "always end up using Claude and Codex again...much, much worse than Claude and Codex"
  3. 技术问题反馈

    • 输出token限制问题
    • "Gemini 3 seems to have a much smaller token output limit than 2.5...losing vital context"
    • API可用性问题
    • "Doesn't show as available in gemini CLI for me...completely unclear how to actually use their stuff"
  4. 发布流程批评

    • 发布过程混乱
    • "google is having a disjointed roll out...showed up unannounced in vertex at 2am"
    • 版本状态困惑
    • "Another preview release...recommended model by Google for production is 2.5 Flash and Pro?"
  5. 正面评价

    • 部分用户对特定版本表示满意
    • "cheap, fast, great for tool use and with agentic libraries"
    • "Still is a great sweet-spot for performance, speed and cost"
  6. 其他意见

    • 期待功能改进
    • "I wish Google also updated Flash-lite to 3.0+"
    • 技术实现批评
    • "I'd love a new Gemini agent that isn't written with Node.js"