Hacker News 中文摘要

RSS订阅

DeepSeek 推出视觉功能 -- DeepSeek Introduces Vision

文章摘要

DeepSeek网站使用cookies以提供和改善服务并确保安全,用户可根据cookie政策选择接受全部或仅必要cookies,但选择可能影响部分功能。

文章总结

标题:DeepSeek

来源网址:https://chat.deepseek.com/

内容概述:我们使用Cookie来提供和改善服务,并确保安全。详情请查看我们的Cookie政策。您可以选择仅接受必要的Cookie或接受所有Cookie,但选择仅接受必要Cookie可能会影响部分功能。

评论总结

根据评论内容,总结如下:

主要观点与论据:

  1. 功能可用性询问:多位用户关注DeepSeek视觉功能是否已通过API或面向所有用户开放。例如,innis226问“API现在可用吗?”;crvdgc提到“视觉功能在中国已进行A/B测试一段时间,是否有官方公告说将向所有人开放?”。

  2. 性能与体验反馈:用户earth2mars称赞视觉功能“非常好且快速”,测试了各种奇怪照片,认为训练集足够大,能识别内容。但bjoli反映近期DeepSeek回复中中文和中文推理增多,质疑是否为静默更新。

  3. 竞争与需求:andrewstuart讽刺称“OpenAI和Anthropic需要禁止这种免费外国竞争”。arjie希望像Qwen那样将视觉功能集成到DS4 Flash中,避免运行单独模型。tornikeo急需API支持视觉,以驱动Claude Agents SDK,并指出Qwen和Gemini Flash Lite比DeepSeek贵。

  4. 功能理解与期待:jiehong解释视觉功能让DeepSeek理解图片内容而非仅提取文字,但不能生成或修改图像,同时惊讶DS聊天应用仍无语音功能。throwaw12希望官方发布关于能力、质量、准确性的文章。tw1984质疑为何视觉支持耗时这么久,是否暗示梁认为视觉/语音对AGI不重要。

平衡性总结: - 正面:视觉功能性能好、速度快,训练集充分。 - 负面/疑问:API可用性不明确、中文回复增多、缺乏官方说明、语音功能缺失、视觉支持延迟。 - 需求:集成视觉到现有模型、降低API成本、官方透明度。