火山引擎发布豆包大模型1.6-vision 综合成本降低约50%

火山引擎正式发布豆包大模型1.6-vision 开启视觉深度思考新体验

9月30日,火山引擎通过官方渠道宣布,旗下豆包大模型家族迎来重要更新——豆包大模型1.6-vision正式发布。作为豆包大模型家族中首个具备工具调用能力的视觉深度思考模型,该版本在通用多模态理解、推理能力上实现显著升级,同时首次支持Responses API,为开发者和企业用户带来更高效、低成本的视觉AI解决方案。
 

三大核心优势:精准、高效、高性价比

豆包大模型1.6-vision围绕“视觉理解+工具调用”的核心定位,构建了三大差异化优势,具体如下:

  • 工具调用赋能,视觉理解更精准:该模型以工具调用为核心差异化能力,将图像信息深度融入思维链,可实现对图片的定位、剪裁、点选、画线、缩放、旋转等精细化操作。更关键的是,模型模拟人类“从全局扫描到局部聚焦”的视觉推理逻辑,在提升推理过程可解释性的同时,进一步确保图像操作的高效与精准。
  • 支持Responses API,应用开发更高效:针对开发者需求,豆包大模型1.6-vision新增Responses API支持,开发者可根据业务场景自主选择调用工具,大幅减少Agent开发过程中的代码编写量,显著提升应用开发效率,降低AI应用落地门槛。
  • 综合成本降约50%,性价比再跃升:对比上一代视觉理解模型(Doubao-1.5-thinking-vision-pro),豆包大模型1.6-vision在性能提升的基础上,综合成本降低约50%,真正实现“更低成本解锁更强性能”,为中小微企业及个人开发者使用高阶视觉AI模型提供了更多可能。
  •  

火山引擎相关负责人表示,豆包大模型1.6-vision的发布,是其在多模态AI领域的重要突破,未来将持续优化模型能力,推动视觉AI技术在电商、教育、医疗、工业等多场景的落地应用,为产业数字化转型提供更有力的技术支撑。

最新文章

  • 河畔的多彩小镇
    英文:Create a panoramic view of a picturesque town by a t…