火山引擎正式发布豆包大模型1.6-vision 开启视觉深度思考新体验

9月30日，火山引擎通过官方渠道宣布，旗下豆包大模型家族迎来重要更新——豆包大模型1.6-vision正式发布。作为豆包大模型家族中首个具备工具调用能力的视觉深度思考模型，该版本在通用多模态理解、推理能力上实现显著升级，同时首次支持Responses API，为开发者和企业用户带来更高效、低成本的视觉AI解决方案。

三大核心优势：精准、高效、高性价比

豆包大模型1.6-vision围绕“视觉理解+工具调用”的核心定位，构建了三大差异化优势，具体如下：

工具调用赋能，视觉理解更精准：该模型以工具调用为核心差异化能力，将图像信息深度融入思维链，可实现对图片的定位、剪裁、点选、画线、缩放、旋转等精细化操作。更关键的是，模型模拟人类“从全局扫描到局部聚焦”的视觉推理逻辑，在提升推理过程可解释性的同时，进一步确保图像操作的高效与精准。
支持Responses API，应用开发更高效：针对开发者需求，豆包大模型1.6-vision新增Responses API支持，开发者可根据业务场景自主选择调用工具，大幅减少Agent开发过程中的代码编写量，显著提升应用开发效率，降低AI应用落地门槛。
综合成本降约50%，性价比再跃升：对比上一代视觉理解模型（Doubao-1.5-thinking-vision-pro），豆包大模型1.6-vision在性能提升的基础上，综合成本降低约50%，真正实现“更低成本解锁更强性能”，为中小微企业及个人开发者使用高阶视觉AI模型提供了更多可能。

火山引擎相关负责人表示，豆包大模型1.6-vision的发布，是其在多模态AI领域的重要突破，未来将持续优化模型能力，推动视觉AI技术在电商、教育、医疗、工业等多场景的落地应用，为产业数字化转型提供更有力的技术支撑。

绘梦拾光-AI艺术灵感

火山引擎发布豆包大模型1.6-vision 综合成本降低约50%

火山引擎正式发布豆包大模型1.6-vision 开启视觉深度思考新体验

三大核心优势：精准、高效、高性价比