豆包大模型 1.6-vision 发布：家族首个能调用工具的视觉深度思考模型

2025-10-01 发布浏览541次点赞0次收藏0次

10 月 1 日消息，火山引擎昨日宣布正式推出豆包大模型 1.6-vision，这是豆包大模型家族首个具备工具调用能力的视觉深度思考模型，拥有更强的通用多模态理解和推理能力，并支持 Responses API，以更高性价比更好满足客户在视觉理解精准度上的高阶需求。

据官方介绍，豆包大模型 1.6-vision 以工具调用的差异化能力，将图像融入其思维链中，实现对图片的定位、剪裁、点选、画线、缩放、旋转等精细处理。并通过模拟人类从“从全局扫描到局部聚焦”的视觉推理过程，在增强推理可解释性的同时，可高效精准地完成图像操作。

与上一代 Doubao-1.5-thinking-vision-pro 相比，豆包大模型 1.6-vision 综合成本降低约 50%。以用户最常用的 32K 输入输出场景为例，成本从 5.25 元降至 2.6 元。

豆包大模型 1.6-vision 发布：家族首个能调用工具的视觉深度思考模型

注意到，今年 6 月，火山引擎曾推出豆包大模型 1.6，以多模态思考能力强化了对复杂场景的理解。

豆包大模型火山引擎大模型 4

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！