Copyright © 2022-2025 aizws.net · 网站版本: v1.2.6·内部版本: v1.24.5·
页面加载耗时 0.00 毫秒·物理内存 99.2MB ·虚拟内存 1306.4MB
欢迎来到 AI 中文社区(简称 AI 中文社),这里是学习交流 AI 人工智能技术的中文社区。 为了更好的体验,本站推荐使用 Chrome 浏览器。
7 月 25 日消息,根据 modelscope / ms-swift 代码库显示的 commit 记录,智谱即将发布 GLM-4.5 系列模型,预估采用全新的混合专家(MoE)结构,是一款多模态可扩展大模型。
根据 commit 上显示的代码,GLM-4.5 系列模型预估会有 GLM-4.5(355B-A32B)和 GLM-4.5-Air(106B-A12B)两款模型。
附上网友 @惊鱼 在 Linux DO 论坛发布的分析内容如下:
GLM-4.5 是基于混合专家(MoE)结构的多模态可扩展大模型,具备高吞吐推理、结构化工具调用、可解释推理追踪、分布式负载均衡等特性。
支持多专家分组、负载均衡、分布式推理和多 token 预测(MTP)推理。
添加了新的推理解析器和工具调用解析器,允许模型输出严格的… 推理内容和 <tool_call>…</tool_call> 工具调用内容,便于工具增强推理与函数调用。
文档显示 GLM-4.5 支持 T(文本)、I(图像)、E+(可扩展)、V+(视觉扩展),表明模型定位为多模态增强大模型。
声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。