美团发布 LongCat-Flash-Lite 轻量化 MoE 模型，智能体与代码表现突出

2026-02-06 发布浏览416次点赞0次收藏0次

感谢网友 GreatMOLA 的线索投递！

2 月 6 日消息，美团今日（2 月 6 日）发布 LongCat-Flash-Lite 模型，这是一款拥有 685 亿参数，每次推理仅激活 29 亿 ~45 亿参数的轻量化 MoE 模型。

通过将超过 300 亿参数用于嵌入层，LongCat-Flash-Lite 宣称不仅超越了参数量等效的 MoE 基线模型，还在与同规模现有模型的对比中展现出“卓越的竞争力”，尤其在智能体与代码领域表现突出，并依托 YARN 技术可支持最长 256 K 上下文，能高效处理长文档、大规模代码分析等场景。

同时，该模型基于嵌入扩展的应用与系统级优化，让模型推理效率大幅提升，在输入 4K，输出 1k 的典型负载下，LongCat API 可提供 500-700 token/s 的生成速度。

美团宣布向开发者开放 LongCat-Flash-Lite 版本 API 接口，可登录 LongCat API 开放平台申请，每日免费额度 5000 万 tokens。

附 LongCat-Flash-Lite 开源地址如下：

https://github.com/meituan-longcat/SGLang-FluentLLM

美团模型美团 AI 4

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

美团发布 LongCat-Flash-Lite 轻量化 MoE 模型，智能体与代码表现突出

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。