开源 标签,匹配到约37个结果, 耗时0.1130秒
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
阿里通义今日官宣 Qwen3-VL 系列再添新成员 ——Dense 架构的 Qwen3-VL-8B、Qwen3-VL-4B 模型开源上线。...
2025-10-15
·
浏览106次
蚂蚁集团发布万亿参数旗舰模型 Ling-1T 并开源,多项指标位居开源模型榜首
蚂蚁集团发布万亿参数通用语言模型Ling-1T,在多项复杂推理基准测试中表现优异,代码生成、数学竞赛等任务领先开源模型。该模型支持128K上下文窗口,展现出高效思考与精准推理的卓越平衡。#AI大模型##开源技术#...
2025-10-09
·
浏览208次
B站开源自研 IndexTTS-2.0:情感可控、时长可控的零样本语音合成 AI 模型
哔哩哔哩(Bilibili)昨日(9 月 8 日)发布公告,宣布正式开源其自研语音生成大模型 IndexTTS-2.0,是首个支持精确时长控制(Duration Control)的自回归(Autoregressive)零样本文本转语音(TT...
2025-09-09
·
浏览521次
瑞士加入全球 AI 竞赛,推出国家级开源大语言模型 Apertus
瑞士正式发布国家级开源大语言模型Apertus,由公立机构研发,完全开源并遵循数据保护法。该模型支持1000多种语言,非英语数据占比40%,旨在成为公共基础设施。#AI开源# #瑞士科技#...
2025-09-03
·
浏览129次
美团发布并开源 LongCat-Flash-Chat 大模型:总参数 560B,AI 智能体任务表现突出
LongCat-Flash 采用创新性混合专家模型(Mixture-of-Experts,MoE)架构,总参数 560B,激活参数 18.6B~31.3B(平均 27B),实现了计算效率与性能的双重优化。...
2025-09-01
·
浏览387次
IBM 联合 NASA 发布开源 AI 模型,对太阳天气进行预测和预警
该模型名为“Surya”(梵语意为“太阳“),它提供了一种创新工具,帮助保护 GPS 导航、电网、电信等关键基础设施免受太阳天气变化的影响。...
2025-08-28
·
浏览140次
解锁任意模态 AI 模型训练,字节跳动 Seed 开源 VeOmni 框架
字节跳动介绍称,VeOmni 采用以模型为中心的分布式训练方案,可将复杂的分布式并行逻辑与模型计算解耦,让研究员像搭积木一样,为全模态模型组合设置高效的并行训练方案。这一方式可大幅降低工程开销,提升训练效率和扩展性,将数周的工程开发时间缩短...
2025-08-14
·
浏览230次
AI 生成游戏,昆仑万维发布并开源 Matrix-Game 2.0、Matrix-3D 模型
昆仑万维带来了自研世界模型 Matrix 系列中 Matrix-Game 交互世界模型的升级版本 ——「Matrix-Game 2.0」,号称是实现了通用场景下的交互式实时长序列生成的世界模型。...
2025-08-12
·
浏览177次
智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”
智谱 AI 今日推出全球 100B 级效果最佳的开源视觉推理模型 GLM-4.5V(总参数 106B,激活参数 12B),并同步在魔搭社区与 Hugging Face 开源。此外,API 调用价格低至输入 2 元 / M tokens,输出...
2025-08-12
·
浏览233次
阿里达摩院首次开源具身智能“三大件”机器人上下文协议
阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。...
2025-08-11
·
浏览189次
阿里通义千问首个图像生成基础模型 Qwen-Image 开源,支持中文高保真输出
阿里通义千问团队今日宣布开源 Qwen-Image,这是一个 20B 的 MMDiT 模型,也是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得了显著进展。...
2025-08-05
·
浏览252次
谷歌前 CEO 施密特称中国领先的大模型皆为开源,呼吁中美开展合作
施密特表示,自己始终是个乐观主义者,相信中美可以逐步建立信任,历史上做到过,现在也能再次实现。...
2025-07-26
·
浏览200次
字节跳动开源其 AI IDE 工具核心组件 Trae-Agent
GitHub 页面显示,Trae Agent 是一个基于 LLM 通用软件工程任务的智能体。它提供了一个 CLI 界面,可以理解自然语言指令,并使用各种工具和 LLM 提供商执行复杂的软件工程工作流。该项目仍处于 alpha 阶段,并积极开...
2025-07-07
·
浏览280次
微软开源适用于 VS Code 的 GitHub Copilot Chat 扩展,助推 AI 编程自动化
这意味着开发社区可以深入了解和洞察聊天式编码助手的完整实现,包括“智能体模式”的实现细节、发送给大型语言模型(LLM)的上下文数据以及系统提示的设计。...
2025-07-02
·
浏览206次
ChatGPT 化身生活操作系统:OpenAI 奥尔特曼预告下一代顶级 AI
OpenAI 计划发布一个非常强大的开源模型。它能够让人们在本地运行极其强大的模型,重新认识“本地部署”的可能性。在旧金山 AI 初创学校对话中,奥尔特曼宣布了以上消息。这场对话由 Y Combinator 的首席执行官 Garry Tan...
2025-06-30
·
浏览233次
国内首个:网易有道开源“子曰 3 数学模型”,单块消费级 GPU 即可运行
网易有道官方测试数据显示,在 CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500 等数据集上,14B 轻量级的“子曰 3 数学模型”各项得分均高于 DeepSeek-R...
2025-06-23
·
浏览218次
OpenAI 开源模型发布推迟至夏末,CEO 奥尔特曼称“非常值得等待”
OpenAI CEO山姆・奥尔特曼宣布,原定初夏发布的开源模型将推迟至夏末,因团队取得‘意想不到且相当惊人’的成果。该模型旨在超越现有开源推理模型,如DeepSeek R1。行业竞争激烈,Mistral和Qwen近期也发布了新模型。#AI开...
2025-06-11
·
浏览178次
字节 Seed 开源统一多模态理解和生成模型 BAGEL
BAGEL 具有 70 亿个激活参数(总共 140 亿个),并在大规模交错多模态数据上进行训练。BAGEL 在标准多模态理解排行榜上超越了当前顶级的开源 VLMs,如 Qwen2.5-VL 和 InternVL-2.5,并且提供了与专业生成...
2025-06-03
·
浏览309次
Anthropic 开源“思维追踪”工具,可视化揭秘 AI 内部逻辑
Anthropic 昨日(5 月 29 日)发布博文,宣布推出“电路追踪”(Circuit Tracer)开源工具,以图形化方式,追踪并展示 AI 大语言模型的内部思维过程。...
2025-05-30
·
浏览220次
B站团队开源动漫视频生成模型 AniSora,一键创建不同风格片段
AniSora 能够一键创建多种动漫风格的视频片段,包括系列剧集、中国原创动画、漫画改编、VTuber 内容、动漫 PV 和鬼畜动画等。...
2025-05-18
·
浏览429次
英伟达开源 OCR 代码推理 AI 模型:LiveCodeBench 基准超 OpenAI o3-Mini 和 o1(low)
英伟达开源其 Open Code Reasoning(OCR)模型套装,含 32B、14B 和 7B 三种参数规模,均采用 Apache 2.0 许可证发布,模型权重和配置已在 Hugging Face 平台开放下载。...
2025-05-09
·
浏览258次
超越 DeepSeek-R1,英伟达开源模型 Llama-Nemotron 登顶
超越 DeepSeek-R1 的英伟达开源新王 Llama-Nemotron,是怎么训练出来的?刚刚放出的论文,把一切细节毫无保留地全部揭秘了!...
2025-05-06
·
浏览279次
消息称 OpenAI 计划今夏初发布开源语言模型,力争推理能力超越同类
消息称 OpenAI计划今夏初发布开源语言模型,推理能力或超越同类,采用宽松许可协议,避开争议。此举或为应对开源竞争对手如Meta的Llama和DeepSeek的压力。#AI开源# #OpenAI#...
2025-04-24
·
浏览310次
DeepSeek-R1 成 Hugging Face 最受欢迎大模型,力压近 150 万个“对手”
Clement Delangue今日凌晨发文宣布:DeepSeek-R1在Hugging Face上获得了超过10000个赞,成为该平台近150万个模型之中最受欢迎的大模型,“...
2025-02-24
·
浏览300次
AI 中文社