Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek
万万没想到。Meta 选择在周六日,发布了最新 AI 模型系列 ——Llama 4,这是其 Llama 家族的最新成员。...
2025-04-07
·
浏览360次
大语言模型变身软体机器人设计「自然选择器」,GPT、Gemini、Grok争做最佳
大型语言模型 (LLM) 在软体机器人设计领域展现出了令人振奋的应用潜力。...
2025-04-06
·
浏览298次
刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座
刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座...
2025-04-06
·
浏览286次
Meta 发布 Llama 4 系列 AI 模型,引入“混合专家架构”提升效率
Meta推出Llama 4系列AI模型,含Scout、Maverick和尚在训练的Behemoth。已上架Scout和Maverick,性能各有亮点。#Meta #Llama4...
2025-04-06
·
浏览351次
三思而后行,让大模型推理更强的秘密是「THINK TWICE」?
近年来,大语言模型(LLM)的性能提升逐渐从训练时规模扩展转向推理阶段的优化,这一趋势催生了「测试时扩展(test-time scaling)」的研究热潮。...
2025-04-05
·
浏览423次
微软诞生50周年,比尔・盖茨撰文忆往昔,并发布了Altair BASIC源代码
1975 年 4 月 4 日,比尔・盖茨和保罗・艾伦在美国新墨西哥州阿尔伯克基市创立了微软公司。...
2025-04-05
·
浏览461次
7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。...
2025-04-05
·
浏览329次
谷歌迄今最贵 AI 模型:Gemini 2.5 Pro API 定价公布,每百万输入 tokens 1.25 美元起
而对于超过200000个tokens的输入,费用为每百万输入tokens 2.50美元(现汇率约合 18.2 元人民币),输出tokens为每百万15美元(现汇率约合 109 ...
2025-04-05
·
浏览384次
消息称 Meta Llama 4 AI 大语言模型将于本月发布,但数学处理及推理能力尚待改进
,据 The Information 报道,Meta 的下一代大语言模型 Llama 4 仍在开发中,但相应模型在内部基准测试中“表现不佳”。尤其是在数学处理能力和推理能力方面...
2025-04-05
·
浏览380次
消息称谷歌 Gemini AI 部门高层调整:掌门人 Sissie Hsiao 下台、原 Google Labs 主管上位
据外媒 Semafor 报道,谷歌旗下 Gemini AI 部门近期发生重大人事变动,长期担任该部门负责人的 Sissie Hsiao 卸任,由负责开发 NotebookLM ...
2025-04-05
·
浏览382次
奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了
奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了...
2025-04-05
·
浏览288次
谷歌暗讽OpenAI:GPU在熔化,TPU火上浇油!Canvas免费开放,实测惊人
谷歌暗讽OpenAI:GPU在熔化,TPU火上浇油!Canvas免费开放,实测惊人...
2025-04-05
·
浏览260次
AI 中文社