刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座

刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座

刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座
刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座...
2025-04-06 · 浏览248次
LLM「想太多」有救了!高效推理让大模型思考过程更精简

LLM「想太多」有救了!高效推理让大模型思考过程更精简

LLM「想太多」有救了!高效推理让大模型思考过程更精简
LLM「想太多」有救了!高效推理让大模型思考过程更精简...
2025-04-06 · 浏览208次
AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断

AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断

AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断
AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断...
2025-04-06 · 浏览163次
Meta 发布 Llama 4 系列 AI 模型,引入“混合专家架构”提升效率

Meta 发布 Llama 4 系列 AI 模型,引入“混合专家架构”提升效率

Meta 发布 Llama 4 系列 AI 模型,引入“混合专家架构”提升效率
Meta推出Llama 4系列AI模型,含Scout、Maverick和尚在训练的Behemoth。已上架Scout和Maverick,性能各有亮点。#Meta #Llama4...
2025-04-06 · 浏览295次
思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套

思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套

思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套
AI 可能「借鉴」了什么参考内容,但压根不提。...
2025-04-05 · 浏览295次
刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?

刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?

刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?
一种全新的学习方法。...
2025-04-05 · 浏览327次
Multi-Token突破注意力机制瓶颈,Meta发明了一种很新的Transformer

Multi-Token突破注意力机制瓶颈,Meta发明了一种很新的Transformer

Multi-Token突破注意力机制瓶颈,Meta发明了一种很新的Transformer
Attention 还在卷自己。...
2025-04-05 · 浏览347次
三思而后行,让大模型推理更强的秘密是「THINK TWICE」?

三思而后行,让大模型推理更强的秘密是「THINK TWICE」?

三思而后行,让大模型推理更强的秘密是「THINK TWICE」?
近年来,大语言模型(LLM)的性能提升逐渐从训练时规模扩展转向推理阶段的优化,这一趋势催生了「测试时扩展(test-time scaling)」的研究热潮。...
2025-04-05 · 浏览351次
微软诞生50周年,比尔・盖茨撰文忆往昔,并发布了Altair BASIC源代码

微软诞生50周年,比尔・盖茨撰文忆往昔,并发布了Altair BASIC源代码

微软诞生50周年,比尔・盖茨撰文忆往昔,并发布了Altair BASIC源代码
1975 年 4 月 4 日,比尔・盖茨和保罗・艾伦在美国新墨西哥州阿尔伯克基市创立了微软公司。...
2025-04-05 · 浏览391次
7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。...
2025-04-05 · 浏览280次
CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?

CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?

CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?
文生图 or 图生文?不必纠结了!...
2025-04-05 · 浏览471次
谷歌迄今最贵 AI 模型:Gemini 2.5 Pro API 定价公布,每百万输入 tokens 1.25 美元起

谷歌迄今最贵 AI 模型:Gemini 2.5 Pro API 定价公布,每百万输入 tokens 1.25 美元起

谷歌迄今最贵 AI 模型:Gemini 2.5 Pro API 定价公布,每百万输入 tokens 1.25 美元起
而对于超过200000个tokens的输入,费用为每百万输入tokens 2.50美元(现汇率约合 18.2 元人民币),输出tokens为每百万15美元(现汇率约合 109 ...
2025-04-05 · 浏览325次
消息称 Meta Llama 4 AI 大语言模型将于本月发布,但数学处理及推理能力尚待改进

消息称 Meta Llama 4 AI 大语言模型将于本月发布,但数学处理及推理能力尚待改进

消息称 Meta Llama 4 AI 大语言模型将于本月发布,但数学处理及推理能力尚待改进
,据 The Information 报道,Meta 的下一代大语言模型 Llama 4 仍在开发中,但相应模型在内部基准测试中“表现不佳”。尤其是在数学处理能力和推理能力方面...
2025-04-05 · 浏览310次
微软首席技术官:2030 年 AI 将生成 95% 代码,工程师成为指令引导者

微软首席技术官:2030 年 AI 将生成 95% 代码,工程师成为指令引导者

微软首席技术官:2030 年 AI 将生成 95% 代码,工程师成为指令引导者
他认为,AI并不会取代开发人员,而是将从根本上改变他们的工作方式。...
2025-04-05 · 浏览232次
消息称谷歌 Gemini AI 部门高层调整:掌门人 Sissie Hsiao 下台、原 Google Labs 主管上位

消息称谷歌 Gemini AI 部门高层调整:掌门人 Sissie Hsiao 下台、原 Google Labs 主管上位

消息称谷歌 Gemini AI 部门高层调整:掌门人 Sissie Hsiao 下台、原 Google Labs 主管上位
据外媒 Semafor 报道,谷歌旗下 Gemini AI 部门近期发生重大人事变动,长期担任该部门负责人的 Sissie Hsiao 卸任,由负责开发 NotebookLM ...
2025-04-05 · 浏览319次
刚刚,特朗普扼杀全美GPU供应链?科技大厂核心AI算力告急,硅谷陷巨大恐慌

刚刚,特朗普扼杀全美GPU供应链?科技大厂核心AI算力告急,硅谷陷巨大恐慌

刚刚,特朗普扼杀全美GPU供应链?科技大厂核心AI算力告急,硅谷陷巨大恐慌
刚刚,特朗普扼杀全美GPU供应链?科技大厂核心AI算力告急,硅谷陷巨大恐慌...
2025-04-05 · 浏览325次
奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了

奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了

奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了
奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了...
2025-04-05 · 浏览251次
英伟达GPU命名背后:是情怀,也是致敬伟人的智慧!

英伟达GPU命名背后:是情怀,也是致敬伟人的智慧!

英伟达GPU命名背后:是情怀,也是致敬伟人的智慧!
英伟达GPU命名背后:是情怀,也是致敬伟人的智慧!...
2025-04-05 · 浏览311次
谷歌暗讽OpenAI:GPU在熔化,TPU火上浇油!Canvas免费开放,实测惊人

谷歌暗讽OpenAI:GPU在熔化,TPU火上浇油!Canvas免费开放,实测惊人

谷歌暗讽OpenAI:GPU在熔化,TPU火上浇油!Canvas免费开放,实测惊人
谷歌暗讽OpenAI:GPU在熔化,TPU火上浇油!Canvas免费开放,实测惊人...
2025-04-05 · 浏览228次
DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布!

DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布!

DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布!
DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布!...
2025-04-04 · 浏览226次
Llama 4发布在即,Meta AI负责人突然官宣离职

Llama 4发布在即,Meta AI负责人突然官宣离职

Llama 4发布在即,Meta AI负责人突然官宣离职
Llama 4发布在即,Meta AI负责人突然官宣离职...
2025-04-04 · 浏览216次
一篇论文,看见百度广告推荐系统在大模型时代的革新

一篇论文,看见百度广告推荐系统在大模型时代的革新

一篇论文,看见百度广告推荐系统在大模型时代的革新
2025 年,生成式 AI 的发展速度正在加快。...
2025-04-04 · 浏览288次
OpenAI的AI复现论文新基准,Claude拿了第一名

OpenAI的AI复现论文新基准,Claude拿了第一名

OpenAI的AI复现论文新基准,Claude拿了第一名
大模型能写出 ICML Spotlight 论文吗?...
2025-04-04 · 浏览271次
53%性能全面提升,Ayu新模型横扫传统工具,分泌蛋白预测效率再翻倍

53%性能全面提升,Ayu新模型横扫传统工具,分泌蛋白预测效率再翻倍

53%性能全面提升,Ayu新模型横扫传统工具,分泌蛋白预测效率再翻倍
该模型实际应用于海洋样本(Tara Oceans 数据集)时,相比于最广泛使用的鉴定分泌蛋白的方法,全新的方法能够回收两倍以上的蛋白质。...
2025-04-04 · 浏览290次
第一页 · 上一页 · 下一页 · 当前第154页