训练模型 标签,匹配到约395个结果, 耗时0.0413秒
DeepMind果蝇登Nature,强化学习再立功!AI模拟飞行,逼真到腿毛颤抖

DeepMind果蝇登Nature,强化学习再立功!AI模拟飞行,逼真到腿毛颤抖

DeepMind果蝇登Nature,强化学习再立功!AI模拟飞行,逼真到腿毛颤抖
DeepMind果蝇登Nature,强化学习再立功!AI模拟飞行,逼真到腿毛颤抖...
2025-04-24 · 浏览61次
ICLR 2025杰出论文公布!中科大硕士、OpenAI漆翔宇摘桂冠

ICLR 2025杰出论文公布!中科大硕士、OpenAI漆翔宇摘桂冠

ICLR 2025杰出论文公布!中科大硕士、OpenAI漆翔宇摘桂冠
ICLR 2025杰出论文公布!中科大硕士、OpenAI漆翔宇摘桂冠...
2025-04-23 · 浏览89次
Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用

Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用

Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用
Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用...
2025-04-22 · 浏览69次
扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源
大语言模型的推理能力,不再是 AR(自回归)的专属。扩散模型现在也能「动脑子」,新框架 d1 让它们学会了解数学、懂逻辑、会思考。...
2025-04-20 · 浏览41次
OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙

OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙

OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙
OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙...
2025-04-20 · 浏览67次
Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强

Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强

Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强
Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强...
2025-04-20 · 浏览50次
FramePack 降低 AI 视频生成硬件门槛,6GB 显存即可生成 60 秒视频

FramePack 降低 AI 视频生成硬件门槛,6GB 显存即可生成 60 秒视频

FramePack 降低 AI 视频生成硬件门槛,6GB 显存即可生成 60 秒视频
GitHub与斯坦福大学合作推出FramePack技术,通过固定长度时域上下文优化视频扩散模型,仅需6GB显存即可生成60秒高质量AI视频,大幅降低硬件门槛。#AI视频生成# #FramePack技术#...
2025-04-20 · 浏览76次
迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了

迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了

迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了
近年来,大模型(Large Language Models, LLMs)在数学、编程等复杂任务上取得突破,OpenAI-o1、DeepSeek-R1 等推理大模型(Reason...
2025-04-16 · 浏览67次
Mogao=Seedream 3.0?霸榜数天,神秘文生图模型曝光(附技术报告)

Mogao=Seedream 3.0?霸榜数天,神秘文生图模型曝光(附技术报告)

Mogao=Seedream 3.0?霸榜数天,神秘文生图模型曝光(附技术报告)
霸榜数天的神秘文生图模型 Mogao,什么来头?...
2025-04-16 · 浏览80次
AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理

AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理

AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理
AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理...
2025-04-15 · 浏览55次
Meta 恢复在欧盟使用用户公开数据训练 AI 模型,曾因隐私问题暂停

Meta 恢复在欧盟使用用户公开数据训练 AI 模型,曾因隐私问题暂停

Meta 恢复在欧盟使用用户公开数据训练 AI 模型,曾因隐私问题暂停
Meta宣布恢复在欧盟使用Facebook和Instagram上的公开内容训练AI模型,用户将收到通知并可选择退出。此举遵循GDPR规定,Meta强调不会使用私人消息及未成年用...
2025-04-15 · 浏览31次
更长思维并不等于更强推理性能,强化学习可以很简洁

更长思维并不等于更强推理性能,强化学习可以很简洁

更长思维并不等于更强推理性能,强化学习可以很简洁
今天早些时候,著名研究者和技术作家 Sebastian Raschka 发布了一条推文,解读了一篇来自 Wand AI 的强化学习研究,其中分析了推理模型生成较长响应的原因。...
2025-04-15 · 浏览25次
强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展

强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展

强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展
「推理」已成为语言模型的下一个主要前沿领域,近期学术界和工业界都取得了突飞猛进的进展。...
2025-04-14 · 浏览23次
魔改AlphaZero后,《我的世界》AI老玩家问世,干活不用下指令

魔改AlphaZero后,《我的世界》AI老玩家问世,干活不用下指令

魔改AlphaZero后,《我的世界》AI老玩家问世,干活不用下指令
人和智能体共享奖励参数,这才是强化学习正确的方向?...
2025-04-13 · 浏览57次
扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得

扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得

扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得
扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得...
2025-04-13 · 浏览29次
只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀

只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀

只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀
只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀...
2025-04-13 · 浏览20次
算法不重要,AI的下一个范式突破,「解锁」新数据源才是关键

算法不重要,AI的下一个范式突破,「解锁」新数据源才是关键

算法不重要,AI的下一个范式突破,「解锁」新数据源才是关键
众所周知,人工智能在过去十五年里取得了令人难以置信的进步,尤其是在最近五年。...
2025-04-12 · 浏览49次
CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别
在现实世界中,如何让智能体理解并挖掘 3D 场景中可交互的部位(Affordance)对于机器人操作与人机交互至关重要。...
2025-04-11 · 浏览75次
Nature子刊,字节跳动开发MD模拟预测框架,助力锂电池液体电解质研究

Nature子刊,字节跳动开发MD模拟预测框架,助力锂电池液体电解质研究

Nature子刊,字节跳动开发MD模拟预测框架,助力锂电池液体电解质研究
字节跳动团队的研究人员提出了 ByteDance AI Molecular Simulation Booster (BAMBOO),这是一种用于分子动力学(MD)模拟的预测框架...
2025-04-09 · 浏览56次
类R1强化学习迁移到视觉定位!全开源Vision-R1将图文大模型性能提升50%

类R1强化学习迁移到视觉定位!全开源Vision-R1将图文大模型性能提升50%

类R1强化学习迁移到视觉定位!全开源Vision-R1将图文大模型性能提升50%
图文大模型通常采用「预训练 + 监督微调」的两阶段范式进行训练,以强化其指令跟随能力。...
2025-04-09 · 浏览71次
Llama 4在测试集上训练?内部员工、官方下场澄清,LeCun转发

Llama 4在测试集上训练?内部员工、官方下场澄清,LeCun转发

Llama 4在测试集上训练?内部员工、官方下场澄清,LeCun转发
大家翘首以盼的 Llama 4,用起来为什么那么拉跨?...
2025-04-09 · 浏览49次
IDC:2028 年中国 AI 总投资规模将突破 1000 亿美元,五年复合增长率达 35.2%

IDC:2028 年中国 AI 总投资规模将突破 1000 亿美元,五年复合增长率达 35.2%

IDC:2028 年中国 AI 总投资规模将突破 1000 亿美元,五年复合增长率达 35.2%
数据显示,2024 年全球人工智能(AI)IT 总投资规模为 3,158 亿美元,并有望在 2028 年增至 8,159 亿美元,五年复合增长率(CAGR)为 32.9%。...
2025-04-07 · 浏览62次
Meta LIama 4 重夺开源第一:DeepSeek 同等代码能力但参数减半,一张 H100 就能跑,还有两万亿参数超大杯

Meta LIama 4 重夺开源第一:DeepSeek 同等代码能力但参数减半,一张 H100 就能跑,还有两万亿参数超大杯

Meta LIama 4 重夺开源第一:DeepSeek 同等代码能力但参数减半,一张 H100 就能跑,还有两万亿参数超大杯
Meta 官推激情表示,这些 Llama 4 模型标志着 Llama 生态系统新时代 —— 原生多模态 AI 创新的开始。...
2025-04-07 · 浏览71次
Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek

Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek

Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek
万万没想到。Meta 选择在周六日,发布了最新 AI 模型系列 ——Llama 4,这是其 Llama 家族的最新成员。...
2025-04-07 · 浏览82次
第一页 · 上一页 · 下一页 · 当前第1页