训练模型 标签,匹配到约395个结果, 耗时0.0413秒

DeepMind果蝇登Nature,强化学习再立功!AI模拟飞行,逼真到腿毛颤抖

DeepMind果蝇登Nature,强化学习再立功!AI模拟飞行,逼真到腿毛颤抖...
2025-04-24
·
浏览61次


Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用

Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用...
2025-04-22
·
浏览69次

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

大语言模型的推理能力,不再是 AR(自回归)的专属。扩散模型现在也能「动脑子」,新框架 d1 让它们学会了解数学、懂逻辑、会思考。...
2025-04-20
·
浏览41次



FramePack 降低 AI 视频生成硬件门槛,6GB 显存即可生成 60 秒视频

GitHub与斯坦福大学合作推出FramePack技术,通过固定长度时域上下文优化视频扩散模型,仅需6GB显存即可生成60秒高质量AI视频,大幅降低硬件门槛。#AI视频生成# #FramePack技术#...
2025-04-20
·
浏览76次

迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了

近年来,大模型(Large Language Models, LLMs)在数学、编程等复杂任务上取得突破,OpenAI-o1、DeepSeek-R1 等推理大模型(Reason...
2025-04-16
·
浏览67次



Meta 恢复在欧盟使用用户公开数据训练 AI 模型,曾因隐私问题暂停

Meta宣布恢复在欧盟使用Facebook和Instagram上的公开内容训练AI模型,用户将收到通知并可选择退出。此举遵循GDPR规定,Meta强调不会使用私人消息及未成年用...
2025-04-15
·
浏览31次

更长思维并不等于更强推理性能,强化学习可以很简洁

今天早些时候,著名研究者和技术作家 Sebastian Raschka 发布了一条推文,解读了一篇来自 Wand AI 的强化学习研究,其中分析了推理模型生成较长响应的原因。...
2025-04-15
·
浏览25次

强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展

「推理」已成为语言模型的下一个主要前沿领域,近期学术界和工业界都取得了突飞猛进的进展。...
2025-04-14
·
浏览23次



只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀

只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀...
2025-04-13
·
浏览20次


CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

在现实世界中,如何让智能体理解并挖掘 3D 场景中可交互的部位(Affordance)对于机器人操作与人机交互至关重要。...
2025-04-11
·
浏览75次

Nature子刊,字节跳动开发MD模拟预测框架,助力锂电池液体电解质研究

字节跳动团队的研究人员提出了 ByteDance AI Molecular Simulation Booster (BAMBOO),这是一种用于分子动力学(MD)模拟的预测框架...
2025-04-09
·
浏览56次

类R1强化学习迁移到视觉定位!全开源Vision-R1将图文大模型性能提升50%

图文大模型通常采用「预训练 + 监督微调」的两阶段范式进行训练,以强化其指令跟随能力。...
2025-04-09
·
浏览71次


IDC:2028 年中国 AI 总投资规模将突破 1000 亿美元,五年复合增长率达 35.2%

数据显示,2024 年全球人工智能(AI)IT 总投资规模为 3,158 亿美元,并有望在 2028 年增至 8,159 亿美元,五年复合增长率(CAGR)为 32.9%。...
2025-04-07
·
浏览62次

Meta LIama 4 重夺开源第一:DeepSeek 同等代码能力但参数减半,一张 H100 就能跑,还有两万亿参数超大杯

Meta 官推激情表示,这些 Llama 4 模型标志着 Llama 生态系统新时代 —— 原生多模态 AI 创新的开始。...
2025-04-07
·
浏览71次

Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek

万万没想到。Meta 选择在周六日,发布了最新 AI 模型系列 ——Llama 4,这是其 Llama 家族的最新成员。...
2025-04-07
·
浏览82次