工程 标签,匹配到约255个结果, 耗时0.0234秒
扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源
大语言模型的推理能力,不再是 AR(自回归)的专属。扩散模型现在也能「动脑子」,新框架 d1 让它们学会了解数学、懂逻辑、会思考。...
2025-04-20 · 浏览41次
物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架

物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架

物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架
最近,来自大连理工和莫纳什大学的团队提出了物理真实的视频生成框架 VLIPP。...
2025-04-18 · 浏览46次
从思考到行动:大模型自主工具调用能力的深度实现

从思考到行动:大模型自主工具调用能力的深度实现

从思考到行动:大模型自主工具调用能力的深度实现
GPT - 4o、Deepseek - R1 等高级模型已展现出令人惊叹的「深度思考」能力:理解上下文关联、拆解多步骤问题、甚至通过思维链(Chain - of - Thoug...
2025-04-17 · 浏览69次
4K分辨率视觉预训练首次实现!伯克利&英伟达多模态新SOTA,更准且3倍加速处理

4K分辨率视觉预训练首次实现!伯克利&英伟达多模态新SOTA,更准且3倍加速处理

4K分辨率视觉预训练首次实现!伯克利&英伟达多模态新SOTA,更准且3倍加速处理
当前,所有主流的视觉基础模型(如 SigLIP、DINOv2 等)都仍然在低分辨率(如 384 * 384 分辨率)下进行预训练。...
2025-04-17 · 浏览65次
JHU提出最强ToM方法,AutoToM横扫五大基准

JHU提出最强ToM方法,AutoToM横扫五大基准

JHU提出最强ToM方法,AutoToM横扫五大基准
如何让 AI 像人一样思考?如何拥有像人一样的认知能力和社会能力?...
2025-04-16 · 浏览60次
ICLR 2025 | 一行代码!FreDF频域损失稳定提升时间序列预测精度

ICLR 2025 | 一行代码!FreDF频域损失稳定提升时间序列预测精度

ICLR 2025 | 一行代码!FreDF频域损失稳定提升时间序列预测精度
时间序列预测在气象预报、工业设备维护、医疗监测等领域具有关键应用价值。...
2025-04-15 · 浏览72次
迄今为止最大、最详细的哺乳动物脑连接图,详细展现海量神经元活动

迄今为止最大、最详细的哺乳动物脑连接图,详细展现海量神经元活动

迄今为止最大、最详细的哺乳动物脑连接图,详细展现海量神经元活动
研究人员通过绘制小鼠脑组织中一立方毫米内的细胞图谱,绘制出了迄今为止最大、最详细的哺乳动物脑连接图。...
2025-04-15 · 浏览68次
合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo

合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo

合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo
虽然扩散模型在视频生成领域展现出了卓越的性能,但是视频扩散模型通常需要大量的推理步骤对高斯噪声进行去噪才能生成一个视频。...
2025-04-15 · 浏览19次
面对杂乱场景,灵巧手也能从容应对!NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一策略

面对杂乱场景,灵巧手也能从容应对!NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一策略

面对杂乱场景,灵巧手也能从容应对!NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一策略
在物流仓库、生产线或家庭场景中,机器人常常需要在大量杂乱摆放的物体中高效地抓取目标。...
2025-04-13 · 浏览41次
扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得

扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得

扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得
扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得...
2025-04-13 · 浏览30次
3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布

3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布

3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布
在大模型迈向推理时代的当下,数学推理能力已成为衡量语言模型智能上限的关键指标。...
2025-04-13 · 浏览31次
传统预训练正走向终结,推理优化与后训练提升有限,大模型今后如何突破发展瓶颈?

传统预训练正走向终结,推理优化与后训练提升有限,大模型今后如何突破发展瓶颈?

传统预训练正走向终结,推理优化与后训练提升有限,大模型今后如何突破发展瓶颈?
高质量数据枯竭,传统预训练走向终点,大模型如何突破瓶颈?...
2025-04-12 · 浏览61次
CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别
在现实世界中,如何让智能体理解并挖掘 3D 场景中可交互的部位(Affordance)对于机器人操作与人机交互至关重要。...
2025-04-11 · 浏览76次
大模型推理无损加速6.5倍!EAGLE-3碾压一切、延续Scaling Law能力

大模型推理无损加速6.5倍!EAGLE-3碾压一切、延续Scaling Law能力

大模型推理无损加速6.5倍!EAGLE-3碾压一切、延续Scaling Law能力
自回归解码已然成为大语言模型的推理标准。...
2025-04-10 · 浏览74次
类R1强化学习迁移到视觉定位!全开源Vision-R1将图文大模型性能提升50%

类R1强化学习迁移到视觉定位!全开源Vision-R1将图文大模型性能提升50%

类R1强化学习迁移到视觉定位!全开源Vision-R1将图文大模型性能提升50%
图文大模型通常采用「预训练 + 监督微调」的两阶段范式进行训练,以强化其指令跟随能力。...
2025-04-09 · 浏览72次
铰链物体的通用世界模型,超越扩散方法,入选CVPR 2025

铰链物体的通用世界模型,超越扩散方法,入选CVPR 2025

铰链物体的通用世界模型,超越扩散方法,入选CVPR 2025
基于当前观察,预测铰链物体的的运动,尤其是 part-level 级别的运动,是实现世界模型的关键一步。...
2025-04-07 · 浏览57次
CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo
本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。...
2025-04-07 · 浏览61次
大语言模型变身软体机器人设计「自然选择器」,GPT、Gemini、Grok争做最佳

大语言模型变身软体机器人设计「自然选择器」,GPT、Gemini、Grok争做最佳

大语言模型变身软体机器人设计「自然选择器」,GPT、Gemini、Grok争做最佳
大型语言模型 (LLM) 在软体机器人设计领域展现出了令人振奋的应用潜力。...
2025-04-06 · 浏览55次
Multi-Token突破注意力机制瓶颈,Meta发明了一种很新的Transformer

Multi-Token突破注意力机制瓶颈,Meta发明了一种很新的Transformer

Multi-Token突破注意力机制瓶颈,Meta发明了一种很新的Transformer
Attention 还在卷自己。...
2025-04-05 · 浏览84次
CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?

CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?

CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?
文生图 or 图生文?不必纠结了!...
2025-04-05 · 浏览118次
自动学会工具解题,RL扩展催化奥数能力激增17%

自动学会工具解题,RL扩展催化奥数能力激增17%

自动学会工具解题,RL扩展催化奥数能力激增17%
在大模型推理能力提升的探索中,工具使用一直是克服语言模型计算局限性的关键路径。...
2025-04-03 · 浏览85次
脑波解码延迟仅80毫秒,实时「意念对话」技术登Nature子刊

脑波解码延迟仅80毫秒,实时「意念对话」技术登Nature子刊

脑波解码延迟仅80毫秒,实时「意念对话」技术登Nature子刊
无法说话的人,现在可以通过大脑扫描的方式实时地用自己的声音说话了。...
2025-04-03 · 浏览78次
一站式解决Deepseek微调三大痛点:数据集、GPU资源、微调手册与源码

一站式解决Deepseek微调三大痛点:数据集、GPU资源、微调手册与源码

一站式解决Deepseek微调三大痛点:数据集、GPU资源、微调手册与源码
一站式解决Deepseek微调三大痛点:数据集、GPU资源、微调手册与源码...
2025-03-31 · 浏览129次
​​3FS系列(二):3FS元数据性能深度拆解:那些在技术文档中找不到的实现细节​

​​3FS系列(二):3FS元数据性能深度拆解:那些在技术文档中找不到的实现细节​

​​3FS系列(二):3FS元数据性能深度拆解:那些在技术文档中找不到的实现细节​
作为一家深耕高性能计算领域的AI科技公司,九章云极对 DeepSeek 开源的 3FS 分布式文件系统始终保持高度关注。在完成前篇所述的 3FS 编译与部署教学后,我们决定对3...
2025-03-31 · 浏览119次
第一页 · 上一页 · 下一页 · 当前第1页