15B硬刚GPT-4o,CMU祭出LCPO提示可控思考!每token性能较S1暴涨2倍
15B硬刚GPT-4o,CMU祭出LCPO提示可控思考!每token性能较S1暴涨2倍...
2025-03-09
·
浏览276次
10²⁶参数,AGI还需70年!清华人大预测届时GPU总价达4000万倍苹果市值
10²⁶参数,AGI还需70年!清华人大预测届时GPU总价达4000万倍苹果市值...
2025-03-09
·
浏览331次
准博士生把导师履历论文输入ChatGPT,制成「AI评委」!顺利通过资格考试
准博士生把导师履历论文输入ChatGPT,制成「AI评委」!顺利通过资格考试...
2025-03-09
·
浏览251次
Ilya错了?Scaling另有他用,ViT大佬力挺谷歌1000亿数据新发现
Ilya错了?Scaling另有他用,ViT大佬力挺谷歌1000亿数据新发现...
2025-03-09
·
浏览309次
精度效率双冠王!时序预测新范式TimeDistill:跨架构知识蒸馏,全面超越SOTA
精度效率双冠王!时序预测新范式TimeDistill:跨架构知识蒸馏,全面超越SOTA...
2025-03-09
·
浏览207次
马斯克「大闹白宫」!美政府12000人将被GSAi优化,xAI 100万块GPU巨兽年底建成
马斯克「大闹白宫」!美政府12000人将被GSAi优化,xAI 100万块GPU巨兽年底建成...
2025-03-09
·
浏览296次
Nature封面:探索真菌网络,用机器人进行高通量延时成像研究
为了监测 AM 网络的构建过程,来自荷兰阿姆斯特丹 AMOLF 研究所等机构的研究者设计了一款定制机器人,用于高通量延时成像,能够同时追踪超过 50 万个真菌节点。研究登上《N...
2025-03-09
·
浏览275次
纳米世界的实时电影,科学家首次使用AI以毫秒级分辨率观察原子移动,登Science
实现了在温和电子束剂量下对气体环境中金属纳米颗粒表面进行毫秒级时间分辨率的原子尺度观察。...
2025-03-09
·
浏览210次
ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割
当人形机器人能够辨识身边的一切,VR/AR 设备呈现出定制化的虚拟世界,自动驾驶汽车实时捕捉路面状况,这一切都依赖于对 3D 场景的精确理解。...
2025-03-09
·
浏览270次
7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!
随着 DeepSeek-R1 的流行与 AI4Math 研究的深入,大模型在辅助形式化证明写作方面的需求日益增长。...
2025-03-09
·
浏览237次
让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek
让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek...
2025-03-09
·
浏览255次
DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布
DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布...
2025-03-08
·
浏览155次
英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025
英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025...
2025-03-08
·
浏览298次
狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投
狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投...
2025-03-08
·
浏览151次
DeepSeek的MLA,任意大模型都能轻松迁移了
DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。...
2025-03-07
·
浏览370次
FP8训练新范式:减少40%显存占用,训练速度提高1.4倍
近期DeepSeek V3 引爆国内外的社交媒体,他们在训练中成功应用了 FP8 精度,显著降低了 GPU 内存使用和计算开销。...
2025-03-07
·
浏览408次
消息称 Meta 的 Llama 4 模型将聚焦语音交互,全力开拓 AI 商业版图
据英国金融时报报道,社交媒体巨头 Meta 正在加速其人工智能的语音功能开发,计划在未来几周内推出其最新开源大语言模型 Llama 4,并将语音交互作为核心功能之一。据知情人士...
2025-03-07
·
浏览386次
消息称微软正开发内部 AI 推理模型,并测试 xAI、DeepSeek 等多种 OpenAI 替代方案
外媒The Information 今晚发布消息称,微软正在开发内部人工智能推理模型,以与OpenAI竞争,并可能向开发者出售。...
2025-03-07
·
浏览305次
AI 中文社