8分钟,Grok 3破解美国本科生最难数赛题!马斯克要用100万GPU反超「星际之门」?
8分钟,Grok 3破解美国本科生最难数赛题!马斯克要用100万GPU反超「星际之门」?...
2025-02-24
·
浏览311次
南大钱超团队攻克百亿晶体管难题,斩获EDA顶会2025最佳论文!AI学院本硕博生联手
南大钱超团队攻克百亿晶体管难题,斩获EDA顶会2025最佳论文!AI学院本硕博生联手...
2025-02-24
·
浏览235次
DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈
DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈...
2025-02-24
·
浏览446次
3倍提速!现在你跑不过机器狗了,限制波士顿动力机器狗的竟然是电池功率?
当 Scaling Law 在触顶边界徘徊之时,强化学习为构建更强大的大模型开辟出了一条新范式。...
2025-02-24
·
浏览275次
DeepSeek-R1 成 Hugging Face 最受欢迎大模型,力压近 150 万个“对手”
Clement Delangue今日凌晨发文宣布:DeepSeek-R1在Hugging Face上获得了超过10000个赞,成为该平台近150万个模型之中最受欢迎的大模型,“...
2025-02-24
·
浏览427次
谷歌 AI 视频生成模型 Veo 2 使用费用公布:每分钟 30 美元
谷歌近期在其定价页面上低调公布了新一代 AI 视频生成模型 Veo 2 的使用费用。该模型于去年 12 月首次亮相,旨在通过人工智能技术快速生成高质量的视频内容。根据官方信息,...
2025-02-24
·
浏览539次
超 20 家央企接入 DeepSeek,涉及能源、通信、汽车等领域
据经济参考报报道,近来,国资央企“牵手”DeepSeek 已成为一股新风潮。据不完全统计,目前有超 20 家央企接入 DeepSeek,涉及能源、通信、汽车、金融、建筑等多个领...
2025-02-24
·
浏览290次
OpenAI 最新研究:当前 AI 模型仍无法媲美人类程序员
尽管 OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)坚称,到今年年底,人工智能模型将能够超越“低级别”软件工程师,但该公司研究人员的最新研究却表明,即使是目前最...
2025-02-24
·
浏览346次
DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA
DeepSeek今日启动“开源周”,首个开源的代码库为FlashMLA——针对 Hopper GPU 优化的高效 MLA 解码内核,支持可变长度序列。...
2025-02-24
·
浏览416次
Grok 3冲击诺奖级突破,成证明「黎曼猜想」关键!AI与数学家打出终极组合拳
Grok 3冲击诺奖级突破,成证明「黎曼猜想」关键!AI与数学家打出终极组合拳...
2025-02-23
·
浏览333次
孙正义患DeepSeek焦虑症?首谈5000亿星际之门,每年算力暴增1000倍
孙正义患DeepSeek焦虑症?首谈5000亿星际之门,每年算力暴增1000倍...
2025-02-23
·
浏览365次
一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA
在大语言模型领域中,预训练 + 微调范式已经成为了部署各类下游应用的重要基础。...
2025-02-23
·
浏览376次
YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世
YOLO 系列模型的结构创新一直围绕 CNN 展开,而让 transformer 具有统治优势的 attention 机制一直不是 YOLO 系列网络结构改进的重点。...
2025-02-23
·
浏览478次
谷歌 AI 掌门人 Jeff Dean 对话 Transformer 作者:AI 提速 300%,1000 万倍工程师要来了
Jeff Dean,谷歌的首席科学家,和 Transformer 的作者 Noam Shazeer,最近在一场深度访谈中,不仅回顾了 AI 发展的关键时刻,还大胆预测了未来的方...
2025-02-23
·
浏览251次
OpenAI 员工公开指责 xAI:Grok 3 基准测试结果具有误导性
本周,OpenAI 的一名员工公开指责埃隆・马斯克旗下的 xAI 公司,称其发布的最新 AI 模型 Grok 3 的基准测试结果具有误导性。对此,xAI 的联合创始人伊戈尔・巴...
2025-02-23
·
浏览374次
消息称美国 AI 安全研究所大裁员,专家警告将削弱关键研究能力
据 Axios 报道,美国国家标准与技术研究院(NIST)可能将裁减多达 500 名员工,其中美国人工智能安全研究所(AISI)和“美国芯片计划”(Chips for Amer...
2025-02-23
·
浏览203次
10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文实锤涌现
10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文实锤涌现...
2025-02-22
·
浏览308次
英伟达 CEO 黄仁勋首次公开回应 DeepSeek:投资者误解,AI 发展仍需强大算力
在周四的一场线上活动中,英伟达公司首席执行官黄仁勋(Jensen Huang)表示,投资者对 DeepSeek 在人工智能领域取得的进展存在误解,这导致了市场对英伟达股票的错误...
2025-02-21
·
浏览452次
AI 中文社