“新神登场”,消息称 DeepSeek R2 模型有望 5 月前发布
据路透社报道,三位知情人士透露,DeepSeek 正在加速推出其 R2 人工智能模型,该公司最初计划在五月推出,但目前正在努力尽快推出。...
2025-02-25
·
浏览291次
波士顿动力创始人自曝已购买宇树机器人,并称 DeepSeek 创新“只是开始”
“我们的实验室买了宇树的人形机器人,还买了几个小型的机器人,它们相对便宜。即便我们是竞争对手,我们也可以买来看看它究竟能做些什么。”...
2025-02-25
·
浏览328次
OpenAI 出新招:ChatGPT 变身苹果 Safari 浏览器默认搜索引擎
此次更新,OpenAI 将 ChatGPT 的功能延伸至 Safari 浏览器,为用户提供了一种全新的搜索体验。通过简单的设置,用户即可将 ChatGPT 作为默认搜索引擎,享...
2025-02-25
·
浏览217次
AI 模型 Claude 3.7 Sonnet 刚发布,消息称 Anthropic 新一轮融资增至 35 亿美元
据《华尔街日报》报道,人工智能公司 Anthropic 正在敲定一轮 35 亿美元(IT之家备注:当前约 253.83 亿元人民币)的融资,公司估值达到 615 亿美元。最初,...
2025-02-25
·
浏览322次
教育科技公司 Chegg 起诉谷歌,称 AI 搜索摘要损害其流量与收入
教育科技公司 Chegg 近日在美国哥伦比亚特区联邦地区法院对谷歌提起诉讼,声称谷歌的 AI 搜索结果摘要对其流量和收入造成了负面影响。Chegg 指控谷歌存在不公平竞争行为,...
2025-02-25
·
浏览272次
何小鹏:小鹏有信心成为中国最早量产 L3 机器人的公司之一
他表示,小鹏的世界模型、强化学习和蒸馏能力都会全面部署上车,这一套技术架构将会复用到人形机器人上。因此,人形机器人能够和智驾在同源的架构里,学到更多的能力并且获得更多的数据,以...
2025-02-25
·
浏览342次
双擎升级!商汤大装置DeepSeek企业版上线+免费版扩容
商汤大装置万象平台正式上线了DeepSeek-R1、DeepSeek-V3等模型,并为免费版提供3个月内千万Token额度,受到客户的热烈响应。...
2025-02-25
·
浏览221次
DeepSeek开源FlashMLA:Hopper GPU解码新标杆,测评大揭秘!
DeepSeek今天正式启动为期五天的开源成果发布计划,首个亮相的项目是FlashMLA。这一开源项目将先进的MLA算法与GPU优化技术相结合,为大模型推理提供了一套高性能、低...
2025-02-25
·
浏览452次
全球首个混合推理模型:Claude 3.7 Sonnet来袭,真实编码力压一切对手
就在昨晚,Anthropic 要发新模型的消息开始在 AI 社区广泛发酵,不过并不是期待中的 Claude 4.0,而是 3.7 Sonnet 版本。...
2025-02-25
·
浏览443次
刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!
上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。...
2025-02-25
·
浏览251次
刚刚,DeepSeek开源DeepEP通信库,千亿MoE训推颠覆级创新!FP8狂飙,带飞GPU
刚刚,DeepSeek开源DeepEP通信库,千亿MoE训推颠覆级创新!FP8狂飙,带飞GPU...
2025-02-25
·
浏览409次
征稿|CVPR2025首届ViSCALE研讨会,探寻计算机视觉的推理扩展律
计算机视觉与模式识别会议(CVPR)作为全球计算机视觉与人工智能领域最具影响力的顶级学术会议,将于 2025 年 6 月 11 日至 15 日在美国田纳西州召开。...
2025-02-25
·
浏览203次
刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中
上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。...
2025-02-25
·
浏览214次
扩散模型新突破!无需微调,就能高效稳定移除目标物体
最近,扩散模型在生成模型领域异军突起,凭借其独特的生成机制在图像生成方面大放异彩,尤其在处理高维复杂数据时优势明显。...
2025-02-25
·
浏览378次
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
自 OpenAI 发布 o1-mini 模型以来,推理模型就一直是 AI 社区的热门话题,而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未...
2025-02-25
·
浏览491次
速度提高40w倍,牛津新的ML策略计算蛋白的自由能扰动,助力药物发现
牛津大学的研究团队首先提出了一种新的基于注意力的图神经网络模型 AEV-PLIG(原子环境向量-蛋白质配体相互作用图),以解决这些问题。其次,他们提出了一种新的、更真实的分布外...
2025-02-25
·
浏览217次
官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug
官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug...
2025-02-25
·
浏览214次
刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1
刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1...
2025-02-25
·
浏览322次
8分钟,Grok 3破解美国本科生最难数赛题!马斯克要用100万GPU反超「星际之门」?
8分钟,Grok 3破解美国本科生最难数赛题!马斯克要用100万GPU反超「星际之门」?...
2025-02-24
·
浏览251次
南大钱超团队攻克百亿晶体管难题,斩获EDA顶会2025最佳论文!AI学院本硕博生联手
南大钱超团队攻克百亿晶体管难题,斩获EDA顶会2025最佳论文!AI学院本硕博生联手...
2025-02-24
·
浏览203次
AI 中文社