比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架
近年来,大型语言模型(LLMs)的进展彻底改变了自然语言处理领域,并因此成为各种现实应用中的核心技术,例如代码助手、搜索引擎和个人 AI 助手。...
2025-02-17 · 浏览282次
真正的王炸组合!微信终于接入满血版DeepSeek R1,灰度测试中

真正的王炸组合!微信终于接入满血版DeepSeek R1,灰度测试中

真正的王炸组合!微信终于接入满血版DeepSeek R1,灰度测试中
一觉醒来,AI 应用的天变了!...
2025-02-17 · 浏览498次
Meta AI 版权案揭露:与出版商谈判遇阻,暂停授权合作

Meta AI 版权案揭露:与出版商谈判遇阻,暂停授权合作

Meta AI 版权案揭露:与出版商谈判遇阻,暂停授权合作
在 Meta Platforms(前身为 Facebook 母公司)面临的多起 AI 版权诉讼中,最新提交的法庭文件为该公司曾暂停与出版商就 AI 训练数据授权事宜进行谈判的传...
2025-02-16 · 浏览284次
马斯克称 Grok 3 将于 2 月 18 日发布:地球上最聪明的人工智能

马斯克称 Grok 3 将于 2 月 18 日发布:地球上最聪明的人工智能

马斯克称 Grok 3 将于 2 月 18 日发布:地球上最聪明的人工智能
马斯克在社交平台 X 上表示,Grok 3 大模型将于太平洋时间周一晚上 8 点(IT之家注:北京时间 2 月 17 日 12 点)发布,届时将进行现场演示,马斯克称其为地球上...
2025-02-16 · 浏览380次
深夜炸醒!微信与 DeepSeek 新合体是啥体验

深夜炸醒!微信与 DeepSeek 新合体是啥体验

深夜炸醒!微信与 DeepSeek 新合体是啥体验
接入 DeepSeek 这股风潮终究吹到了微信,两者强强联合。...
2025-02-16 · 浏览385次
本科生推翻姚期智40年前猜想!CS顶会论文刷新哈希表传统认知

本科生推翻姚期智40年前猜想!CS顶会论文刷新哈希表传统认知

本科生推翻姚期智40年前猜想!CS顶会论文刷新哈希表传统认知
本科生推翻姚期智40年前猜想!CS顶会论文刷新哈希表传统认知...
2025-02-16 · 浏览303次
新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战

新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战

新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战
新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战...
2025-02-16 · 浏览475次
Nature:全球博士生数量锐减,钱少、事多、前途迷茫

Nature:全球博士生数量锐减,钱少、事多、前途迷茫

Nature:全球博士生数量锐减,钱少、事多、前途迷茫
Nature:全球博士生数量锐减,钱少、事多、前途迷茫...
2025-02-16 · 浏览406次
刚刚,DeepSeek官方发布R1模型推荐设置,这才是正确用法

刚刚,DeepSeek官方发布R1模型推荐设置,这才是正确用法

刚刚,DeepSeek官方发布R1模型推荐设置,这才是正确用法
自春节以来,DeepSeek 就一直是 AI 领域最热门的关键词,甚至可能没有之一,其官方 App 成为了史上最快突破 3000 万日活的应用。...
2025-02-16 · 浏览550次
又一个Deep Research来了!1-2分钟抵人类专家数小时,所有人免费

又一个Deep Research来了!1-2分钟抵人类专家数小时,所有人免费

又一个Deep Research来了!1-2分钟抵人类专家数小时,所有人免费
Deep Research 又迎来一位新玩家。...
2025-02-16 · 浏览760次
大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠

大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠

大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠
问题挺严重,大模型说的话可不能全信。...
2025-02-16 · 浏览311次
英特尔发布 OpenVINO 2025.0:新增图像生成场景与 DeepSeek 蒸馏模型支持

英特尔发布 OpenVINO 2025.0:新增图像生成场景与 DeepSeek 蒸馏模型支持

英特尔发布 OpenVINO 2025.0:新增图像生成场景与 DeepSeek 蒸馏模型支持
2025 年首个 OpenVINO 版本(2025.0)于 14 日正式发布,本次更新聚焦性能提升、更多生成式 AI 模型的支持,并针对英特尔神经处理单元(NPU)推出关键优化...
2025-02-16 · 浏览463次
全球 AI 算力报告出炉:LLM 最爱 A100,谷歌坐拥超 100 万 H100 等效算力

全球 AI 算力报告出炉:LLM 最爱 A100,谷歌坐拥超 100 万 H100 等效算力

全球 AI 算力报告出炉:LLM 最爱 A100,谷歌坐拥超 100 万 H100 等效算力
全球有多少 AI 算力?算力增长速度有多快?在这场 AI「淘金热」中,都有哪些新「铲子」?AI 初创企业 Epoch AI 发布了最新全球硬件估算报告。...
2025-02-16 · 浏览531次
比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核

比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核

比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核
比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核...
2025-02-15 · 浏览313次
服务器总是繁忙 DeepSeek-R1本地部署图文版教程来了

服务器总是繁忙 DeepSeek-R1本地部署图文版教程来了

服务器总是繁忙 DeepSeek-R1本地部署图文版教程来了
最近一段时间,国产大模型DeepSeek-R1在市场上迅速崛起,成为了众多用户的新宠。然而,伴随其热度与用户量的急剧攀升,由此导致服务器繁忙的状况频繁出现。 为了摆脱服务器繁忙...
2025-02-14 · 浏览351次
阿里巴巴蔡崇信:AI 竞争很激烈,DeepSeek 转变行业思路

阿里巴巴蔡崇信:AI 竞争很激烈,DeepSeek 转变行业思路

阿里巴巴蔡崇信:AI 竞争很激烈,DeepSeek 转变行业思路
在蔡崇信看来,DeepSeek 对于行业意义重大,因为它通过工程创新大幅降低了大语言模型的训练和推理成本。他指出,很多问题需要借助人工智能来解决,这样人工智能才能发挥作用、提高...
2025-02-14 · 浏览457次
Anthropic 秘密“混合模型”Claude 4 首曝细节,硬刚 GPT-5

Anthropic 秘密“混合模型”Claude 4 首曝细节,硬刚 GPT-5

Anthropic 秘密“混合模型”Claude 4 首曝细节,硬刚 GPT-5
AI 竞赛白热化!Anthropic 秘密研发一种与众不同的 AI—— 语言模型与可控推理能力相结合的混合模型。模型包括一个独特的「滑动条」功能,它赋予开发者对计算资源和成本前...
2025-02-14 · 浏览483次
美国 AI 营销龙头 AppLovin 股价飙升 36.45% 创历史新高,Q4 业绩超预期

美国 AI 营销龙头 AppLovin 股价飙升 36.45% 创历史新高,Q4 业绩超预期

美国 AI 营销龙头 AppLovin 股价飙升 36.45% 创历史新高,Q4 业绩超预期
该公司公布了超出预期的第四季度收益,许多分析师上调了他们的股价目标,AppLovin 股价也首次突破 500 美元大关。...
2025-02-14 · 浏览406次
达摩院开源 VideoLLaMA3:仅 7B 大小,视频理解拿下 SOTA

达摩院开源 VideoLLaMA3:仅 7B 大小,视频理解拿下 SOTA

达摩院开源 VideoLLaMA3:仅 7B 大小,视频理解拿下 SOTA
它就是由达摩院出品的 Video LLaMA 3,以图像为中心构建的新一代多模态视频-语言模型。...
2025-02-14 · 浏览465次
欧盟拟削减科技法规条文,以促进 AI 领域投资

欧盟拟削减科技法规条文,以促进 AI 领域投资

欧盟拟削减科技法规条文,以促进 AI 领域投资
维尔库宁在接受《金融时报》采访时表示,欧盟希望在实施人工智能相关法规时能够“帮助和支持”公司,特别是在提升竞争力的同时,确保不会错失这一技术的机会。...
2025-02-14 · 浏览410次
令人惊讶的发现,谷歌混合数模量子计算机揭示了磁性的新面貌

令人惊讶的发现,谷歌混合数模量子计算机揭示了磁性的新面貌

令人惊讶的发现,谷歌混合数模量子计算机揭示了磁性的新面貌
现在,Google 的一种新型量子模拟器发现磁性并不总是像科学家想象的那样发挥作用,这表明它有望在未来带来更多的发现。...
2025-02-14 · 浏览323次
苹果也在蒸馏大模型,给出了蒸馏Scaling Laws

苹果也在蒸馏大模型,给出了蒸馏Scaling Laws

苹果也在蒸馏大模型,给出了蒸馏Scaling Laws
蒸馏模型的性能可以量化估算了。...
2025-02-14 · 浏览304次
不要学编程!大佬警告别报AI专业,全美15万IT精英被裁员,CS毕业即失业

不要学编程!大佬警告别报AI专业,全美15万IT精英被裁员,CS毕业即失业

不要学编程!大佬警告别报AI专业,全美15万IT精英被裁员,CS毕业即失业
不要学编程!大佬警告别报AI专业,全美15万IT精英被裁员,CS毕业即失业...
2025-02-14 · 浏览434次
Anthropic秘密「混合模型」 Claude 4首曝细节,硬刚GPT-5!深度推理模型来了

Anthropic秘密「混合模型」 Claude 4首曝细节,硬刚GPT-5!深度推理模型来了

Anthropic秘密「混合模型」 Claude 4首曝细节,硬刚GPT-5!深度推理模型来了
Anthropic秘密「混合模型」 Claude 4首曝细节,硬刚GPT-5!深度推理模型来了...
2025-02-14 · 浏览345次
第一页 · 上一页 · 下一页 · 当前第235页