450美元训练一个「o1-preview」?UC伯克利开源32B推理模型Sky-T1,AI社区沸腾了
450 美元的价格,乍一听起来不算「小数目」。但如果,这是一个 32B 推理模型的全部训练成本呢?...
2025-01-13
·
浏览337次
微软 rStar-Math 技术登场:小语言 AI 模型数学推理从“不及格”一跃成为“优等生”
微软亚洲研究院旗下数学和人工智能研究团队昨日(1 月 10 日)发布博文,针对小语言模型,设计并开发了 rStar-Math 技术,专门用于解决数学问题。...
2025-01-12
·
浏览364次
LLM 带来了「编程末日」?哥本哈根大学计算机教授称“永远不会”
LLM 会把编程淘汰吗?近日,哥本哈根大学的计算机教授,通过分析计算理论中的定理所施加的基本限制,得出结论:距离编程的终结还远得很。...
2025-01-12
·
浏览339次
“废片”也值钱:谷歌、OpenAI 被曝购买创作者未发布视频素材,以训练 AI 模型
OpenAI、谷歌、AI 媒体公司 Moonvalley 等正在向数百名内容创作者支付费用,以获取他们未发布的视频素材。由于这些素材没有在网上公开发布,因此它们对训练人工智能算...
2025-01-12
·
浏览473次
Meta 遭遇版权诉讼,扎克伯格被指亲自批准 AI 团队用盗版书训练模型
在一起针对 Meta 的版权诉讼中,原告律师表示,Meta CEO 马克·扎克伯格批准了公司 Llama AI 模型开发团队使用盗版电子书和文章的数据集来进行训练。...
2025-01-12
·
浏览485次
外国工程师开发 ChatGPT 驱动的炮塔可“指哪打哪”,OpenAI 火速封号
OpenAI 在向Futurism提供的声明中表示,公司已经关闭了该开发者的账号。OpenAI方面还表示:“我们主动发现了这一违规行为,并在收到你们的询问之前,已通知开发者停止...
2025-01-12
·
浏览346次
谷歌宣布将 AI Studio 团队整体转移至 DeepMind 旗下,整合人工智能部门项目提升效率
谷歌目前正在加速整合其 AI 部门,参考谷歌 AI Studio 主管 Logan Kilpatrick 领英页,其透露谷歌已将其 AI Studio 团队整体转移到 Deep...
2025-01-12
·
浏览479次
麻省理工Nature子刊:AI加速量子化学计算,精度媲美「金标准」,计算效率提升百万倍!
最近,麻省理工学院的研究团队开发出一种创新的多任务学习方法,成功将机器学习与量子化学计算相结合,实现了接近CCSD(T)精度的分子电子结构预测。...
2025-01-12
·
浏览487次
如何高效桥接视觉和语言,字节&中大提出全新多模态大模型连接器ParGo
在多模态大语言模型(MLLMs)的发展中,视觉 - 语言连接器作为将视觉特征映射到 LLM 语言空间的关键组件,起到了桥梁作用。...
2025-01-12
·
浏览360次
迈向System 2推理,100页论文硬核讲述Meta-CoT
Meta-CoT 通过显式建模生成特定思维链(CoT)所需的底层推理过程,扩展了传统的思维链方法。...
2025-01-12
·
浏览355次
个人跑大模型,英伟达「皮衣刀客」新出的Project DIGITS与M4 Mac Mini到底哪个好?
前些天,英伟达发布了一大堆东西,其中包括一款 AI 超级计算机 Project DIGITS,机器之心也在第一时间进行了报道,参阅《RTX5090 震撼发布,国行 16499 ...
2025-01-11
·
浏览656次
一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory
大模型长序列的处理能力已越来越重要,像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式,需要处理的输入 + 输出总 toke...
2025-01-11
·
浏览297次
AI 中文社