AI 中文社区

推理模型其实无需「思考」？伯克利发现有时跳过思考过程会更快、更准确

当 DeepSeek-R1、OpenAI o1 这样的大型推理模型还在通过增加推理时的计算量提升性能时，加州大学伯克利分校与艾伦人工智能研究所突然扔出了一颗深水炸弹：别再卷 token 了，无需显式思维链，推理模型也能实现高效且准确的推理。...

2025-04-20 · 浏览601次

264页智能体综述来了！MetaGPT等20家顶尖机构、47位学者参与

近期，大模型智能体（Agent）的相关话题爆火 —— 不论是 Anthropic 抢先 MCP 范式的快速普及，还是 OpenAI 推出的 Agents SDK 以及谷歌最新发布的 A2A 协议，都预示了 AI Agent 的巨大潜力。...

2025-04-20 · 浏览805次

评估AlphaFold3的综合基准？澳门理工姚小军、浙大侯廷军团队开发PepPCBench

研究人员表示，PepPCBench 有望为增强蛋白质-肽复合物结构预测和肽类药物研发提供重要见解。...

2025-04-18 · 浏览549次

AI应用创业公司：大模型最近的突破，全是作弊

Llama 4 或许只是冰山一角。...

2025-04-18 · 浏览505次

Jeff Dean演讲回顾LLM发展史，Transformer、蒸馏、MoE、思维链等技术都来自谷歌

在这场演讲中，Jeff Dean 首先以谷歌多年来的重要研究成果为脉络，展现了 AI 近十五年来的发展轨迹，之后又分享了 Gemini 系列模型的发展历史，最后展望了 AI 将...

2025-04-18 · 浏览482次

AI强化的人性化多模态视觉辅助系统，上交大开发智能便捷的穿戴设备，登Nature

这项系统可以部分取代眼睛，尽管目前的实验尚且停留在原型机阶段。...

2025-04-17 · 浏览457次

给大卫贝克的Foldit加DLC，用游戏进行人人可参与的药物分子设计

这是一款可以全民参与的非营利性蛋白质设计游戏。...

2025-04-16 · 浏览473次

迈向推理时代：900+篇参考文献揭示长链思维的前世今生，最全综述来了

近年来，大模型（Large Language Models, LLMs）在数学、编程等复杂任务上取得突破，OpenAI-o1、DeepSeek-R1 等推理大模型（Reason...

2025-04-16 · 浏览741次

智能体版《苦涩的教训》，图灵奖得主Sutton、谷歌RL大佬Silver新作：超人智能靠经验

人类生成的数据推动了人工智能的惊人进步，但接下来会怎样呢？...

2025-04-16 · 浏览593次

聚焦人工智能-生物-工程交叉融合，一文综述即将到来的「技术创变」浪潮

当前，人工智能、机器学习、量子计算、纳米工程、CRISPR 基因编辑等未来塑造型技术正在崛起。...

2025-04-15 · 浏览748次

30年悬案告破，平均曲率流的奇点真相曝光，揭晓「冰块融化」的数学秘密

一块冰块漂浮在水中，随着时间推移，它会逐渐融化成一个微小的冰粒，最终完全消失。...

2025-04-15 · 浏览550次

更长思维并不等于更强推理性能，强化学习可以很简洁

今天早些时候，著名研究者和技术作家 Sebastian Raschka 发布了一条推文，解读了一篇来自 Wand AI 的强化学习研究，其中分析了推理模型生成较长响应的原因。...

2025-04-15 · 浏览488次

强化学习带来的改进只是「噪音」？最新研究预警：冷静看待推理模型的进展

「推理」已成为语言模型的下一个主要前沿领域，近期学术界和工业界都取得了突飞猛进的进展。...

2025-04-14 · 浏览442次

Science子刊 | 基于公平贝叶斯扰动，首个面向医学图像生成公平性的方法FairDiffusion来了

来自哈佛大学和纽约大学等机构的研究者首次探讨了医学影像生成中的公平性问题。...

2025-04-13 · 浏览506次

苹果发现原生多模态模型Scaling Laws：早融合优于后融合，MoE优于密集模型

让大模型进入多模态模式，从而能够有效感知世界，是最近 AI 领域里人们一直的探索目标。...

2025-04-12 · 浏览500次

200B参数击败满血DeepSeek-R1，字节豆包推理模型Seed-Thinking-v1.5要来了

字节跳动豆包团队今天发布了自家新推理模型 Seed-Thinking-v1.5 的技术报告。...

2025-04-12 · 浏览594次

科学家用GNN进行不确定性量化，实现高效的分子设计，登Nature子刊

测试结果表明，使用 Tartarus 和 GuacaMol 平台的基准，通过概率改进优化 (PIO) 进行 UQ 集成，在大多数情况下可以提高优化成功率，支持更可靠地探索化学多...

2025-04-10 · 浏览552次

Nature子刊，字节跳动开发MD模拟预测框架，助力锂电池液体电解质研究

字节跳动团队的研究人员提出了 ByteDance AI Molecular Simulation Booster (BAMBOO)，这是一种用于分子动力学（MD）模拟的预测框架...

2025-04-09 · 浏览458次

用于科研的AI：Nature教你如何选择正确地选择工具

Nature 期刊为此探讨了如今学者与学生们如何利用 AI 进行实验的简化。...

2025-04-09 · 浏览719次

反向传播、前向传播都不要，这种无梯度学习方法是Hinton想要的吗？

Noprop：没有反向传播或前向传播，也能训练神经网络。...

2025-04-08 · 浏览496次

思维链不可靠：Anthropic曝出大模型「诚信」问题，说一套做一套

AI 可能「借鉴」了什么参考内容，但压根不提。...

2025-04-05 · 浏览508次

刚刚，DeepSeek公布推理时Scaling新论文，R2要来了？

一种全新的学习方法。...

2025-04-05 · 浏览542次

三思而后行，让大模型推理更强的秘密是「THINK TWICE」？

近年来，大语言模型（LLM）的性能提升逐渐从训练时规模扩展转向推理阶段的优化，这一趋势催生了「测试时扩展（test-time scaling）」的研究热潮。...

2025-04-05 · 浏览562次

53%性能全面提升，Ayu新模型横扫传统工具，分泌蛋白预测效率再翻倍

该模型实际应用于海洋样本（Tara Oceans 数据集）时，相比于最广泛使用的鉴定分泌蛋白的方法，全新的方法能够回收两倍以上的蛋白质。...

2025-04-04 · 浏览466次