Python 标签,匹配到约207个结果, 耗时0.0232秒



OpenAI 推出轻量版 Deep Research AI 搜索功能,基于 o4-mini 打造

OpenAI 发文,宣布面向付费及免费用户推出基于 OpenAI o4-mini 模型的“轻量版”Deep Research AI 搜索功能。...
2025-04-26
·
浏览56次

Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用

Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用...
2025-04-22
·
浏览69次

选 AI 比选对象还难!“起名黑洞”OpenAI 的新模型,到底怎么选?

即便是 AI 圈的资深团队,在面对同时发布的 o3、o4-mini、GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 时,也是蒙圈的。...
2025-04-21
·
浏览105次

特斯拉机器人史上最大规模招聘:三年打造 50 万台规模,不仅送进厂还要送“上天”

公司招聘主页上,与机器人擎天柱(Optimus)相关的岗位数达到约 80 个,比以往任何时候都多。...
2025-04-21
·
浏览58次



Jeff Dean演讲回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术都来自谷歌

在这场演讲中,Jeff Dean 首先以谷歌多年来的重要研究成果为脉络,展现了 AI 近十五年来的发展轨迹,之后又分享了 Gemini 系列模型的发展历史,最后展望了 AI 将...
2025-04-18
·
浏览52次

谷歌首款混合推理Gemini 2.5登场,成本暴降600%!思考模式一开,直追o4-mini

谷歌首款混合推理Gemini 2.5登场,成本暴降600%!思考模式一开,直追o4-mini...
2025-04-18
·
浏览49次

从思考到行动:大模型自主工具调用能力的深度实现

GPT - 4o、Deepseek - R1 等高级模型已展现出令人惊叹的「深度思考」能力:理解上下文关联、拆解多步骤问题、甚至通过思维链(Chain - of - Thoug...
2025-04-17
·
浏览68次

刚刚,OpenAI发布最强推理模型o3!图像深度思考首秀,开源编程智能体已揽5k+star

深夜,OpenAI 发布了 o 系列模型的最新成果 o3 和 o4-mini。...
2025-04-17
·
浏览68次


OpenAI 最强推理模型、能够“思考”图片,o3 和 o4-mini 正式发布

OpenAI 官方介绍称,这是其在 o 系列模型中最新训练的成果,可以在回答前进行更长时间的思考,也宣称是“迄今为止 OpenAI 发布的最智能的模型”,代表了 ChatGPT...
2025-04-17
·
浏览103次

OpenAI震撼发布o3/o4-mini,直逼视觉推理巅峰!首用图像思考,十倍算力爆表

OpenAI震撼发布o3/o4-mini,直逼视觉推理巅峰!首用图像思考,十倍算力爆表...
2025-04-17
·
浏览62次


何恺明ResNet登顶,Transformer加冕!Nature独家揭秘25篇高被引论文

何恺明ResNet登顶,Transformer加冕!Nature独家揭秘25篇高被引论文...
2025-04-16
·
浏览84次

xAI 推出 Grok Studio 功能:可 AI 编辑创建文档、代码、报告等

Grok 官方账号今天(4 月 16 日)发布推文,宣布新增 Grok Studio 功能,类似 OpenAI 的 Canvas 工具,支持用户编辑和创建文档及基础应用程序。...
2025-04-16
·
浏览74次


微软研究:AI 编程助手软件调试能力堪忧

微软最新研究表明,包括Claude 3.7 Sonnet和OpenAI o3-mini在内的多款AI模型在软件调试任务中表现不佳,最高成功率不足50%。研究指出,缺乏足够的调试...
2025-04-14
·
浏览53次

强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展

「推理」已成为语言模型的下一个主要前沿领域,近期学术界和工业界都取得了突飞猛进的进展。...
2025-04-14
·
浏览23次

3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布

在大模型迈向推理时代的当下,数学推理能力已成为衡量语言模型智能上限的关键指标。...
2025-04-13
·
浏览30次

大模型“自动修 bug”能力将提升,豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

豆包大模型团队今日通过官方公众号宣布,首个多语言类 SWE 数据集 Multi-SWE-bench 现已正式开源,可用于评估和提升大模型“自动修 Bug”能力。...
2025-04-11
·
浏览73次
