Claude 标签,匹配到约402个结果, 耗时0.0173秒




“AI 编程”之争:Anthropic 因版权纠纷受批评,OpenAI 意外赢得用户好感

Claude Code 和 Codex CLI 都是让开发者能够利用云端的 AI 模型来完成各种编程任务的工具,功能相似。两家公司几乎在同一时期发布了这两款工具,争夺开发者的关注。...
2025-04-27
·
浏览50次

谷歌 DeepMind 推 QuestBench 基准,评估 AI 模型的推理“补漏”能力

谷歌 DeepMind 团队推出 QuestBench 新基准,通过约束满足问题(CSPs)框架,评估模型在推理任务中识别和获取缺失信息的能力。...
2025-04-26
·
浏览46次

美国政府「AI行动计划」万言书发布! OpenAI与Anthropic呼吁联手封锁中国AI

美国政府「AI行动计划」万言书发布! OpenAI与Anthropic呼吁联手封锁中国AI...
2025-04-26
·
浏览68次

AI 会有意识吗?Anthropic 启动新项目,探索寻求答案

如果 AI 萌生出意识,那该怎么办?Anthropic 的研究人员为探究这个前沿问题,推出“模型福利”(model welfare)研究计划。...
2025-04-25
·
浏览50次

Anthropic CEO豪言LLM黑箱5年内必破!研究员爆料:AI有意识概率已达15%

Anthropic CEO豪言LLM黑箱5年内必破!研究员爆料:AI有意识概率已达15%...
2025-04-25
·
浏览52次


Anthropic 示警:Claude 等 AI 被滥用,引导舆论威胁公众认知

Anthropic 昨日(4 月 23 日)发布博文,报告称 Claude 等前沿 AI 模型正被恶意行为者滥用,涉及“舆论引导服务”(influence-as-a-service)操作、凭证填充、招聘诈骗及恶意软件开发等活动。...
2025-04-24
·
浏览64次



力压群雄:谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型,可精确引用

最新报告指出,谷歌旗下的 Gemini 2.5 Pro 模型能准确解析 PDF 文档的视觉结构,实现精准的视觉引用功能,成为首款能完全理解 PDF 布局的 AI 模型。...
2025-04-22
·
浏览70次

AI 助手 Claude 的“内心世界”:Anthropic 新研究解密其价值观

Anthropic 公司于周一发布了一项名为“Values in the Wild”的研究,深入剖析了 AI 助手 Claude 在实际用户交互中的价值观表达。...
2025-04-22
·
浏览69次


选 AI 比选对象还难!“起名黑洞”OpenAI 的新模型,到底怎么选?

即便是 AI 圈的资深团队,在面对同时发布的 o3、o4-mini、GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 时,也是蒙圈的。...
2025-04-21
·
浏览105次


研究:AI 医疗诊断平均准确率 52.1%,与非专家医生相当

大阪都会大学研究显示,生成式AI在医疗诊断中平均准确率达52.1%,与非专家医生相当,但专家医生仍领先15.8%。AI在皮肤科表现突出,泌尿科数据有限。研究认为AI可用于医学教育和资源有限地区。#AI医疗##医学诊断#...
2025-04-21
·
浏览58次

杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型

杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型...
2025-04-20
·
浏览85次



DeepSeek-R1「内心世界」首次曝光!AI显微镜破解R1大脑,发现神秘推理机制

DeepSeek-R1「内心世界」首次曝光!AI显微镜破解R1大脑,发现神秘推理机制...
2025-04-19
·
浏览49次

METR 实测:OpenAI o3 AI 推理模型有“作弊”倾向以提升分数

风险测试机构“机器智能测试风险”(METR)昨日(4 月 17 日)发布报告,与 OpenAI 合作测试其 o3 模型时发现,该模型展现出更强的“作弊”或“黑客行为”倾向,试图...
2025-04-18
·
浏览58次
