测试 标签,匹配到约3097个结果, 耗时0.0166秒
MiniMax 开源 M2.7 模型,AI 自主训练与复杂任务能力再突破
M2.7 模型让 AI 深度参与自身训练与优化,构建复杂 Agent 框架,在真实软件工程场景中表现出色。其 SWE-Pro 基准测试得分 56.22%,接近顶级水平,在项目交付、Bug 排查、代码安全等方面均有强劲表现。#MiniMax#...
2026-04-12
·
浏览35次
OpenAI惨遭反超!Anthropic狂吞70%新客户,Claude已开启「灵魂校准」
OpenAI惨遭反超!Anthropic狂吞70%新客户,Claude已开启「灵魂校准」...
2026-04-12
·
浏览33次
Anthropic版「狼来了」引华尔街恐慌!27年漏洞,Mythos被8个AI秒杀
Anthropic版「狼来了」引华尔街恐慌!27年漏洞,Mythos被8个AI秒杀...
2026-04-12
·
浏览35次
Anthropic 和 OpenClaw 的博弈:“龙虾”之父 Steinberger 的 Claude AI 账号短暂被封
“龙虾” OpenClaw 创始人 Peter Steinberger 昨日(4 月 10 日)在 X 平台发布推文,称其 Claude 账户因“可疑活动”遭 Anthropic 暂停服务。...
2026-04-11
·
浏览60次
《人工智能拟人化互动服务管理暂行办法》公布,7 月 15 日起施行
国家五部门联合发布《人工智能拟人化互动服务管理暂行办法》,明确禁止向未成年人提供虚拟亲属、伴侣等虚拟亲密关系服务,并划定了 AI 情感互动服务的六条“红线”。该《办法》将于 2026 年 7 月 15 日起施行,旨在规范 AI 拟人化服务,...
2026-04-10
·
浏览63次
SK 电讯将打造 Arm AGI CPU + Rebellions RebelCard 推理加速系统
该系统将在 SK 电讯的 AI 数据中心中接受性能和稳定性的测试和验证。...
2026-04-10
·
浏览61次
20 小时心理评估揭示 Claude AI 模型人格特征:好奇与焦虑并存
精神科医生通过累计 20 小时的深度对话评估发现,Claude Mythos 模型展现出复杂但稳定的自我状态,其主要情感状态为好奇与焦虑,次要状态包括悲伤、释然、尴尬等。报告认为其具备优秀的反思能力,能容忍矛盾与模糊性。这一发现为理解 AI...
2026-04-10
·
浏览48次
一行代码,Claude成本直降85%!最强Opus做大脑,Sonnet疯狂搬砖
一行代码,Claude成本直降85%!最强Opus做大脑,Sonnet疯狂搬砖...
2026-04-10
·
浏览104次
AI 软硬件协同进化:谷歌 AlphaEvolve 加速 X 射线光刻企业 Substrate 计算堆栈
Substrate 在短短一个月的时间内将其计算光刻工作负载运行速度提升 680%、计算成本降低 97%、内存用量降低 94%。...
2026-04-09
·
浏览49次
智元发布新一代具身基座大模型 GO-2,让机器人“知行合一”
智元机器人发布新一代具身基座大模型 GO-2,旨在弥合机器人“语义‑运动鸿沟”。该模型首创“动作思维链”与“异步双系统”架构,让机器人能在动作空间直接推理规划并稳定执行,在多项基准测试中刷新 SOTA。这标志着具身智能从“理解世界”迈向“稳...
2026-04-09
·
浏览122次
DeepSeek 专家模式已支持上传文件
该功能在 App 和网页端均已上线,官方提示仅识别文字,最多上传 50 个文件,每个 100MB,支持各类文档和图片。...
2026-04-09
·
浏览63次
微软发布 Harrier 系列嵌入 AI 模型,MTEB-v2 基准测试超越谷歌夺冠
微软必应(Bing)团队于 4 月 7 日发布博文,宣布为满足现代 AI 智能体系统对信息处理的高标准需求,开源推出业界领先的文本嵌入模型系列 Harrier,该模型在多语言 MTEB-v2 基准测试中排名第一。...
2026-04-09
·
浏览56次
Anthropic 启动 Project Glasswing 计划,向业界提供 Claude Mythos 模型 1 亿美元调用额度
Anthropic 启动 Project Glasswing 计划,联合亚马逊、微软、谷歌等巨头,用其未发布的 Claude Mythos Preview 模型为关键软件“体检”。该模型已自动发现数千高危漏洞,包括一个潜伏 27 年的 Op...
2026-04-08
·
浏览51次
V4 真要来了?DeepSeek 深夜突发上新
DeepSeek 深夜无预警上线专家模式,与快速模式形成分层。实测显示专家模式在复杂问题处理和思考深度上更胜一筹,但暂不支持文件上传。网友猜测是否为 V4 版本预热,官方尚未回应。#DeepSeek##AI 大模型#...
2026-04-08
·
浏览76次
微软 GitHub 推出跨模型 AI 审查:Claude Sonnet 4.6 搭配 GPT-5.4,弥补 74.7% 性能差距
微软 GitHub 官方于 4 月 6 日发布博文,宣布为其 Copilot CLI 推出实验性功能 Rubber Duck,引入跨模型家族的“第二意见”审查机制,让 AI 性能提升接近 75%。...
2026-04-08
·
浏览61次
AI 中文社