测试 标签,匹配到约3617个结果, 耗时0.0525秒
网友反馈 Claude Fable 5 重上架版“降智”,严苛 AI 护栏致频繁回退 Opus 4.8
科技媒体 bleepingcomputer 昨日(7 月 3 日)发布博文,报道称 Anthropic 本月重新上架 Claude Fable 5 最强模型,除了额度限制外,多名用户反馈存在“降智”情况,且更频繁回退到 Opus 4.8 模...
2026-07-04
·
浏览40次
Meta 汪滔称下一代 AI 模型“西瓜”已追上 GPT-5.5,基准测试成绩相近
两名知情人士称,汪滔在内部全员大会上表示,Meta 下一代 AI 模型 Watermelon(西瓜)已在备受关注的基准测试中追平 OpenAI 旗舰模型 GPT-5.5,但没有说明具体采用了哪些测试项目。...
2026-07-03
·
浏览46次
威胁平面设计等远程工作者:AI 自动化 16.1% 项目已被攻克
AI 安全中心(CAIS)于 7 月 1 日更新远程劳动指数(RLI),指出 AI 远程劳动自动化率正在经历快速跃升,Claude Fable 5 模型自动化率达到 16.1%,刷新该基准测试纪录。...
2026-07-03
·
浏览40次
英伟达开源 TwoTower AI 模型:保留 98.7% 质量,Token 生成提速 2.42 倍
英伟达昨日(7 月 2 日)发布博文,宣布推出 Nemotron-Labs-TwoTower,是一种基于预训练自回归骨干网络的离散扩散语言模型,致力于解决大模型 Token 生成速度瓶颈。...
2026-07-03
·
浏览49次
汪滔:Meta 下一代 AI 模型“西瓜”已追上 GPT-5.5
两名知情人士称,汪滔在内部全员大会上表示,Meta 下一代 AI 模型 Watermelon(西瓜)已在备受关注的基准测试中追平 OpenAI 旗舰模型 GPT-5.5,但没有说明具体采用了哪些测试项目。...
2026-07-03
·
浏览42次
曝特斯拉紧急限流 AI 开支:员工每周使用费封顶 200 美元,xAI 测试版除外
就在几个月前,特斯拉还要求员工更积极地使用 AI。政策如此迅速地转向,说明即便企业把未来押注在 AI 上,也很难控制不断增加的使用成本。...
2026-07-03
·
浏览44次
软件工程传奇人物肯特 · 贝克:程序员若想在 AI 时代生存,还得学习人际交往能力
贝克指出,软件工程师即使技术能力出众,也常常缺少职场越来越重视的软技能。“我们未必擅长调节情绪,也不一定具有天然的同理心。我们说话往往太直接,超过了别人能够轻松接受的程度。”...
2026-07-03
·
浏览41次
企业 AI 成本失控,消息称花旗、Adobe 等纷纷限制员工使用大模型
多家科技、金融巨头因 AI 成本飙升,正限制员工使用高性能大模型。Atlassian 月度 AI 支出从 500 万飙升至 1500 万美元,花旗、Adobe 等已禁用 Claude、GPT-5.5 等旗舰模型,并引导员工改用低配版以控制词...
2026-07-02
·
浏览64次
一杯拿铁3毛8,Gemini 3.1联手GPT-5.5干黄咖啡馆!2个月烧光21万
一杯拿铁3毛8,Gemini 3.1联手GPT-5.5干黄咖啡馆!2个月烧光21万...
2026-07-02
·
浏览73次
软银将通过新设子公司 SB Neo 于 2027 财年在美提供 AI 云服务
SB Neo 将基于软银集团目前正在开发的 10GW 能源与 AI 基础设施为美国大型企业提供大型 AI 模型训练与推理所需的算力资源。...
2026-07-02
·
浏览60次
消息称美国正与多家 AI 企业洽谈自愿性行业标准,管控前沿模型发布
美国政府正与多家 AI 企业深度磋商,拟出台面向新模型发布的自愿性行业标准,最早下周发布。此举旨在应对先进 AI 技术被滥用的风险,谷歌、OpenAI 等均已参与。此前特朗普已签署行政令,要求模型发布前完成安全测试。#AI监管##人工智能安...
2026-07-02
·
浏览53次
AI 中文社