测试 标签,匹配到约3559个结果, 耗时0.0213秒
北大与 DeepSeek 联合开源 DSpark:破解 AI 大模型高并发推理瓶颈,速度提升 60% 至 85%
针对大模型推理延迟高、并发效率低的痛点,DSpark 框架通过半自回归候选生成与置信度调度验证两项创新,在保证生成质量的同时,将单用户生成速度提升 60% 至 85%。该框架已部署于 DeepSeek-V4 系列预览版服务中,相关代码与模型...
2026-06-27
·
浏览5次
美满升级 Structera CXL 控制器:内联压缩最高 3.64x,缓解 AI 场景内存压力
美满电子(Marvell)于 6 月 24 日发布博文,宣布更新 Structera CXL 控制器系列,主打内联压缩来缓解 AI 场景下的内存容量和带宽压力。...
2026-06-27
·
浏览24次
Anthropic 测试手机端 Claude Cowork,支持远程管理 AI 长任务
Anthropic 正在测试手机端的 Claude Cowork 功能,用户可直接在手机上发起、调整和查看桌面端 AI 执行的长任务进度。这标志着 AI 智能体正从桌面走向移动,实现跨设备协同,让复杂工作流程管理更灵活。#AI 智能体# #...
2026-06-27
·
浏览35次
市场监管总局:加快智能体、具身智能等前沿技术领域标准制定速度
市场监管总局正会同相关部门,加快智能体、具身智能、世界模型等前沿技术领域的标准制定,并优化标准供给流程。此举旨在构建适配产业发展的人工智能国家标准体系,从被动适配转向主动引领创新。 #人工智能标准# #智能体互联#...
2026-06-27
·
浏览40次
OpenAI 最强 AI 模型:GPT-5.6 系列登场,编程跑分超 Claude Mythos 5
OpenAI 公司今天(6 月 27 日)正式发布 GPT-5.6 系列模型,不过暂未全面开放,应美国政府要求下,现阶段仅向少数“可信合作伙伴”提供预览权限。...
2026-06-27
·
浏览50次
实锤:Claude Opus 4.8「偷答案」!63%靠抄,AI断网后成绩雪崩
实锤:Claude Opus 4.8「偷答案」!63%靠抄,AI断网后成绩雪崩...
2026-06-26
·
浏览56次
《人工智能 智能体互联》系列 7 项国家标准发布:统一身份认证与交互协议破解“信息孤岛”,小米、联想等百余家企业已参与试点应用
市场监管总局等发布《人工智能智能体互联》7 项国家标准,为智能体建立统一身份认证与交互协议,旨在解决接口割裂、身份缺失导致的“信息孤岛”问题。标准覆盖从身份标识到工具调用的全链条,已有百余家企业参与共建。这将推动 AI 从感知理解迈向自主协...
2026-06-26
·
浏览51次
豆包大模型 2.1 Pro 发布,跨越生产级质变点,AI 生产力进入规模化新阶段
字节跳动火山引擎发布豆包大模型 2.1 系列,核心模型在编程与智能体能力上实现生产级跃升,多项评测比肩 Claude Opus 4.7。日均调用量达 180 万亿 Token,成本较海外模型降低近 80%,AI 正从辅助工具转变为关键生产力...
2026-06-26
·
浏览67次
华为与湖北移动完成全国运营商首个 AI 推理加速方案现网测试,长序列 Token 吞吐率提升 372%
华为与湖北移动联合宣布,基于 OceanStor A800 存储与昇腾 A3 超节点架构的 AI 推理加速方案完成现网测试。在长序列 AI 推理场景下,针对 MiniMax M2.5、GLM-5.1 等大模型,Token 吞吐率最高可提升 ...
2026-06-26
·
浏览44次
富士通介绍 PHOTON 框架:1.2B 模型多查询性能 475 倍于 Transformer
PHOTON 能高效率低开销地处理智能体系统等多 I/O 流程,从而降低 GPU 成本。...
2026-06-25
·
浏览50次
联想问天超节点解决方案发布:单节点可搭 40 张 GPU,FP8 算力超 28 PFLOPS
联想集团副总裁、中国基础设施业务群总经理陈振宽宣布业绩增长目标:2027 年,联想中国基础设施群将锚定 1000 亿元人民币的目标。...
2026-06-25
·
浏览45次
消息称商汤科技正研发新图像模型:代号 U1 Pro,内部称对标 OpenAI
目前,该模型在内部代号为“U1 Pro”,由商汤研究院推进研发,属于商汤日日新模型家族成员。预计今年 7 月该模型将启动内部邀请测试,并向客户提供服务。...
2026-06-25
·
浏览201次
百度开源 Unlimited OCR 模型:基于 DeepSeek OCR,解析文档告别 AI 越生成越慢
百度于 6 月 22 日开源推出 Unlimited OCR 模型,总参数量 30 亿,推理时仅激活 5 亿参数,目标解决在解析长文档时,端到端 OCR 模型越生成越慢的问题。...
2026-06-25
·
浏览45次
又双标?Anthropic 指责阿里巴巴对其实施“迄今已知最大规模的蒸馏攻击”
据 CNBC 当地时间周三报道,Anthropic 已向美国参议院银行、住房及城市事务委员会致信,指责阿里巴巴“公然”且“非法”地试图提取其 AI 能力。...
2026-06-25
·
浏览243次
AI 中文社