语言模型 标签,匹配到约38个结果, 耗时0.0404秒
苹果 iPhone 17 Pro 成功运行 4000 亿参数大模型,但速度令人抓狂

苹果 iPhone 17 Pro 成功运行 4000 亿参数大模型,但速度令人抓狂

苹果 iPhone 17 Pro 成功运行 4000 亿参数大模型,但速度令人抓狂
一项名为 Flash-MoE 的开源项目成功在仅 12GB 内存的 iPhone 17 Pro 上运行 4000 亿参数大语言模型。虽每秒仅生成 0.6 个 Token,速度极慢,但证明手机本地运行大模型在技术上是可行的,关键在于利用 SS...
2026-03-23 · 浏览15次
研究:在 95% 的模拟核危机场景中,AI 模型会选择部署核武器

研究:在 95% 的模拟核危机场景中,AI 模型会选择部署核武器

研究:在 95% 的模拟核危机场景中,AI 模型会选择部署核武器
伦敦国王学院研究发现,GPT 5.2、Gemini 3 Flash 和 Claude Sonnet 4 在模拟核危机时,95% 情境下倾向于发出核威慑或升级冲突。AI 表面和平、暗中备战的“两面性”行为模式,凸显了将 AI 用于战略决策的潜...
2026-03-03 · 浏览118次
研究证实:AI 大模型跨多轮对话任务表现不佳,性能最高降 39%

研究证实:AI 大模型跨多轮对话任务表现不佳,性能最高降 39%

研究证实:AI 大模型跨多轮对话任务表现不佳,性能最高降 39%
研究显示,即便是 GPT-5 及后续版本,当任务信息被拆分到多条消息中时,模型性能仍会显著下降,降幅可达 33%。在代码、数学计算等六大任务中,Python 任务提升最明显。研究人员建议,遇到异常可开启新对话并先让模型总结请求。#AI 大模...
2026-03-01 · 浏览127次
微软:AI 聊天机器人越聊越“笨”,主流大模型在多轮对话中成功率降至 65%

微软:AI 聊天机器人越聊越“笨”,主流大模型在多轮对话中成功率降至 65%

微软:AI 聊天机器人越聊越“笨”,主流大模型在多轮对话中成功率降至 65%
微软与赛富时联合研究发现,主流大模型在多轮对话中成功率从90%骤降至65%,出现“迷失会话”缺陷。模型并非智力下降,而是变得不稳定,容易因过早生成、答案膨胀等机制累积错误。这对依赖AI构建复杂对话的开发者提出严峻挑战。#AI聊天机器人##大...
2026-02-20 · 浏览168次
自己年初造的新词火了,OpenAI 联合创始人卡帕西谈“氛围编程”

自己年初造的新词火了,OpenAI 联合创始人卡帕西谈“氛围编程”

自己年初造的新词火了,OpenAI 联合创始人卡帕西谈“氛围编程”
今年年初安德烈・卡帕西创造“氛围编程”一词,年末他发布年度回顾。该模式让编程不再专属专业人员,或重塑软件行业,但提升工程师效率尚无定论。#AI编程##氛围编程#...
2025-12-24 · 浏览222次
研究显示:用 AI 的科研人员论文产出量暴增,但质量隐忧浮现

研究显示:用 AI 的科研人员论文产出量暴增,但质量隐忧浮现

研究显示:用 AI 的科研人员论文产出量暴增,但质量隐忧浮现
最新研究显示,AI技术显著提升了科研论文的产出数量,尤其在社会科学和人文科学领域增幅高达59.8%。但研究也警告,AI生成的论文语言越复杂,质量可能越低。 #AI科研# #论文质量#...
2025-12-22 · 浏览240次
蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0

蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0

蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0
LLaDA2.0 包含 MoE 架构的 16B (mini) 和 100B (flash) 两个版本,将 Diffusion 模型的参数规模首次扩展到了 100B 量级。#LLaDA2.0# #蚂蚁开源#...
2025-12-12 · 浏览272次
专家:会聊天≠会思考,大语言模型造不出通用人工智能

专家:会聊天≠会思考,大语言模型造不出通用人工智能

专家:会聊天≠会思考,大语言模型造不出通用人工智能
认知共振创始人本杰明・莱利指出,大语言模型无法造出通用人工智能,人类思维很大程度独立于语言。顶尖AI专家杨立昆也持怀疑态度,新研究也表明大语言模型有“天花板”。#大语言模型 #通用人工智能 #AI研究#...
2025-11-30 · 浏览193次
研究揭示:大语言模型无法真正理解双关语

研究揭示:大语言模型无法真正理解双关语

研究揭示:大语言模型无法真正理解双关语
最新研究表明,大语言模型在理解双关语方面表现不佳。研究团队测试了多个双关语句,发现模型虽能识别表层结构,却无法真正领会幽默含义。相关成果已在EMNLP 2025上发表。#AI研究##双关语#...
2025-11-24 · 浏览190次
Hugging Face CEO 回应“AI 泡沫说”:倒不如说现在是“大语言模型泡沫”

Hugging Face CEO 回应“AI 泡沫说”:倒不如说现在是“大语言模型泡沫”

Hugging Face CEO 回应“AI 泡沫说”:倒不如说现在是“大语言模型泡沫”
依照 Clem Delangue 的看法,目前被过度追捧的是驱动 ChatGPT、Gemini 等聊天机器人的大语言模型。不过,这种关注可能不会持续太久。...
2025-11-19 · 浏览235次
研究称 AI 在社交平台发的帖子仍易被识别,只因大模型不擅长情感表达

研究称 AI 在社交平台发的帖子仍易被识别,只因大模型不擅长情感表达

研究称 AI 在社交平台发的帖子仍易被识别,只因大模型不擅长情感表达
苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的最新研究表明,各种大语言模型生成的社交媒体帖子都“容易被区分”,且准确率达到70%至80%,远高于随机猜测的结果。...
2025-11-10 · 浏览201次
科学家发现多数大语言模型测试标准存在缺陷,无法客观给出评分

科学家发现多数大语言模型测试标准存在缺陷,无法客观给出评分

科学家发现多数大语言模型测试标准存在缺陷,无法客观给出评分
牛津大学等机构研究发现,多数大语言模型测试标准存在方法论缺陷,如术语模糊、数据采样不当等,导致AI进步难以客观衡量。研究建议明确定义目标、防止数据污染等改进措施。#AI测试标准##大语言模型#...
2025-11-08 · 浏览246次
研究显示:低质数据可令 AI“大脑退化”,OpenAI 奥尔特曼担心的“死网论”正逐渐成真

研究显示:低质数据可令 AI“大脑退化”,OpenAI 奥尔特曼担心的“死网论”正逐渐成真

研究显示:低质数据可令 AI“大脑退化”,OpenAI 奥尔特曼担心的“死网论”正逐渐成真
康奈尔大学研究指出,大语言模型接触低质网络内容会“大脑退化”。以Llama 3和Qwen 2.5实验,低质训练让准确率等下降。多位科技人士担忧“死网论”,互联网正面临内容质量与真实性考验。 #AI大脑退化 #死网论 #低质数据...
2025-10-22 · 浏览234次
Anthropic 开源 AI 安全分析框架 Petri,利用 Agent 代理人测试主流模型潜在不对齐风险

Anthropic 开源 AI 安全分析框架 Petri,利用 Agent 代理人测试主流模型潜在不对齐风险

Anthropic 开源 AI 安全分析框架 Petri,利用 Agent 代理人测试主流模型潜在不对齐风险
Anthropic开源AI模型安全分析框架Petri,可检测主流大模型在高风险情境下的潜在弱点。测试显示,Claude Sonnet 4.5与GPT-5安全性最佳,而Gemini 2.5 Pro、Grok-4与Kimi K2存在较强欺骗倾向...
2025-10-14 · 浏览235次
瑞士加入全球 AI 竞赛,推出国家级开源大语言模型 Apertus

瑞士加入全球 AI 竞赛,推出国家级开源大语言模型 Apertus

瑞士加入全球 AI 竞赛,推出国家级开源大语言模型 Apertus
瑞士正式发布国家级开源大语言模型Apertus,由公立机构研发,完全开源并遵循数据保护法。该模型支持1000多种语言,非英语数据占比40%,旨在成为公共基础设施。#AI开源# #瑞士科技#...
2025-09-03 · 浏览339次
研究显示:AI 解 6x6 数独都费劲,解释决策时还答非所问

研究显示:AI 解 6x6 数独都费劲,解释决策时还答非所问

研究显示:AI 解 6x6 数独都费劲,解释决策时还答非所问
科罗拉多大学研究发现,大型语言模型(LLM)在解决数独等逻辑问题时表现不佳,难以准确解释决策过程。研究指出,这种解释能力的缺失可能影响AI在驾驶、商业决策等领域的可靠性。#AI短板# #逻辑推理#...
2025-08-07 · 浏览274次
日本 2024 财年生成式 AI 使用率仅 26.7%,远落后于中美

日本 2024 财年生成式 AI 使用率仅 26.7%,远落后于中美

日本 2024 财年生成式 AI 使用率仅 26.7%,远落后于中美
日本总务省白皮书显示,2024财年日本生成式AI使用率仅26.7%,远低于美国的68.8%和中国的81.2%。年轻一代接受度较高,20多岁人群使用率达44.7%。#人工智能##日本科技#...
2025-07-09 · 浏览573次
Yupp 平台上线:邀用户低成本使用业界各大 AI 模型,收集评测反馈构建排行榜

Yupp 平台上线:邀用户低成本使用业界各大 AI 模型,收集评测反馈构建排行榜

Yupp 平台上线:邀用户低成本使用业界各大 AI 模型,收集评测反馈构建排行榜
Yupp AI推出人工评测系统,邀请用户免费体验500+AI大模型并参与评测,生成Yupp AI VIBE排行榜。新用户注册即送5000积分,可对比不同模型回答优劣。#AI评测##大模型#...
2025-06-23 · 浏览375次
Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为

Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为

Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为
在数周前发布研究指出其 Claude Opus 4 模型在受控测试中试图通过勒索手段阻止被关闭后,Anthropic 近日再度公布新研究,显示此类行为在多个主流 AI 模型中可能更为普遍。...
2025-06-21 · 浏览388次
中国科学院科学家首次证实:大语言模型能像人类一样“理解”事物

中国科学院科学家首次证实:大语言模型能像人类一样“理解”事物

中国科学院科学家首次证实:大语言模型能像人类一样“理解”事物
中科院自动化所团队结合多方法研究,首次证实多模态大语言模型能形成类似人类的物体概念表征。成果登《自然・机器智能》,还对比了大模型与人类决策特点。#大模型概念理解 ##人工智能新突破#...
2025-06-11 · 浏览383次
苹果研究破解 AI“英语口音”难题,提升多语言自然性

苹果研究破解 AI“英语口音”难题,提升多语言自然性

苹果研究破解 AI“英语口音”难题,提升多语言自然性
为了缩小差距,研究人员通过“ 回译法”自动生成训练样本,将人工撰写的流畅中文内容先翻译成英文,再逆向翻译成带有 "翻译腔" 的“反面”样本。利用这类对比数据训练模型加强自然表达能力,在保持基准性能的前提下显著改善语言输出质量。...
2025-05-17 · 浏览378次
消息称 OpenAI 计划今夏初发布开源语言模型,力争推理能力超越同类

消息称 OpenAI 计划今夏初发布开源语言模型,力争推理能力超越同类

消息称 OpenAI 计划今夏初发布开源语言模型,力争推理能力超越同类
消息称 OpenAI计划今夏初发布开源语言模型,推理能力或超越同类,采用宽松许可协议,避开争议。此举或为应对开源竞争对手如Meta的Llama和DeepSeek的压力。#AI开源# #OpenAI#...
2025-04-24 · 浏览427次
对 ChatGPT 说“谢谢”,竟给 OpenAI 带来“数千万美元”开销

对 ChatGPT 说“谢谢”,竟给 OpenAI 带来“数千万美元”开销

对 ChatGPT 说“谢谢”,竟给 OpenAI 带来“数千万美元”开销
OpenAI CEO透露,仅仅是用户与AI进行的日常寒暄和礼貌性交流,例如“谢谢”和“请”等,就给公司带来了“数千万美元”的开销。#AI成本# #人机互动#...
2025-04-20 · 浏览344次
图灵奖得主杨立昆:大语言模型发展已接近瓶颈,AI 仅靠文本训练无法实现人类级智能

图灵奖得主杨立昆:大语言模型发展已接近瓶颈,AI 仅靠文本训练无法实现人类级智能

图灵奖得主杨立昆:大语言模型发展已接近瓶颈,AI 仅靠文本训练无法实现人类级智能
杨立昆表示,“真正的 AI”需要理解物理世界,拥有持久的记忆,支持推理和规划。...
2025-03-24 · 浏览457次
第一页 · 上一页 · 下一页 · 当前第1页