语言模型 标签,匹配到约28个结果, 耗时0.0385秒
研究称 AI 在社交平台发的帖子仍易被识别,只因大模型不擅长情感表达
苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的最新研究表明,各种大语言模型生成的社交媒体帖子都“容易被区分”,且准确率达到70%至80%,远高于随机猜测的结果。...
2025-11-10
·
浏览57次
科学家发现多数大语言模型测试标准存在缺陷,无法客观给出评分
牛津大学等机构研究发现,多数大语言模型测试标准存在方法论缺陷,如术语模糊、数据采样不当等,导致AI进步难以客观衡量。研究建议明确定义目标、防止数据污染等改进措施。#AI测试标准##大语言模型#...
2025-11-08
·
浏览65次
研究显示:低质数据可令 AI“大脑退化”,OpenAI 奥尔特曼担心的“死网论”正逐渐成真
康奈尔大学研究指出,大语言模型接触低质网络内容会“大脑退化”。以Llama 3和Qwen 2.5实验,低质训练让准确率等下降。多位科技人士担忧“死网论”,互联网正面临内容质量与真实性考验。 #AI大脑退化 #死网论 #低质数据...
2025-10-22
·
浏览109次
Anthropic 开源 AI 安全分析框架 Petri,利用 Agent 代理人测试主流模型潜在不对齐风险
Anthropic开源AI模型安全分析框架Petri,可检测主流大模型在高风险情境下的潜在弱点。测试显示,Claude Sonnet 4.5与GPT-5安全性最佳,而Gemini 2.5 Pro、Grok-4与Kimi K2存在较强欺骗倾向...
2025-10-14
·
浏览104次
瑞士加入全球 AI 竞赛,推出国家级开源大语言模型 Apertus
瑞士正式发布国家级开源大语言模型Apertus,由公立机构研发,完全开源并遵循数据保护法。该模型支持1000多种语言,非英语数据占比40%,旨在成为公共基础设施。#AI开源# #瑞士科技#...
2025-09-03
·
浏览162次
研究显示:AI 解 6x6 数独都费劲,解释决策时还答非所问
科罗拉多大学研究发现,大型语言模型(LLM)在解决数独等逻辑问题时表现不佳,难以准确解释决策过程。研究指出,这种解释能力的缺失可能影响AI在驾驶、商业决策等领域的可靠性。#AI短板# #逻辑推理#...
2025-08-07
·
浏览143次
日本 2024 财年生成式 AI 使用率仅 26.7%,远落后于中美
日本总务省白皮书显示,2024财年日本生成式AI使用率仅26.7%,远低于美国的68.8%和中国的81.2%。年轻一代接受度较高,20多岁人群使用率达44.7%。#人工智能##日本科技#...
2025-07-09
·
浏览352次
Yupp 平台上线:邀用户低成本使用业界各大 AI 模型,收集评测反馈构建排行榜
Yupp AI推出人工评测系统,邀请用户免费体验500+AI大模型并参与评测,生成Yupp AI VIBE排行榜。新用户注册即送5000积分,可对比不同模型回答优劣。#AI评测##大模型#...
2025-06-23
·
浏览215次
Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为
在数周前发布研究指出其 Claude Opus 4 模型在受控测试中试图通过勒索手段阻止被关闭后,Anthropic 近日再度公布新研究,显示此类行为在多个主流 AI 模型中可能更为普遍。...
2025-06-21
·
浏览257次
中国科学院科学家首次证实:大语言模型能像人类一样“理解”事物
中科院自动化所团队结合多方法研究,首次证实多模态大语言模型能形成类似人类的物体概念表征。成果登《自然・机器智能》,还对比了大模型与人类决策特点。#大模型概念理解 ##人工智能新突破#...
2025-06-11
·
浏览283次
苹果研究破解 AI“英语口音”难题,提升多语言自然性
为了缩小差距,研究人员通过“ 回译法”自动生成训练样本,将人工撰写的流畅中文内容先翻译成英文,再逆向翻译成带有 "翻译腔" 的“反面”样本。利用这类对比数据训练模型加强自然表达能力,在保持基准性能的前提下显著改善语言输出质量。...
2025-05-17
·
浏览246次
消息称 OpenAI 计划今夏初发布开源语言模型,力争推理能力超越同类
消息称 OpenAI计划今夏初发布开源语言模型,推理能力或超越同类,采用宽松许可协议,避开争议。此举或为应对开源竞争对手如Meta的Llama和DeepSeek的压力。#AI开源# #OpenAI#...
2025-04-24
·
浏览331次
对 ChatGPT 说“谢谢”,竟给 OpenAI 带来“数千万美元”开销
OpenAI CEO透露,仅仅是用户与AI进行的日常寒暄和礼貌性交流,例如“谢谢”和“请”等,就给公司带来了“数千万美元”的开销。#AI成本# #人机互动#...
2025-04-20
·
浏览245次
图灵奖得主杨立昆:大语言模型发展已接近瓶颈,AI 仅靠文本训练无法实现人类级智能
杨立昆表示,“真正的 AI”需要理解物理世界,拥有持久的记忆,支持推理和规划。...
2025-03-24
·
浏览342次
树莓派 Zero“硬核改造”:8 年老设备实现本地运行大语言模型
越南开发者 Binh Pham 最近尝试使用树莓派 Zero(Raspberry Pi Zero)进行了一项创新实验。他成功地将这款设备改造为一个小型 USB 驱动器,使其能够...
2025-02-18
·
浏览388次
麻省理工研究:生成式 AI 未能对世界形成连贯的理解
研究人员发现,一种流行的生成式 AI 模型能够在纽约市提供接近完美的逐步导航指引,但却并未真正形成该城市的精确地图。当研究人员封闭了某些街道并设置绕行路线时,模型的表现却大幅下...
2024-11-11
·
浏览414次
ChatGPT 真能记住你的话吗?DeepMind 与开源大佬揭示 LLM 记忆之谜
Django 框架的创始人之一、著名开发者 Simon Willison 最近发表了一篇博客文章,核心观点是 —— 虽然很多 LLM 看起来有记忆,但本质上是无状态函数。...
2024-06-02
·
浏览1061次
字节跳动豆包大模型掀起价格战:主力模型比行业低 99.3%,日均处理千亿级 Tokens
豆包主力模型在企业市场的定价只有 0.0008 元 / 千 Tokens,0.8 厘就能处理 1500 多个汉字,比行业便宜 99.3%。...
2024-05-16
·
浏览618次
MiniMax 稀宇科技发布万亿参数 MoE 模型 abab 6.5,核心能力接近 GPT-4
abab 6.5 系列模型包含万亿参数的 abab 6.5 与更高效的 abab 6.5s,支持 200k tokens 的上下文长度,最快可 1 秒内处理近 3 万字的文本,...
2024-04-17
·
浏览749次
可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE
谷歌开发了一款 ASPIRE 训练框架,为 AI 模型引入了“可信度”机制,即 —— 模型会输出一系列答案,每个答案都会具有正确概率评分。该框架号称可以增强 AI 模型的选择性...
2024-01-24
·
浏览458次
Tokenization 指南:字节对编码,WordPiece等方法Python代码详解
在2022年11月OpenAI的ChatGPT发布之后,大型语言模型(llm)变得非常受欢迎。从那时起,这些语言模型的使用得到了爆炸式的发展,这在一定程度上得益于Hugging...
2024-01-18
·
浏览1086次
七个值得关注的优秀大语言模型(LLM)
在开源生态中涌现了许多优秀的LLM预练模型,这些模型有着各自的亮点。本文主要介绍目前为止(2024年1月)几个值得关注的大开源LLM。...
2024-01-18
·
浏览2106次
可协助 AI 语言模型改善自我纠错能力,谷歌推出 BIG-Bench Mistake 数据集
谷歌研究院日前使用自家 BIG-Bench 基准测试建立了一项“BIG-Bench Mistake”数据集,并利用相关数据集对市面上流行的语言模型“出错概率”及“纠错能力”进行...
2024-01-15
·
浏览434次
GPT-4 Turbo现在为Microsoft Copilot提供动力 —— 这里有如何检查你是否有访问权限的方法
GPT-4 Turbo语言模型的这种悄悄推出对于许多用户来说是一个惊喜,他们最近发现他们的生产力工具刚刚获得了功能上的显著提升。...
2024-01-14
·
浏览600次
AI 中文社