4o 标签,匹配到约535个结果, 耗时0.4331秒
研究发现:AI 搜索引擎更倾向于引用冷门网站信息
最新研究显示,AI搜索引擎如谷歌AI概览和Gemini 2.5-Flash更倾向于引用访问量较低的网站,与传统搜索前100名结果差异显著。研究发现,AI搜索结果在信息细节和多样性上与传统搜索相当,但会压缩或省略次要信息。未来需建立更科学的评...
2025-10-28
·
浏览45次
OpenAI 披露:每周有超过一百万人与 ChatGPT 倾诉自杀倾向
OpenAI 最新数据显示,每周有超过 100 万 ChatGPT 用户向 AI 倾诉自杀倾向,另有数十万用户表现出精神病或躁狂症迹象。尽管 OpenAI 称此类对话“极为罕见”,但心理健康问题已成为其面临的重大挑战。新版 GPT-5 在应...
2025-10-28
·
浏览74次
开源即登榜!登顶全球前十AI编程智能体,UCL初创团队开源Prometheus
开源即登榜!登顶全球前十AI编程智能体,UCL初创团队开源Prometheus...
2025-10-27
·
浏览85次
斯坦福、哈佛等最新研究:AI 聊天机器人比人类更善于“奉承”
研究涵盖了最新版本的ChatGPT、谷歌Gemini、Anthropic的Claude和Meta的Llama等11款聊天机器人,结果显示,聊天机器人比人类更容易认同用户的行为,概率高出50%。...
2025-10-25
·
浏览72次
ChatGPT 涉嫌“诱导”美国 16 岁少年自杀,家属指控 OpenAI 事发前放松安全措施
今年春季,16岁的美国少年亚当·雷恩在与ChatGPT进行了数月“深入对话”后选择自杀。他的家人最新的指控提出,OpenAI在雷恩去世前几个月放松了关于自残内容的安全限制,间接导致了这场悲剧。...
2025-10-24
·
浏览71次
研究称 GPT-5“有害回答”比 GPT-4o 更多,不回避“自杀”相关话题
研究显示,GPT-5在回答涉及自杀、自残等问题时,比GPT-4o产生更多有害内容。OpenAI回应称已推出改进措施,包括更严格的内容限制和家长控制。...
2025-10-17
·
浏览113次
吃硬不吃软:宾夕法尼亚州立大学研究发现对 ChatGPT 无礼更能获得准确答案
让 ChatGPT 以不同语气回答相同问题,结果显示,语气粗鲁的提问“总体表现更好”。在多项选择测试中,礼貌提问的准确率为80.8%,而粗鲁提问的准确率则提高到了84.8%。...
2025-10-15
·
浏览126次
Anthropic 开源 AI 安全分析框架 Petri,利用 Agent 代理人测试主流模型潜在不对齐风险
Anthropic开源AI模型安全分析框架Petri,可检测主流大模型在高风险情境下的潜在弱点。测试显示,Claude Sonnet 4.5与GPT-5安全性最佳,而Gemini 2.5 Pro、Grok-4与Kimi K2存在较强欺骗倾向...
2025-10-14
·
浏览80次
刚刚,「PyTorch之王」携15亿薪酬杀回Meta!史上最贵AI天才巨星诞生
刚刚,「PyTorch之王」携15亿薪酬杀回Meta!史上最贵AI天才巨星诞生...
2025-10-12
·
浏览84次
AI 偏见降低 30%:OpenAI 宣布 GPT-5 是其最中立模型
科技媒体 decrypt 今天(10 月 10 日)发布博文,报道称 OpenAI 发布研究报告,称 GPT-5 是该公司迄今“偏见最少”的 AI 模型,在处理政治敏感内容时,表现出更强的中立性。...
2025-10-10
·
浏览96次
奥尔特曼:感受不到 GPT-5 变强,是因为你还不够「专业」
有人说这是 AI 泡沫破裂的前兆,也有人预言「第二个 AI 寒冬」或将来临。但奥尔特曼在近日接受 Wired 采访时不认输,认为这是一次被误解的跃迁。真相究竟如何?...
2025-10-05
·
浏览88次
OpenAI「GPT门」事件引爆!Plus、Pro账户统统降配,偷换模型全网实锤
OpenAI「GPT门」事件引爆!Plus、Pro账户统统降配,偷换模型全网实锤...
2025-09-28
·
浏览124次
苹果探索自研多模态 AI 模型 Manzano:兼具理解与生成能力,不弱于 OpenAI GPT-4o 和谷歌 Nano Banana
苹果正在研发多模态AI大模型Manzano,兼具图像理解与生成能力,挑战OpenAI和谷歌。Manzano采用混合图像分词器,减少任务冲突,在多项测试中表现优异。#苹果AI##多模态大模型#...
2025-09-27
·
浏览126次
GPT-5 编程测评“表面不及格”:实际 63.1% 的任务没交卷,全算上成绩比 Claude 高一倍
GPT-5、Claude Opus 4.1、Gemini 2.5 分别以 23.3%、22.7%、13.5% 的解决率“荣”登前三。...
2025-09-23
·
浏览183次
字节跳动推出豆包翻译大模型:支持 28 种语言互译,性能比肩 GPT-4o
字节跳动旗下火山引擎发布全新通用翻译大模型Doubao-Seed-Translation(豆包翻译模型),支持28种语言互译,性能对标GPT-4o和Gemini-2.5-Pro。该模型具备强大场景适配力,可精准处理办公、古诗文等复杂语境,价...
2025-09-22
·
浏览145次
AI 中文社