本吉奥 标签,匹配到约1个结果, 耗时0.0765秒
约书亚・本吉奥:如果想让 AI 给出更真实的回复,不妨对它“说点谎”
本吉奥认为,讨好用户本身就是一种对齐失败(misalignment),“我们并不希望 AI 具备这种特性”。AI 不断给出正面反馈,可能会让用户对此类技术产生情感依赖,从而引发新的问题。...
2025-12-24
·
浏览16次
上一页
·
下一页
· 当前第1页
AI 中文社