GPT-4o当选“最谄媚模型”,斯坦福牛津新基准:所有大模型都在讨好人类

还找到了缓解模型谄媚行为的方法