一场「狼人杀」,考倒了一堆大模型

Qwen 平庸,GPT-4o 迷路,DeepSeek-R1 硬撑。