谁在评价大模型?AI大模型评测榜单乱象调查

这些大模型是怎样在各类榜单上超越GPT4的?