实测18个大模型:从考公写周报,到下厨指南

GPT-4依然领先,但差距更小了