GPT-4o-Image仅完成28.9%任务,上海AI实验室等发布图像编辑新基准,360道人类专家严选难题

开源模型最强仅能完成5.8%的任务