SOTA大模型遇上加密数据评测:Qwen3未破10%,o1也栽了

用海量真实隐私场景数据和多类型密码算法,硬核挑战SOTA大模型