16 个模型同解这道题,分「Claude Code Harness 组(有工具)」与「纯 API 组(无工具)」两组评分对照——验证「带工具的 agentic harness 在最难一步走得更远」。含逐题评分榜 + 各模型完整解答。
拖动滑块,亲手感受集合 $D(x)$ 的含义;从直觉到压轴难点 (3ii) 的「天花板引理」可视化,深入浅出。
题目背景、精确题面与 Claude 的完整严格解答,并与扫描件标准答案逐题对照。