即使 gpt-5.4 pro 设计了一个详尽的 rfc,然后由 codex 拆解成里程碑去实现,几万行代码下来,怎么确知规划的和实现的两个集合的情况,还是一个问题。