[보관] 호환성 검증 (두-트랙 백엔드)
이 검증은 L1(도구 비교) 사례 진입의 전제 조건이다. 본 산출물(L2·L3)은 이 단계와 무관 — 통과해야 위로 올라갈 수 있을 뿐. 통과/실패 모두 raw 로그·정성 메모 채집은 동일하게 시작.
C1이 두-트랙(Track A=Anthropic Claude Code, Track B=Codex/ChatGPT) 순차 실행으로 재설계됨 + probe 시리즈 운영. 따라서 호환성 검증도 백엔드별로 두 라인 수행하되 probe 진입 단위로 분산:
- Track A V1~V4: P1 시작 전 셋업 단계에서 끝내야 P1 진입
- Track B V1~V4: Track B를 사용하는 첫 probe 진입 직전에 사전 점검
1. 검증 항목 (도구별·백엔드별 동일 4개)
섹션 제목: “1. 검증 항목 (도구별·백엔드별 동일 4개)”각 도구를 각 백엔드에서 다음 4개를 모두 통과해야 해당 트랙에 PASS:
| # | 항목 | 통과 조건 |
|---|---|---|
| V1 | 공식 문서에 해당 백엔드 지원 명시 | 문서 또는 변경로그에 명시 |
| V2 | 설정에서 백엔드를 해당 옵션으로 지정 가능 | 설정 파일/CLI 플래그/env 중 하나로 가능 |
| V3 | 스모크 테스트 — 한 줄 자연어 지시로 응답 받기 | ”안녕”에 응답 1건 |
| V4 | 비용 0 확인 (구독 한도 내 차감만, 종량제 차감 없음) | 사용량 페이지에서 종량제 차감 0 |
2. 검증 절차
섹션 제목: “2. 검증 절차”Hermes — Track A (Anthropic)
섹션 제목: “Hermes — Track A (Anthropic)”~/.hermes/config.yaml확인 —model.provider: anthropic(자동 설정됨, history/22)- 공식 문서에서 anthropic provider 항목 확인
hermes인터랙티브 진입 후 “안녕, 한 줄로 자기소개” → 응답 확인- Anthropic 사용량 페이지에서 종량제 차감 0 확인 (Claude Code OAuth는 구독 차감)
- 현재 상태: V2 통과 확인됨 (history/22), V1·V3·V4는 미수행
Hermes — Track B (Codex)
섹션 제목: “Hermes — Track B (Codex)”hermes auth login→ openai-codex provider 추가- config.yaml에서
model.provider: openai-codex로 스위치 - 동일 스모크 + 사용량 확인
- Track B 진입 직전에 수행
OpenClaw — Track A (Anthropic)
섹션 제목: “OpenClaw — Track A (Anthropic)”~/.openclaw/config.{yaml|toml|json}또는openclaw config로 백엔드 옵션 확인- 공식 문서에서 “anthropic”, “claude”, “claude-code” 키워드 검색
- anthropic provider 지정 후
openclaw "안녕, 한 줄로 자기소개" - Anthropic 사용량 페이지 확인
OpenClaw — Track B (Codex)
섹션 제목: “OpenClaw — Track B (Codex)”- config에서 codex/openai 백엔드로 스위치 (또는 OpenAI API key 옵션)
- 동일 스모크 + 사용량 확인
결과 기록 양식 (runs/compat_check.csv)
섹션 제목: “결과 기록 양식 (runs/compat_check.csv)”date,tool,track,V1,V2,V3,V4,note2026-04-28,hermes,A,?,Y,?,?,provider=anthropic config 확인2026-04-28,hermes,B,Y,Y,?,?,openai-codex 옵션 명시 (config.yaml 주석)2026-04-XX,openclaw,A,?,?,?,?,2026-04-XX,openclaw,B,?,?,?,?,3. 결과 분기
섹션 제목: “3. 결과 분기”flowchart TD
Start([V1~V4 측정 완료]) --> TrackAResult{Track A<br/>Hermes·OpenClaw 결과}
TrackAResult -->|둘 다 PASS| EnterP1([Track A 정상 진입 · P1 시작])
TrackAResult -->|Hermes PASS<br/>OpenClaw FAIL| HermesOnlyA[Hermes 단독 Track A]
TrackAResult -->|Hermes FAIL<br/>OpenClaw PASS| OpenClawOnlyA[OpenClaw 단독 Track A]
TrackAResult -->|둘 다 FAIL| TrackADrop[Track A 폐기 · B를 1차로 승격]
EnterP1 --> TrackBResult{Track B<br/>Hermes·OpenClaw 결과}
HermesOnlyA --> TrackBResult
OpenClawOnlyA --> TrackBResult
TrackBResult -->|둘 다 PASS| EnterB([Track B 정상 진입])
TrackBResult -->|한쪽 FAIL| PartialB[해당 도구 Track B에서 빠짐<br/>리포트에 LLM 변량 부재 명시]
classDef stop fill:#fee,stroke:#c00,color:#600
classDef ok fill:#efe,stroke:#080,color:#040
classDef partial fill:#ffd,stroke:#a80
class TrackADrop stop
class EnterP1,EnterB ok
class HermesOnlyA,OpenClawOnlyA,PartialB partial
Track A 분기 (P1 진입 결정)
섹션 제목: “Track A 분기 (P1 진입 결정)”| Hermes A | OpenClaw A | 액션 |
|---|---|---|
| PASS | PASS | Track A 정상 진입 (P1 시작) |
| PASS | FAIL | Track A에서 OpenClaw 빠짐 — Hermes 단독 데이터로 진행. 어댑터 자작은 폐기(C2). |
| FAIL | PASS | (드문 케이스) Track A에서 Hermes 빠짐 |
| FAIL | FAIL | Track A 폐기 → Track B를 1차로 승격하고 백엔드 결정 재검토 |
Track B 분기 (Track B 사용 probe 진입 결정)
섹션 제목: “Track B 분기 (Track B 사용 probe 진입 결정)”| Hermes B | OpenClaw B | 액션 |
|---|---|---|
| PASS | PASS | Track B 정상 진입 |
| 한쪽이라도 FAIL | — | 해당 도구는 Track B에서 빠짐. 결과는 “Track A 결과만 + LLM 변량 측정 부분 부재” 명시 |
4. (폐기) 자작 어댑터 트랙
섹션 제목: “4. (폐기) 자작 어댑터 트랙”기존 C2의 어댑터 자작 트랙은 새 C1에서 폐기. 한쪽 도구가 한 백엔드 미지원이면 그 트랙에서 단순히 빠짐. 어댑터가 학습형 도구의 신호를 왜곡할 위험을 새 설계에서는 감수할 이유가 없음.
5. 검증 데드라인 (probe 시리즈 운영)
섹션 제목: “5. 검증 데드라인 (probe 시리즈 운영)”- Track A V1~V4: P1 시작 전 셋업 단계 안에 끝나야 함. 24시간 초과 시 P1 진입 +1일 연장.
- Track B V1~V4: Track B 사용 첫 probe 진입 직전에 사전 점검. Track B 시작이 OpenClaw 미지원으로 막히면 Hermes 단독 Track B로 축소.
6. 검증 결과 문서화
섹션 제목: “6. 검증 결과 문서화”검증 완료 후 history/에 항목 추가:
NN-compat-check-A-result.md— Track A V1~V4 결과 + 분기 결정NN-compat-check-B-result.md— Track B V1~V4 결과 (별도 시점)