콘텐츠로 이동

[보관] 34 — Root cascade: probe 시리즈 전환에 맞춰 root 문서 일괄 갱신

시각: 2026-04-28 오후 KST 컨텍스트: history/31에서 cascade 폭주 → probe 시퀀스 전환 결정 후, root 문서들이 여전히 D0/D1/D2/D3 일정과 3일 압축 표현을 들고 있어서 정합성 깨짐. 다른 세션이 experiments/ 셋업 끝낸 시점에 root cascade 진행.

  • experiments/00-plan.md, experiments/README.md, experiments/P1-trajectory.md — 다른 세션 작업으로 P1~P9 시퀀스 봉인
  • history/31-experiment-series-launch.md — 시리즈 시작 commit
  • history/32-reports-rewrite-probe-series.md — reports 갱신
  • history/33-interim-memo-changelog.md — 중간 변경 기록

남은 root 문서들(01·02·04·05·06·07·08·README·runs/)에 D0/D1/D2/D3·“3일 압축”·“D14 시점”·“매일 5태스크” 등 잔재가 다수 남아 있어 probe 시리즈와 충돌.

이번 턴에 cascade 처리한 항목 (사용자 confirmation: “다 이어서 진행해줘”):

파일변경
01-experiment-design.md§1 목적 — 3일 파일럿 → probe 시리즈. §3 H1·H2′·H3 — D1/D2 표현 → P1/P3 표현. §6 — “매일 5개씩 골라” → “probe별로 5개”. §7.1 — 반복가속 → pass^3 일관성, 누적자산 → v2 후보. §8 — “Day 13 셋업” → “P1 시작 전”. “매일 코인토스” → “각 probe 시작 시”. §9 일정 표 — 3일 fork → probe P1P9 표. §10 결정 매트릭스 — 1주차/2주차 → P1·P3·P5 매핑. §11 산출물 — 5종 framing → 3종(A·B·D)
02-constraints.mdC1 트레이드오프 — 3일 운영 → 79일 probe 시리즈. C5 OpenClaw 셋업 — D1 오전 → P1 시작 전. “Track A·B 분리” 행 — 3일 압축 표현 제거. C7 익명화 이유 — D2 저녁/D3 종료 → 다음 probe 진입 전/P9. C8 신뢰성 — 평가자 2명 κ → 자가 재측정 ICC. C9 fork 트리거 — D1 저녁 → probe별, 5+ → P4 채택 시 3+
04-day0-setup.md제목 “Day 0 셋업 가이드” → “진입 셋업 가이드 (P1 시작 전)”. L2/L3 채집 양식 4종 — Day 1 전 → 이미 준비됨(체크). codex CLI 안내 — Track B 전환 시점 → Track B 사용 probe 진입 직전. STEP 6 제목 — “Track A Day 1 시작 전” → “P1 시작 전”. 비용·한도 모니터링 — 매일 저녁 → probe 종료 시. 측정 무결성 리마인더 — 매일 아침 → 각 probe 시작 시
05-compat-check.md5번 데드라인 — D0/D2 저녁 → P1 시작 전 셋업 단계/Track B 사용 첫 probe 진입 직전. 3번 분기 — Day 0/Day 14 → P1 진입/Track B 사용 probe 진입
06-user-walkthrough.mdSTEP 1 — Track B 진입 직전(D2 저녁) → Track B 사용 첫 probe 진입 직전. STEP 4 — Day 1 진입 → P1 진입. STEP 4.5 — D1 진입 전 → P1 진입 전. STEP 6 — D2 저녁 후 → Track B 사용 probe 진입 직전
07-indicator-spec.md헤더 — 3일 파일럿 종료 시점(D3 오후) → probe 시리즈 종료 시점(P9). I1·I2·I3·I4·I5 W4 시점 — D2 저녁 → 다음 probe 진입 전. I3 W2 — D1 오전 → P1 진입 전 셋업. I4 W2 — D3/D1 오전 → P1 진입 전 셋업. I6 — std 단독 → P3에서 검증, P3 채택 시 pass^3 boolean 주. I7 — D2 종료 측정 → study/14 R1 권고대로 v2 후보로 보존(측정 안 함). 종합 사망 판정 — D2 저녁/D3 종료 → 각 probe 종료 직후/다음 probe 진입 전
08-meta-eval.md§2 체크포인트 — D1 저녁/D2 저녁/D3 종료 → 각 probe 종료 직후/다음 probe 진입 전/P9. §2 체크포인트별 추가 점검 — D1 저녁/D2 저녁/D3 종료 → probe 단위. §5 반증 조건 — D14·D21·D3 시점 → probe 종료 직후/P9 통합 분석/다음 probe 진입 전
README.md한 줄 소개 — 3일 압축 파일럿 → probe 시리즈. 진행 단계 — Phase 05(D0D3) → Phase 05(P1P9 시퀀스). 모델 섹션 — D1~D2/D3 → probe 단위 분배
runs/runs.csv 헤더probe_id 추가, pass3_repeat/tool_calls_count/unique_tools_used/has_external_call/memory_label/quality_accuracy/quality_usability 컬럼 사전 추가 (P1·P3·P5·P8 채택 시 사용)
runs/checkpoints.mdD1 저녁/D2 저녁/D3 종료 양식 → P1~P9 단위 양식 (probe별 “종료 직후” + “다음 probe 진입 전” + “결정”)
  • probe 시리즈와 root 문서 정합성 강제: D0/D1/D2/D3 표현을 그대로 두면 미래의 작성자(다른 세션·사용자·후속 AI)가 probe 시리즈에 진입한 후에도 옛 일정에 따라 작업해 측정 시점이 흐릿해짐. 충돌은 “cascade 폭주의 잔재”가 그대로 굳어버리는 위험을 만들기 때문에 한 번 깨끗이 갈아엎음.
  • 선제 마킹 옵션 거부 이유: “이 표현은 probe 매핑으로 대체 예정” 같은 마킹은 임시 해결인데, root cascade가 이미 합의돼 있어서 직접 갱신이 더 깨끗. 마킹은 두 번 일.
  • Cascade 단위 자체가 축소: 이번 cascade 후로는 각 probe 단위로 02·04·07을 작은 변경으로 갱신할 것. cascade 폭주는 이 시점이 마지막.
  • 실험 카테고리 D(T_concurrent·T_burst) 보존: probe 시리즈 도입 전에 사용자 결정으로 박혔고, study/14는 T_burst v2 미루기 권고했지만 사용자가 “한도 넉넉, 그대로 박음”으로 직전에 확정 → 보존.
  • 메모리 미니(I9) 미반영: 다른 세션이 P8을 “Memory 1축 (A8)“으로 박아놓음. 이번 세션의 메모리 미니 결정(I9, R1~R4 4단계, M-within/cross/track)은 P8 안에서 조작적 정의로 다시 다룰 수 있음. P8 진입 직전에 sub-cascade로 처리.
  • ✅ Root 문서 9개(01·02·04·05·06·07·08·README + runs/checkpoints.md·runs.csv) 정합화 완료
  • ⚠️ 다른 세션이 만든 experiments/00-plan.md(EXP-01EXP-08)와 experiments/README.md(P1P9) 사이에 명명 불일치. 본 cascade는 P1~P9 채택. 다른 세션이 정합화할 때 plan에서 EXP- → P-로 갈아엎으면 됨 (또는 README가 EXP-로 정렬해도 됨)
  • ⚠️ 메모리 미니(I9)는 본 세션에서 합의됐으나 root 문서엔 미반영 (P8 진입 직전에 sub-cascade 예정)
  • ⚠️ I8 컨컬런시 견고성·T_burst·T_concurrent는 D 카테고리로 01에 남아있음. probe 시리즈와는 직접 매핑 없음 — 별도 슬롯으로 P9 통합 분석 시점에 통합. 향후 P10(컨컬런시 측정 일관성) 추가 검토 가능
  • 다른 세션이 명명 정합화(EXP- vs P-) 끝내면 P1 진입 셋업 단계로 진입
  • P1 진입 전: OpenClaw 설치 + V1V4(Track A) + experiments/P1-trajectory.md §1§4 작성
  • P1 시작 시 코인토스·도구 순서 결정