[보관] 실험 시리즈 (Experiments)
이 폴더는 hamster-lab의 실제 실험 들이 누적되는 자리다. 본 시리즈의 가설 한 줄:
“학습 시리즈(
study/)에서 도출된 평가 패치들이 우리 실험(L1/L2/L3)에 진짜로 통찰을 더하는가 — 한 번에 다 박지 말고, 하루 1 패치씩 검증하며 누적한다.”
폴더 진입점
섹션 제목: “폴더 진입점”- 시리즈 소개·운영 규칙·현재 상태 (이 파일)
00-plan.md— 9 probe 순서·의존·진입/종료 규칙·v2 진입 조건P{N}/— 각 probe 폴더 (P1부터 적용). 안에00-plan.md메인 +00-plan-easy.md쉬운 짝 + 필요 시0X-{slug}.md보조. P2~P9는 진입 전엔 임시 단일 파일(P{N}-{slug}-easy.md)일 수 있음 — 진입 직전 폴더로 변환. probe 시작 직전 에 작성 (사전 일괄 작성 금지 — C8 정신)
폴더 분리 규칙
섹션 제목: “폴더 분리 규칙”(history/38 이후 적용 — 본실험 진행 기록을 history와 분리)
| 폴더 | 무엇 | 누가 읽나 | 빈도 |
|---|---|---|---|
study/ | 평가 학습 노트 (문헌 리뷰) | 어휘를 익힐 때 | 부정기 |
experiments/ | probe 단위 진행 — P{N}/00-plan.md(예: P1/00-plan.md)에 시작·결정·결과·이슈·실패 누적. easy 짝은 같은 폴더의 00-plan-easy.md | 실험 진행자, 후속자 | probe당 |
runs/daily-log/ | 트랙별 일일 운영 일지 (Track A/B 각자) | 트랙 진행 추적 | 매일 1개/트랙 |
runs/ (그 외) | raw 채집 (CSV·JSONL·diary·tool_map) | C7의 3단 채집 원천 | 자동/매일 |
/daily/ | 사용자 보고용 일일 리포트 (history/37에서 루트로 격상) | 비개발자/이해관계자 | 매 probe 종료 시 2개 (easy + detailed) |
history/ | 셋업·설계 commit (38번까지) + 본실험 중 메타 결정만 (39~) | 방법론 진화 따라가는 사람 | 메타 결정 발생 시 |
logs/history-${EXPERIMENT_TOOL}.jsonl | 자동 raw hook 로그 (트랙별 분리) | 재현·감사 | 자동 (전 툴콜) |
study/ 와 experiments/ 는 같은 패치를 두 시각으로 다룬다 — study는 왜·무엇, experiments는 언제·어떻게·결과. 짝이지 중복이 아님.
판단 룰 — probe scope → experiments/P{N}/00-plan.md, 그날 트랙 운영 → runs/daily-log/, 본실험 가로지르는 메타 결정 → history/. 모호하면 history/.
현재 상태
섹션 제목: “현재 상태”| Probe | 상태 | 결정 |
|---|---|---|
| P1. Trajectory 자동 추출 | ⬜ 대기 | — |
| P2. 함수호출 0회 fail 룰 | ⬜ 대기 (P1 의존) | — |
| P3. pass^3 boolean 재정의 | ⬜ 대기 | — |
| P4. fork 트리거 임계 완화 | ⬜ 대기 (P3 의존) | — |
| P5. I5 2-차원 분해 | ⬜ 대기 (P1 권장) | — |
| P6. TTC × 품질 페어 산점도 | ⬜ 대기 (P5 의존) | — |
| P7. LLM-as-judge ρ 시범 | ⬜ 대기 (P5 의존) | — |
| P8. Memory 1축 | ⬜ 대기 (P3 의존) | — |
| P9. L1 통합 분석 | ⬜ 대기 (P1~P8 의존) | — |
진행 상태 라벨: ⬜ 대기 / 🔄 진행 / ✅ 채택 / ❌ 폐기 / ⏸ 보류(v2)
시리즈 종료 후
섹션 제목: “시리즈 종료 후”P1~P9 중 적어도 5건 채택 + P4(트리거 임계) 결정 + P9(L1 통합) 잠정 결론까지 도달하면 본 운용 v2 진입 검토. 자세한 진입 조건은 00-plan.md §6.
본 시리즈가 무엇이 아닌가
섹션 제목: “본 시리즈가 무엇이 아닌가”- 본 운용(v2)이 아님 — probe 시리즈는 평가 프레임의 검증대. v2는 그 검증을 통과한 측정 도구로 굴리는 본 운용.
- 이전 cascade(02·04·07 등 7~9 doc 동시 갱신)의 대체가 아님 — cascade로 박힌 골격은 P1 진입 전제로 살아있음. 각 probe 결과에 따라 02·04·07을 작은 단위로 갱신.
- 사전 작성 다 끝나면 시작이 아님 —
00-plan.md만 사전. 각 P*-….md는 그날 작성, 그날 채움.