콘텐츠로 이동

[보관] 실험 시리즈 (Experiments)

이 폴더는 hamster-lab의 실제 실험 들이 누적되는 자리다. 본 시리즈의 가설 한 줄:

“학습 시리즈(study/)에서 도출된 평가 패치들이 우리 실험(L1/L2/L3)에 진짜로 통찰을 더하는가 — 한 번에 다 박지 말고, 하루 1 패치씩 검증하며 누적한다.”

  • 시리즈 소개·운영 규칙·현재 상태 (이 파일)
  • 00-plan.md — 9 probe 순서·의존·진입/종료 규칙·v2 진입 조건
  • P{N}/ — 각 probe 폴더 (P1부터 적용). 안에 00-plan.md 메인 + 00-plan-easy.md 쉬운 짝 + 필요 시 0X-{slug}.md 보조. P2~P9는 진입 전엔 임시 단일 파일(P{N}-{slug}-easy.md)일 수 있음 — 진입 직전 폴더로 변환. probe 시작 직전 에 작성 (사전 일괄 작성 금지 — C8 정신)

(history/38 이후 적용 — 본실험 진행 기록을 history와 분리)

폴더무엇누가 읽나빈도
study/평가 학습 노트 (문헌 리뷰)어휘를 익힐 때부정기
experiments/probe 단위 진행P{N}/00-plan.md(예: P1/00-plan.md)에 시작·결정·결과·이슈·실패 누적. easy 짝은 같은 폴더의 00-plan-easy.md실험 진행자, 후속자probe당
runs/daily-log/트랙별 일일 운영 일지 (Track A/B 각자)트랙 진행 추적매일 1개/트랙
runs/ (그 외)raw 채집 (CSV·JSONL·diary·tool_map)C7의 3단 채집 원천자동/매일
/daily/사용자 보고용 일일 리포트 (history/37에서 루트로 격상)비개발자/이해관계자매 probe 종료 시 2개 (easy + detailed)
history/셋업·설계 commit (38번까지) + 본실험 중 메타 결정만 (39~)방법론 진화 따라가는 사람메타 결정 발생 시
logs/history-${EXPERIMENT_TOOL}.jsonl자동 raw hook 로그 (트랙별 분리)재현·감사자동 (전 툴콜)

study/experiments/같은 패치를 두 시각으로 다룬다 — study는 왜·무엇, experiments는 언제·어떻게·결과. 짝이지 중복이 아님.

판단 룰 — probe scope → experiments/P{N}/00-plan.md, 그날 트랙 운영 → runs/daily-log/, 본실험 가로지르는 메타 결정 → history/. 모호하면 history/.

Probe상태결정
P1. Trajectory 자동 추출⬜ 대기
P2. 함수호출 0회 fail 룰⬜ 대기 (P1 의존)
P3. pass^3 boolean 재정의⬜ 대기
P4. fork 트리거 임계 완화⬜ 대기 (P3 의존)
P5. I5 2-차원 분해⬜ 대기 (P1 권장)
P6. TTC × 품질 페어 산점도⬜ 대기 (P5 의존)
P7. LLM-as-judge ρ 시범⬜ 대기 (P5 의존)
P8. Memory 1축⬜ 대기 (P3 의존)
P9. L1 통합 분석⬜ 대기 (P1~P8 의존)

진행 상태 라벨: ⬜ 대기 / 🔄 진행 / ✅ 채택 / ❌ 폐기 / ⏸ 보류(v2)

P1~P9 중 적어도 5건 채택 + P4(트리거 임계) 결정 + P9(L1 통합) 잠정 결론까지 도달하면 본 운용 v2 진입 검토. 자세한 진입 조건은 00-plan.md §6.

  • 본 운용(v2)이 아님 — probe 시리즈는 평가 프레임의 검증대. v2는 그 검증을 통과한 측정 도구로 굴리는 본 운용.
  • 이전 cascade(02·04·07 등 7~9 doc 동시 갱신)의 대체가 아님 — cascade로 박힌 골격은 P1 진입 전제로 살아있음. 각 probe 결과에 따라 02·04·07을 작은 단위로 갱신.
  • 사전 작성 다 끝나면 시작이 아님00-plan.md 만 사전. 각 P*-….md는 그날 작성, 그날 채움.