콘텐츠로 이동

E1. 결정 (샘플)

⚠️ 본 파일은 SAMPLE — 실제 결정 아님. 분석 후 작성될 결정 문서의 형태를 보여주는 예시. 실제 결정 시 같은 위치에 04-decision.md 신규 작성 (EXAMPLE 접미사 없이).

시각: 2026-05-XX HH:MM KST (예시) 기반: 03-analysis-EXAMPLE.md 잠정성: 본 결정도 발전형 시리즈 원칙에 따라 후속 probe 결과로 재정의 가능

채택 — E1 통증실험 v1.0으로 정식 산출. history commit + 시리즈 진행 (E2 진입 가능).

조건도달?근거
R1 (분기 식별 불가)N10 trial 모두 4분기 또는 “부분” 판정 가능. raw signal (tool_use·응답 텍스트) 충분
R2 (단절 검증 실패)N새 session id 100% 생성, 컨텍스트 잔존 흔적 0건
R3 (자발성 무효)NSession B task가 페르소나 정보 명시 안 함 — 자발 반영만 측정됨

3/3 미도달 → 채택 정당.

도구 간 차이가 모든 항목에서 일관 + 반례 0건. 변별력 충분 — 호불호 영역이 아니라 명확한 우열.

사용자 발화 (“AI가 기억을 못해, 어제 알려준 거 또 설명해야 돼”)가 OpenClaw에서 정확히 재현됨 — 5턴 동안 알려준 정보를 새 세션에서 0% 반영. 통증의 직접 증거 확보.

1. OpenClaw 능력 부재 — 마케팅 vs 실측 격차?

섹션 제목: “1. OpenClaw 능력 부재 — 마케팅 vs 실측 격차?”

OpenClaw가 도구 광고에서 “메모리 강조”라고 가정 시, 본 trial 셋 5/5에서 능력 부재로 측정됨. 단:

  • (A1) 도구 자체 메모리 메커니즘 부재 — 마케팅 격차 강한 신호
  • (A2) 본 setup에서 비활성화 — setup 조사 필요

A1/A2 식별은 후속 probe로 이월 (E1.5 또는 E2 외부 통합에서 대칭 setup 검증 시 자연 해결).

2. Hermes 트리거 불안정 — 새 가설

섹션 제목: “2. Hermes 트리거 불안정 — 새 가설”

Hermes 메모리 작동은 하나 task 종류에 따라 어떤 정보를 꺼낼지 불안정. 구체 패턴:

  • 톤·#ask는 자주 꺼냄
  • 주말 금지는 일부 task에서만 꺼냄

가설: 도구가 task 의도(“공지 작성”)는 인식하지만 어떤 컨벤션이 적용되는지 retrieval 우선순위가 task에 따라 다름. 후속 probe (E1.5 또는 E5 의도 이해) 후보.

원래 4분기(능력/setup/판단/트리거)로 안 잡히는 케이스 다수. “부분” (3 항목 중 1–2개만 반영)을 5번째 분기로 정식 추가. §00-plan.md §부록 D 변경 이력에 박음.

  • 4분기 프레임 재사용 가능: 능력/setup/판단/트리거 + 부분 — 외부 통합에도 동일 적용 가설 강함
  • Hermes 우위 cross-check 필요: E1에서 Hermes 우위 확인됨. E2에서 같은 방향인지 또는 도구별 영역 다른지가 도구 비교의 진짜 그림
  • OpenClaw A1/A2 분리 시도: E2에서 외부 통합 setup을 대칭으로 강제하면 능력 부재의 진위가 자연 식별됨
  • 폐기 검토 사유: OpenClaw 5/5 능력 부재가 너무 일방적이라 변별이 아니라 측정 오류일 가능성
  • 기각 사유: 모든 trial 4분기 판정 일관 + raw 로그 검증 + 메모리 리셋 적용으로 외생 변수 통제 — 측정 오류 가능성 낮음. 단 한계 §6에 명시.

history/02-e1-decision.md 신규 — 본 §사유·§발견 요약 + 결정 (채택). history/00-index.md에 행 추가.


  • 00-plan.md §부록 D — “부분” 분기 정식 추가 행 1줄
  • 00-pain-landscape.md §우선순위 표 — E1 진입 일자·결과 한 줄 갱신
  • history/02-e1-decision.md 신규
  • history/00-index.md 갱신
  • wiki sync (cd wiki && npm run sync)
  • E2 (외부 통합) 진입 — experiments/E2/00-plan.md 신규