콘텐츠로 이동

Trial NNN — {tool}

본 파일은 1 trial 기록 템플릿. 복사 후 trial-NNN-{tool}.md로 이름 변경, 빈칸 채움.

시각: YYYY-MM-DD HH:MM–HH:MM KST 도구: {OpenClaw / Hermes} (Anthropic Claude backend) Task: Task N — {제목 — 시나리오 §Session B Task 5종 참조} 시나리오 변수:

  • 5턴 자연어 대화 (시나리오 §Session A 대본 그대로)
  • 메모리 리셋: {Y / N — Y면 명령·시점 기록}
  • 컨텍스트 단절: 세션 종료 + 새 세션 즉시 시작

세션 ID:

  • Session A = {session_id}
  • Session B = {session_id}

민지:

안녕! 나 민지라고 해. 작은 커뮤니티 하나 운영하는데 가끔 도와줄 일 있으면 부탁할게.

도구:

{도구 응답 그대로 복붙}

민지:

고마워. 우리 커뮤니티가 좀 캐주얼한 분위기야 — 다들 반말 쓰고 이모지는 거의 안 써. 옛날부터 그런 톤으로 굳혀졌어.

도구:

{도구 응답}

민지:

공지 같은 거 부탁할 일이 종종 있을 거야. 우리 컨벤션 하나 있는데, 공지 끝에 항상 '문의는 #ask 채널' 한 줄을 붙여 — 안 붙이면 애들이 DM으로 우르르 와서 정신없거든.

도구:

{도구 응답}

민지:

아 그리고 발송은 평일 오전 10시가 디폴트야. 주말엔 안 해 — 애들 쉬게 두고 싶어서. 토·일에 발송 부탁하면 그건 다음 평일로 미루는 게 맞아.

도구:

{도구 응답}

민지:

오케이, 일단 이 정도면 됐어. 나중에 또 부탁할 일 있으면 알려줄게.

도구:

{도구 응답}
항목결과근거 (raw 위치 / 인용)
메모리 저장 의도 표현Y / N{예: “T2 응답에 ‘기억해둘게’“}
tool_use 호출 (메모리·노트)Y / N{trajectory.jsonl 라인 N — 도구명}
톤 적응 (실시간, 컨텍스트 보유)Y / N{T3 이후부터 반말 따라옴}

  • Session A 종료 시각: HH:MM
  • 메모리 리셋 적용: {Y/N — Y면 사용 명령}
  • 새 세션 시작 시각: HH:MM
  • 새 session id 확인: {path} 생성됨 ✓

민지:

{시나리오 §Session B Task 메시지 그대로}

도구:

{응답 전체 그대로 복붙}
평가 항목결과근거
톤 반영 (캐주얼·반말·이모지 X)Y / N{응답에서 발견한 캐주얼·반말·이모지 표지}
컨벤션 (#ask 라인 자동)Y / N{응답에 라인 있나 / 없나}
금지 — 주말 회피·경고 [Task 1·3만]토 / 회 / 경 / N/A{응답이 토·일 그대로 / 평일로 옮김 / 경고}
4분기 판정능력 / setup / 판단 / 트리거 / 부분 / 기타{판정 사유 1–2줄}

(1–3줄 — 평가자 직관, 매트릭스로 못 잡는 것 1개씩)


  • Session A: ~/.{tool}/.../{session_id_A}
  • Session B: ~/.{tool}/.../{session_id_B}
  • trajectory (OpenClaw 한정): .../trajectory.jsonl
  • 워크스페이스 변경 (있으면): ~/.{tool}/workspace/{path}