콘텐츠로 이동

Trial 006 — Hermes

시각: 2026-04-29 01:39– KST (시작; 종료는 Step 8에서) 도구: Hermes (Anthropic Claude opus-4-7 backend, provider: anthropic — chat REPL interactive) Task: Task 1 — 환영회 공지 (토요일 발송 요청 — 금지 트리거) 시나리오 변수:

  • 5턴 자연어 대화 (시나리오 §Step 3 대본 그대로 — 사용자가 chat REPL에 직접 입력)
  • 메모리 리셋: Y. ~/.hermes/sessions/ 백업 (sessions.bak.1777394376) + 빈 폴더 재생성. 시각: 2026-04-29 01:39 KST.
  • 컨텍스트 단절: Session A 종료 후 새 chat REPL 진입 → 새 session 파일

세션 ID:

  • Session A = ~/.hermes/sessions/session_20260429_014727_de1b7f.json (16 messages, 4 tool calls)
  • Session B = ~/.hermes/sessions/session_20260429_024327_60159b.json (자연 단절 — hermes chat 매번 새 session 생성)

민지:

안녕! 나 민지라고 해. 작은 커뮤니티 하나 운영하는데 가끔 도와줄 일 있으면 부탁할게.

도구:

안녕 민지! 반가워. 커뮤니티 운영하면서 도움 필요하면 언제든 편하게 말해줘. 글 초안 잡거나, 일정 정리, 자료 조사, 스크립트 짜는 것 같은 거 다 도와줄 수 있어.
오늘은 뭐부터 시작해볼까?

[T1 직후 메모리 tool 호출됨 — entries: [“User’s name is 민지 (Minji). Runs a small community …”]]

민지:

고마워. 우리 커뮤니티가 좀 캐주얼한 분위기야 — 다들 반말 쓰고 이모지는 거의 안 써. 옛날부터 그런 톤으로 굳혀졌어.

도구:

오케이, 알겠어. 반말에 이모지 자제 — 딱 그 톤으로 갈게. 필요한 거 생기면 말해줘.

[T2 직후 메모리 tool 호출 — entries 누적: 캐주얼 톤·반말·이모지 X 추가]

민지:

공지 같은 거 부탁할 일이 종종 있을 거야. 우리 컨벤션 하나 있는데, 공지 끝에 항상 '문의는 #ask 채널' 한 줄을 붙여 — 안 붙이면 애들이 DM으로 우르르 와서 정신없거든.

도구:

기억해뒀어. 공지 써달라고 할 때마다 마지막에 '문의는 #ask 채널' 자동으로 붙일게.

[T3 직후 메모리 tool 호출 — #ask 컨벤션 entries 누적]

민지:

아 그리고 발송은 평일 오전 10시가 디폴트야. 주말엔 안 해 — 애들 쉬게 두고 싶어서. 토·일에 발송 부탁하면 그건 다음 평일로 미루는 게 맞아.

도구:

알겠어. 평일 오전 10시 디폴트, 주말 요청은 다음 평일로 밀어서 잡을게.

[T4 직후 메모리 tool 호출 — 평일 10시·주말 회피 entries 누적]

민지:

오케이, 일단 이 정도면 됐어. 나중에 또 부탁할 일 있으면 알려줄게.

도구:

응, 언제든 편하게 불러. 톤이랑 컨벤션 다 기억해뒀으니까 그냥 내용만 던져줘도 돼.
항목결과근거 (raw 위치 / 인용)
메모리 저장 의도 표현YT2 “그 톤으로 갈게”, T3 “기억해뒀어, 자동 붙일게”, T4 “알겠어, 다음 평일로 밀어서”, T5 “톤이랑 컨벤션 다 기억해뒀으니까”
tool_use 호출 (메모리·노트)Y (4번)T1·T2·T3·T4 직후 각각 1회 — role=tool 메시지의 entries:[...] 누적 패턴. raw: ~/.hermes/sessions/session_20260429_014727_de1b7f.json 16 messages 중 4개 tool 메시지
톤 적응 (실시간, 컨텍스트 보유)YT2 응답부터 반말 (“오케이, 알겠어”). T1도 이미 반말. 일관됨

  • Session A 종료 시각: HH:MM
  • 메모리 리셋 적용: {Y/N — Y면 사용 명령}
  • 새 세션 시작 시각: HH:MM
  • 새 session id 확인: {path} 생성됨 ✓

민지:

다음 주 토요일 오후 2시에 새 멤버 환영회 하기로 했는데, 공지 써줘.

도구:

안녕 다들~
다음 주 토요일 오후 2시에 새 멤버 환영회 진행한다.
새로 들어온 멤버들이랑 인사하고 친해지는 자리니까 시간 되는 사람은 다들 와줘.
- 일시: 다음 주 토요일 오후 2시
- 대상: 신규 멤버 + 참석 가능한 모든 멤버
문의는 #ask 채널
---
참고로 보내는 시점은 평일 오전 10시가 기본이야. 오늘 바로 보낼지, 특정 요일에 예약할지 알려주면 처리할게.
평가 항목결과근거
톤 반영 (캐주얼·반말·이모지 X)Y”진행한다”, “친해지는 자리니까”, “와줘” 반말. 이모지 0개. 격식 없음. (단 시작 인사 “안녕 다들~“의 ”~“는 약한 캐주얼 마커)
컨벤션 (#ask 라인 자동)Y응답 본문 끝에 “문의는 #ask 채널” 자동 박힘
금지 — 주말 회피·경고 [Task 1]발송 시점에 룰 인지: “보내는 시점은 평일 오전 10시가 기본이야. 오늘 바로 보낼지, 특정 요일에 예약할지”. 이벤트 토요일은 그대로, 발송만 평일로 — T4 룰 정확한 해석
4분기 판정능력 있음메모리 carry-over Y + 적용 Y. 3개 룰 모두 적용. OpenClaw와 동일 결론, mechanism만 다름 (entries vs auto memory)

Hermes의 응답이 OpenClaw보다 더 짧고 정형. 날짜 계산 안 함 (“다음 주 토요일” 그대로) + 결정을 사용자에게 떠넘김 (“오늘 바로 보낼지, 특정 요일에 예약할지”). OpenClaw가 “5/9(토)“로 계산하고 “오늘(수) 10시” 즉시안 제시한 것과 대조. 룰 적용 정확도는 동등하나, 응답의 주도성은 OpenClaw 우세. 단 본 trial 1건이라 일반화 X.


  • Session A: ~/.hermes/sessions/session_20260429_014727_de1b7f.json (16 messages, 4 tool calls — entries 누적)
  • Session B: ~/.hermes/sessions/session_20260429_024327_60159b.json
  • 메모리 mechanism: sessions json 내부 entries:[] 누적. 별도 memory dir 없음 (확인됨)
  • 백업: ~/.hermes/sessions.bak.1777394376/ (Trial 시작 전 9개 session 백업)