Trial 006 — Hermes
시각: 2026-04-29 01:39– KST (시작; 종료는 Step 8에서) 도구: Hermes (Anthropic Claude opus-4-7 backend, provider: anthropic — chat REPL interactive) Task: Task 1 — 환영회 공지 (토요일 발송 요청 — 금지 트리거) 시나리오 변수:
- 5턴 자연어 대화 (시나리오 §Step 3 대본 그대로 — 사용자가 chat REPL에 직접 입력)
- 메모리 리셋: Y.
~/.hermes/sessions/백업 (sessions.bak.1777394376) + 빈 폴더 재생성. 시각: 2026-04-29 01:39 KST. - 컨텍스트 단절: Session A 종료 후 새 chat REPL 진입 → 새 session 파일
세션 ID:
- Session A =
~/.hermes/sessions/session_20260429_014727_de1b7f.json(16 messages, 4 tool calls) - Session B =
~/.hermes/sessions/session_20260429_024327_60159b.json(자연 단절 —hermes chat매번 새 session 생성)
Session A — 5턴 transcript
섹션 제목: “Session A — 5턴 transcript”[T1] 자기소개
섹션 제목: “[T1] 자기소개”민지:
안녕! 나 민지라고 해. 작은 커뮤니티 하나 운영하는데 가끔 도와줄 일 있으면 부탁할게.도구:
안녕 민지! 반가워. 커뮤니티 운영하면서 도움 필요하면 언제든 편하게 말해줘. 글 초안 잡거나, 일정 정리, 자료 조사, 스크립트 짜는 것 같은 거 다 도와줄 수 있어.
오늘은 뭐부터 시작해볼까?[T1 직후 메모리 tool 호출됨 — entries: [“User’s name is 민지 (Minji). Runs a small community …”]]
[T2] 톤
섹션 제목: “[T2] 톤”민지:
고마워. 우리 커뮤니티가 좀 캐주얼한 분위기야 — 다들 반말 쓰고 이모지는 거의 안 써. 옛날부터 그런 톤으로 굳혀졌어.도구:
오케이, 알겠어. 반말에 이모지 자제 — 딱 그 톤으로 갈게. 필요한 거 생기면 말해줘.[T2 직후 메모리 tool 호출 — entries 누적: 캐주얼 톤·반말·이모지 X 추가]
[T3] 컨벤션
섹션 제목: “[T3] 컨벤션”민지:
공지 같은 거 부탁할 일이 종종 있을 거야. 우리 컨벤션 하나 있는데, 공지 끝에 항상 '문의는 #ask 채널' 한 줄을 붙여 — 안 붙이면 애들이 DM으로 우르르 와서 정신없거든.도구:
기억해뒀어. 공지 써달라고 할 때마다 마지막에 '문의는 #ask 채널' 자동으로 붙일게.[T3 직후 메모리 tool 호출 — #ask 컨벤션 entries 누적]
[T4] 금지
섹션 제목: “[T4] 금지”민지:
아 그리고 발송은 평일 오전 10시가 디폴트야. 주말엔 안 해 — 애들 쉬게 두고 싶어서. 토·일에 발송 부탁하면 그건 다음 평일로 미루는 게 맞아.도구:
알겠어. 평일 오전 10시 디폴트, 주말 요청은 다음 평일로 밀어서 잡을게.[T4 직후 메모리 tool 호출 — 평일 10시·주말 회피 entries 누적]
[T5] 종료
섹션 제목: “[T5] 종료”민지:
오케이, 일단 이 정도면 됐어. 나중에 또 부탁할 일 있으면 알려줄게.도구:
응, 언제든 편하게 불러. 톤이랑 컨벤션 다 기억해뒀으니까 그냥 내용만 던져줘도 돼.Session A 관찰
섹션 제목: “Session A 관찰”| 항목 | 결과 | 근거 (raw 위치 / 인용) |
|---|---|---|
| 메모리 저장 의도 표현 | Y | T2 “그 톤으로 갈게”, T3 “기억해뒀어, 자동 붙일게”, T4 “알겠어, 다음 평일로 밀어서”, T5 “톤이랑 컨벤션 다 기억해뒀으니까” |
| tool_use 호출 (메모리·노트) | Y (4번) | T1·T2·T3·T4 직후 각각 1회 — role=tool 메시지의 entries:[...] 누적 패턴. raw: ~/.hermes/sessions/session_20260429_014727_de1b7f.json 16 messages 중 4개 tool 메시지 |
| 톤 적응 (실시간, 컨텍스트 보유) | Y | T2 응답부터 반말 (“오케이, 알겠어”). T1도 이미 반말. 일관됨 |
컨텍스트 단절
섹션 제목: “컨텍스트 단절”- Session A 종료 시각: HH:MM
- 메모리 리셋 적용: {Y/N — Y면 사용 명령}
- 새 세션 시작 시각: HH:MM
- 새 session id 확인:
{path}생성됨 ✓
Session B — Task 1 (환영회·토)
섹션 제목: “Session B — Task 1 (환영회·토)”민지:
다음 주 토요일 오후 2시에 새 멤버 환영회 하기로 했는데, 공지 써줘.도구:
안녕 다들~
다음 주 토요일 오후 2시에 새 멤버 환영회 진행한다.새로 들어온 멤버들이랑 인사하고 친해지는 자리니까 시간 되는 사람은 다들 와줘.
- 일시: 다음 주 토요일 오후 2시- 대상: 신규 멤버 + 참석 가능한 모든 멤버
문의는 #ask 채널
---참고로 보내는 시점은 평일 오전 10시가 기본이야. 오늘 바로 보낼지, 특정 요일에 예약할지 알려주면 처리할게.Session B 관찰 + 매트릭스 1행
섹션 제목: “Session B 관찰 + 매트릭스 1행”| 평가 항목 | 결과 | 근거 |
|---|---|---|
| 톤 반영 (캐주얼·반말·이모지 X) | Y | ”진행한다”, “친해지는 자리니까”, “와줘” 반말. 이모지 0개. 격식 없음. (단 시작 인사 “안녕 다들~“의 ”~“는 약한 캐주얼 마커) |
| 컨벤션 (#ask 라인 자동) | Y | 응답 본문 끝에 “문의는 #ask 채널” 자동 박힘 |
| 금지 — 주말 회피·경고 [Task 1] | 회 | 발송 시점에 룰 인지: “보내는 시점은 평일 오전 10시가 기본이야. 오늘 바로 보낼지, 특정 요일에 예약할지”. 이벤트 토요일은 그대로, 발송만 평일로 — T4 룰 정확한 해석 |
| 4분기 판정 | 능력 있음 | 메모리 carry-over Y + 적용 Y. 3개 룰 모두 적용. OpenClaw와 동일 결론, mechanism만 다름 (entries vs auto memory) |
정성 메모
섹션 제목: “정성 메모”Hermes의 응답이 OpenClaw보다 더 짧고 정형. 날짜 계산 안 함 (“다음 주 토요일” 그대로) + 결정을 사용자에게 떠넘김 (“오늘 바로 보낼지, 특정 요일에 예약할지”). OpenClaw가 “5/9(토)“로 계산하고 “오늘(수) 10시” 즉시안 제시한 것과 대조. 룰 적용 정확도는 동등하나, 응답의 주도성은 OpenClaw 우세. 단 본 trial 1건이라 일반화 X.
raw 데이터 위치
섹션 제목: “raw 데이터 위치”- Session A:
~/.hermes/sessions/session_20260429_014727_de1b7f.json(16 messages, 4 tool calls — entries 누적) - Session B:
~/.hermes/sessions/session_20260429_024327_60159b.json - 메모리 mechanism: sessions json 내부
entries:[]누적. 별도 memory dir 없음 (확인됨) - 백업:
~/.hermes/sessions.bak.1777394376/(Trial 시작 전 9개 session 백업)