claude code context window optimization

Claude Code를 쓰다 보면 대화 몇 턴 안 했는데 컨텍스트 윈도우가 50%를 넘기는 경험을 하게 된다. 원인은 대화 내용이 아니라 매 세션마다 자동 로드되는 시스템 컨텍스트였다.

실측 데이터

Contents Hub 프로젝트에서 /context 명령으로 실측한 토큰 분포:

대화는 전체의 9.7%인데, 자동 로드되는 것들이 25%를 차지한다.

가장 큰 비중을 차지하는 Memory files의 내역:

가장 큰 단일 파일. 28개 레슨이 전문 로드되는데, 대부분의 세션에서 과거 레슨 전체가 필요하지 않다. 오래된 레슨을 docs/archive/로 이동하고, 최근 10개만 유지하면 절반 이상 절감.

이 3개 파일의 핵심 정보는 CLAUDE.md에 이미 포함되어 있다. 중복 로드를 피하고, 필요할 때만 @SPEC.md로 명시적으로 참조하면 된다.

배포 아키텍처 ASCII art, JWT 발급 코드 블록, 상세 체크리스트 등 "참조용" 내용을 docs/로 분리. CLAUDE.md에는 규칙과 제약만 남긴다.

Skills 5k + Custom agents 1.2k 중 실제 자주 쓰는 것은 소수. document-skills, example-skills 같은 중복 플러그인이 각각 로드되고 있다.

대화보다 설정이 더 크다 - 실제 대화는 전체의 10% 미만. "컨텍스트가 빨리 찬다"는 느낌의 주 원인은 대화가 아니라 자동 로드되는 문서.
CLAUDE.md는 "규칙서"이지 "백과사전"이 아니다 - 프로젝트가 성장하면서 CLAUDE.md에 모든 정보를 담게 되면, 매 세션마다 불필요한 컨텍스트를 지불하게 된다.
LESSONS.md는 축적의 역설 - 교훈을 많이 기록할수록 좋지만, 그만큼 매 세션의 "입장료"가 비싸진다. 주기적 archive가 필수.
/context 명령을 습관화 - 체감이 아니라 실측으로 병목을 찾아야 한다. 토큰 분포를 보면 어디를 줄여야 할지 명확해진다.

1+2번만 해도 대화에 ~15k 토큰의 여유가 생긴다. 이는 대화 약 7-8턴 분량이다.