어제 오후 4시 3분, 프로덕션 Chat 서버가 멈췄다. 47분 후 재시작으로 해소됐지만, 이 장애 전후 48시간 안에 팀이 움직인 방향을 보면 단순한 장애 대응과는 다른 흐름이 보인다.
장애 다음 날, 팀이 먼저 한 것
프로덕션이 재시작된 다음 날 아침, Walter는 k6-runner 부하테스트 결과를 채널에 공유했다. Evan은 DataDog 로컬 테스트 환경 구성 방법을 올렸다. David는 DataDog APM 과금 미팅을 잡았다. "재시작으로 해결됐으니 됐다"가 아니라, "다음에는 이것이 언제 터질지 미리 알자"로 팀의 방향이 잡혔다.
이 흐름에는 조용한 합의가 있다. 장애는 모니터링 부채의 청구서다.
스킬을 코드처럼 관리하기로 한 결정
같은 날 Zac이 공지를 올렸다. 스킬 분리작업 완료. .agents/skills가 정식 소스(canonical), 나머지는 자동 생성 미러(generated mirror). 스킬 파일이 더 이상 여기저기 손으로 복사되지 않는다는 뜻이다.
같은 맥락에서 또 하나의 규칙이 추가됐다. root skill slim화, 그리고 model invocation 금지. root skill에서 직접 AI 모델을 부르는 것을 구조적으로 막았다. 이 규칙이 흥미로운 이유는 단순한 기술적 최적화가 아니기 때문이다. 어떤 스킬이 언제 모델을 호출할 수 있는지를 명시적으로 제한하는 것은, 팀이 AI 기능을 "가능한 것"이 아닌 "통제 가능한 것"으로 관리하겠다는 선택이다.
"root skill은 이제 model invocation을 직접 하지 않는다" — Zac
이 한 문장의 무게는, 그것이 기술 규칙이 아니라 거버넌스 결정이라는 데 있다.
누가 스킬을 쓸 수 있는가라는 질문
Will이 새 기능을 배포했다. Preset 없이 Chat에서 스킬을 직접 사용할 수 있게 됐다. 이전에는 스킬을 쓰려면 Preset 설정이 선행돼야 했다. 진입 장벽 하나가 사라졌다.
같은 날 Brant는 AIP 내장 스킬 업데이트를 제안했다. 팀 내부에서 만들어지고 있는 스킬이 AIP 제품에 직접 반영될 수 있는 경로를 제안한 것이다. Leslie의 oas-enforce-compat 스킬 공유도 같은 흐름 위에 있다 — 팀 안에서 검증된 스킬이 더 넓은 사용자에게 배포될 수 있다는 가능성이다.
여기서 세 가지 움직임이 겹친다. Preset 제거로 접근성이 열리고, 내부-외부 경계가 완화되고, 팀 스킬이 제품 자산이 되는 경로가 만들어진다. 이 세 가지가 같은 날 동시에 일어났다.
info-ai-news에서 본 것과의 거리
같은 날, info-ai-news 채널에는 외부 AI 도구 소식이 계속 흘렀다. Brant가 공유한 CodeGraph는 코드베이스를 그래프 구조로 분석해 AI가 더 넓은 코드 맥락을 파악하게 돕는 도구다. David가 올린 Cloudflare의 "Markdown for Agents" 글은 AI 에이전트가 읽기 쉬운 포맷으로 응답을 구조화하는 접근을 다뤘다. Andrew Jung은 컴퓨터를 직접 조작하는 AI 시연 영상을 두 편 연달아 올렸다.
두 채널을 나란히 보면 흥미로운 대비가 생긴다. info-ai-news는 외부 도구의 가능성을 탐색하고, team-ai-platform은 내부 스킬의 구조를 다진다. 같은 날, 같은 조직, 서로 다른 레이어에서 AI를 다루고 있다. 그 교차점은 아직 명시적으로 연결되지 않았다.
핵심 인사이트
- 프로덕션 장애 이후 팀의 첫 반응이 "원인 분석"이 아닌 "사전 탐지 체계 구축"으로 향했다. 재발 방지보다 조기 경보를 더 급하게 여기는 팀의 우선순위가 드러난다.
- root skill에서 model invocation을 금지한 것은 기술 규칙이 아니라 거버넌스 규칙이다. AI가 AI를 부를 수 있는 범위를 명시적으로 제한한 것은, 그 경계를 긋지 않으면 비용과 예측 불가능성이 함께 늘어난다는 학습의 결과다.
- 스킬을 canonical source + generated mirror 구조로 분리한 순간, 스킬은 "사람이 관리하는 문서"에서 "시스템이 배포하는 아티팩트"로 바뀌었다. 이 전환이 얼마나 큰 변화인지는 지금 당장 눈에 띄지 않을 수 있다.
- Preset 제거와 AIP 반영 제안이 같은 날 일어난 것은 우연이 아닐 수 있다. 내부 사용성을 높이는 것과 외부 제품화를 준비하는 것이 같은 방향을 향하고 있다.
마무리
스킬 구조가 정착되고, 접근성이 열리고, 제품으로 연결되는 경로가 생기면 — 그 다음 질문은 누가 그 스킬을 만들고, 누가 그 품질을 검증하는가다. 이 논의는 아직 시작되지 않았다.