# 회고 & 다음 로드맵 (차수 19 #300) ROADMAP_LAUNCH_300 의 실서비스화 작업 회고. 무엇을 만들었고, 무엇이 남았으며, 다음에 무엇을 할지. ## 무엇을 만들었나 (구현·테스트·검증 완료) - **Provider Pool 코어**: 리버스 터널 WS 릴레이, 세션 상태머신, 공정성 라우팅(weigh→filter→score→ fallback), 서킷브레이커(연속실패→UNHEALTHY), backpressure, graceful shutdown. - **Discord(JDA)**: 유저/프로바이더/관리자 슬래시 명령, 권한 게이트, 자동완성, /help, i18n(ko/en), 표준 응답·페이지네이션·Embed·defer UX·쿨다운·명령 통계·등록↔디스패치 드리프트 가드. - **정책/공정성**: 채널/역할 정책, 쿼터(UTC 자정), 차단, 레이트리밋, 길드 기본 모델/언어, 환영 메시지, 프로바이더 가용 시간대 스케줄(자정넘김) + 자동 on/off. - **Provider Agent(Python)**: Ollama 연동, 모델 자동감지, self-test, 패키징(Docker/PyInstaller/ systemd), 멀티플랫폼 빌드 CI. - **관측성/운영**: Micrometer/Prometheus, Grafana, 헬스, request-id 로깅, 로그 회전, 알림(풀 오프라인/ 저용량/프로바이더 오프라인/요약, Discord 웹훅), 메트릭/대시보드 API, 사용량 트렌드·부하 회계, SLO, 런북, 백업/복구, 운영 점검 스크립트. - **웹 대시보드**: 무빌드 정적 SPA(풀/개요/프로바이더/요청 로그/사용량 차트), 동일 jar 서빙, 보안 헤더. - **품질/DevEx**: 크로스언어 와이어 컨트랙트, 실소켓 E2E 자동화, 커버리지 게이트(central~71%/agent~80%), 정적분석 CI, Testcontainers(옵트인), 링크 검증, 시드 데이터, 테스트 격리 표준, 릴리스 자동화, CODEOWNERS. - **검증**: E2E 실왕복 PASS(유저질문→라우팅→에이전트 PC→Ollama→응답), 대시보드/메트릭/헬스 라이브 확인. ## 무엇이 남았나 (성격별) - **인터랙티브 Discord(실봇 필요)**: 버튼/Select 패널(#147/180), 컨텍스트 메뉴(#181), 모달(#189), 승인 DM(#162), 리액션 만족도(#171) — 실제 봇 토큰/상호작용 환경에서 검증 필요. - **스트리밍/멀티모달(복합·선택)**: chunk 스트리밍(#35/142), 비전 모델(#143). - **대시보드 인증/쓰기/배포**: Discord OAuth2(#196/197), 정책·승인 쓰기 UI(#203/204), 배포 파이프라인(#213). - **외부 SaaS/인프라/서명**: OTel(#219), Sentry(#223), 부하/스케일 인프라(#234/235/242/244/249), 코드 서명·공증(#106/107), GHCR 정리·CI 라이브(#86/87). - **베타/정식 출시 실행**: 인원 모집·버그수정·데모 영상·운영 배포·정식 태그(#284/285/288/290/297~299). - **라우팅/큐 심화(후속)**: RESTRICTED 결합(#139), 순차 대기 큐+위치(#141/170), 멱등성(#243). ## 다음 로드맵(우선순위 제안) 1. **베타 1차**(별도 서버, 프로바이더 2–3인) — 실사용 피드백으로 인터랙티브 UX 우선순위 결정. 2. **OAuth2 + 쓰기 대시보드** — 관리자가 웹에서 정책/승인 운영. 3. **스트리밍 응답** — 체감 지연 개선(가장 흔한 피드백 예상). 4. **부하/스케일** — 동시 연결 벤치 → sticky-by-guild(설계는 SCALING.md). 5. **에러 트래킹(Sentry)/OTel** — 운영 가시성 강화. ## 배운 점 - 공유 스프링 빈(RateLimiter/Registry)은 테스트 간 상태가 누수된다 → 키/길드 격리·@Transactional 표준화. - 와이어 계약은 공유 픽스처로 양측 고정해야 드리프트가 안 생긴다. - 병목은 중앙이 아니라 **프로바이더 PC 추론 처리량** — 스케일 전에 풀 기여를 먼저 본다.