Algol-1이란 무엇인가\n\nAlgol-1은 우제트 베이스볼(WooZ Baseball)의 핵심 승률 예측 AI 모델입니다. 페르세우스자리 알골(Algol) 별에서 이름을 딴 이 모델은 이진 별(binary star) 시스템처럼 두 팀의 전력을 실시간으로 비교하여 현재 승리 확률을 0~100% 사이의 연속값으로 출력합니다.\n\n2024년 초 첫 프로토타입부터 시작해 현재 2.3 버전까지 약 18개월간 지속적으로 개선되어 왔습니다. 이 글에서는 Algol-1의 학습 데이터, 모델 구조, 실시간 업데이트 메커니즘, 그리고 한계까지 투명하게 공개합니다.\n\n### 학습 데이터: 20,000경기 이상의 KBO 히스토리\n\nAlgol-1은 2015~2025년 KBO 정규시즌 및 포스트시즌 총 20,847경기의 플레이 바이 플레이 데이터를 학습했습니다.\n\n각 경기에서 추출한 피처(Feature)는 총 147개이며, 주요 카테고리는 다음과 같습니다.\n\n- **팀 전력 지표**: 최근 15경기 팀 wRC+, FIP, 불펜 BFI\n- **이닝별 상황**: 현재 이닝·아웃카운트·주자 상황·타점 차이\n- **타순 매칭**: 다음 타석 타자의 상대 투수 유형별 wRC+\n- **구장 보정**: 홈/원정 파크 팩터 및 기상 데이터\n- **역사적 상성**: 해당 팀 간 최근 3년 맞대결 승률\n\n### 모델 구조: Gradient Boosting 앙상블\n\nAlgol-1의 핵심 알고리즘은 XGBoost, LightGBM, CatBoost 세 가지 Gradient Boosting 모델의 앙상블입니다.\n\n각 모델은 동일한 피처를 독립적으로 학습하지만 하이퍼파라미터 튜닝 전략이 다르게 설정됩니다. 세 모델의 예측값을 가중 평균(Weighted Average)으로 결합할 때, 가중치는 각 모델이 검증 세트에서 보인 로그 손실(Log Loss)에 반비례합니다.\n\n**검증 세트(2025 시즌) 성능:**\n- 경기 시작 시 예측 정확도: 72.3%\n- 5회 종료 후: 81.4%\n- 8회 종료 후: 89.1%\n- 9회 2아웃 이후: 96.8%\n\n### 실시간 업데이트: 340ms 안에 결과를 내는 방법\n\n경기 중 매 플레이가 끝날 때마다 Algol-1은 147개 피처를 재계산하고 새로운 승률을 출력합니다. 초기 프로토타입은 이 과정에 평균 1.8초가 걸렸는데, TV 중계 딜레이(8~12초) 안에는 들어오더라도 앱 사용자 경험에 충분하지 않다고 판단했습니다.\n\n최적화를 통해 현재 평균 응답 시간은 340ms입니다. 핵심 개선 방법은 두 가지였습니다.\n\n첫째, 경기 중 변하지 않는 정적 피처(팀 전력 지표, 역사적 상성, 파크 팩터)는 경기 시작 전에 미리 계산해 캐시에 저장합니다. 매 플레이마다 재계산이 필요한 동적 피처는 이닝·아웃·주자 상황 등 12개에 불과합니다.\n\n둘째, 모델 추론(Inference) 자체를 경량화하여 풀 앙상블 대신 빠른 단일 모델이 실시간 업데이트를 담당하고, 풀 앙상블은 이닝 전환 시에만 호출합니다.\n\n### 이상 탐지 레이어: Algol-1이 놓칠 수 있는 것들\n\nAlgol-1은 정형화된 역사 데이터를 기반으로 학습했기 때문에, 역사에 없는 이례적인 상황에서 예측이 불안정해질 수 있습니다. 이를 보완하기 위해 별도의 이상 탐지(Anomaly Detection) 레이어를 운영합니다.\n\n예를 들어 에이스 투수의 경기 중 부상 교체, 비 또는 갑작스러운 기상 악화, 심판의 이례적인 보크 선언 등 과거 데이터에 드물게 등장하는 사건이 발생하면, Algol-1은 해당 시점의 예측 신뢰도를 낮추고 사용자에게 "현재 예측 불확실성 높음" 상태를 표시합니다.\n\n### Algol-1의 한계와 다음 버전\n\nAlgol-1이 아직 잘 포착하지 못하는 영역이 있습니다. 감독의 작전 결정(번트, 도루 시도, 투수 교체 타이밍)은 과거 패턴에서 어느 정도 예측되지만, 개인의 판단이 개입하는 영역은 예측 모델의 한계가 존재합니다.\n\n다음 버전(Algol-2)에서는 감독별 전술 결정 패턴을 별도 레이어로 학습하는 "Manager Agent" 모듈 추가를 검토하고 있습니다. KBO 10개 팀 감독의 이닝별·볼카운트별 전술 성향 데이터를 누적하면, 현재 예측이 갖는 불확실성의 상당 부분을 줄일 수 있을 것으로 기대합니다.