앞서 본 [Short Shot] 이야기는 단순한 소설이 아니다. 철저한 수학적 계산 위에 지어진 성과 같다. 교과서에서 배우는 ‘전통적 베이즈 정리’가 현장에서 쓰이는 ‘오즈와 베이즈 인자’로 어떻게 변환되는지, 그 수학적 청사진(Blueprint)을 공개한다.
1. 교과서의 방식 (The Probability View)
아래 방정식이 우리가 학교에서 배우는 베이즈 정리의 원형이다. 핵심은 분모를 통해 전체 확률의 합이 항상 1(100%)이 되도록 정규화(Normalization) 한다는 것이다.
이때 우도 P(D|H)—즉, 가설 H가 참일 때 해당 데이터가 관측될 확률—는 데이터의 성격에 따라 그 분포가 결정된다. 앞서 본 ‘Short Shot’ 시나리오의 경우, 온도(HT)와 압력(HP)이라는 두 가지 가설 하에 ‘불량’ 또는 ‘양품’이라는 결과만 존재한다. 이를 1과 0으로 치환하면, 개별 데이터는 전형적인 베르누이 확률분포(Bernoulli Distribution)를 따르게 된다.
$$P(H|D) = \frac{P(D|H) P(H)}{P(D)}$$
- P(H/D) : 사후확률(데이터를 본 뒤의 믿음, 신뢰도, 확률, 확률분포)
- P(D/H) : 우도 (가설이 맞을 때 데이터가 나올 확률)
- P(H) : 사전확률 (기존의 믿음)
- P(D) : 증거의 확률 (모든 가설을 통합한 데이터 발생 확률)
현장의 계산 실무적 문제점
여기서 분모인 를 계산하는 게 골치 아프다. 모든 가설의 확률을 다 더해야 하기 때문이다.
… (가설이 많아지면 계산이 폭발할 뿐 아니라, 실전에서 모르는 경우가 대부분이다)
.
2. 이야기 속의 방식: The Odds View
오즈(Odds) 계산법은 가설 검정형 베이지안 추론을 수행하는 또 다른 강력한 접근 방식이다. 이 방식의 핵심은 ‘주관적 확률(Subjective Probability)’을 적극적으로 활용한다는 점이다.
경영 현장의 관리자들은 저마다 다른 직관과 경험적 신념을 가지고 있다. 오즈 프레임워크는 이러한 개인의 주관을 배제하는 것이 아니라, 오히려 이를 체계적이고 일관성 있게 관리할 수 있는 도구로 전환해 준다. 관리자는 자신의 초기 신념을 오즈로 수치화하고, 새로운 증거(데이터)가 들어올 때마다 이를 반영하여 확률을 지속적으로 업데이트한다.
이 반복적인 과정을 통해 관리자는 자신의 직관이 실제 데이터와 얼마나 부합하는지 검증하며 의사결정의 품질을 높여갈 수 있다. 무엇보다 기술적인 관점에서, 발생 가능한 모든 데이터의 경우의 수를 고려해야 하는 ‘골치 아픈 분모 P(D)를 계산할 필요가 없다는 점은 실무적으로 큰 강점이다
[경영자를 위한 오즈(Odds) 프레임워크의 가치]
- 주관의 체계화: 관리자마다 다른 직관과 신념(주관적 확률)을 일관된 수치로 관리하는 프레임워크 제공.
- 동적 의사결정: “신념 설정 → 데이터 반영 → 신념 업데이트”의 반복 루프를 통해 의사결정의 정합성 검증.
- 계산의 효율성: 오즈 방식을 사용함으로써, 전체 확률을 계산해야 하는 복잡한 분모 P(D) 연산을 제거하여 신속한 의사결정 지원.
$$\text{Posterior Odds} = \text{Prior Odds} \times \text{Bayes Factor}$$
- Odds(오즈): 가설 A가 가설 B보다 몇 배 유력한가? (비율)
- Bayes Factor(베이즈 인자): 데이터가 가설 A를 가설 B보다 몇 배 더 지지하는가? (힘의 비율)
.
3. 완벽한 일대일 대응 (The Mapping)
자, 이제 마법을 부려보자. 어떻게 ‘복잡한 확률 공식’이 ‘심플한 오즈 공식’으로 변신할까? 우리는 두 개의 가설, 온도(HT)와 압력(HP)을 가지고 있다. 아래 각각의 전통적 베이즈 식을 정리해 본다.
식 A (온도가 범인이라는 온도가설에 대한 식):
$$P(H_T|D) = \frac{P(D|H_T) P(H_T)}{P(D)}$$
식 B (압력이 법인이라는 압력가설에 대한 식):
$$P(H_P|D) = \frac{P(D|H_P) P(H_P)}{P(D)}$$
이제 [식 A]를 [식 B]로 나누어 본다. 그러면 놀라운 일이 벌어진다.
$$\frac{P(H_T|D)}{P(H_P|D)} = \frac{\frac{P(D|H_T) P(H_T)}{P(D)}}{\frac{P(D|H_P) P(H_P)}{P(D)}}$$
분모와 분자에 똑같이 있는 골칫덩어리 P(D)가 약분되어 사라진다! (펑!)
남은 것들을 정리하면 바로 우리가 이야기에서 썼던 그 공식이 된다.
$$\underbrace{\frac{P(H_T|D)}{P(H_P|D)}}_{\text{Posterior Odds}} = \underbrace{\frac{P(D|H_T)}{P(D|H_P)}}_{\text{Bayes Factor}} \times \underbrace{\frac{P(H_T)}{P(H_P)}}_{\text{Prior Odds}}$$
핵심 포인트
- 전통적 방식의 사후확률 비율 → Posterior Odds
- 전통적 방식의 우도 비율 → Bayes Factor
- 전통적 방식의 사전확률 비율 → Prior Odds
결국 오즈(Odds) 방식은 새로운 수학이 아니라, 복잡한 정규화 상수 P(D)를 제거하여 계산을 효율화한 베이즈 정리의 현장 버전이다.
.
4. 실제 데이터 대입 (검증)
이야기 속 ‘오전 데이터(50개 중 5개 불량)’를 양쪽 방식에 넣어 똑같은 결과가 나오는지 확인해 보자
A. 이야기 속 방식 (Odds & Bayes Factor)
- Prior Odds: 0.6 / 0.4 = 1.5
- Bayes Factor: (계산값)
- Posterior Odds: 1.5 x 4.7 = 7.05
- 최종 확률:
B. 전통적 방식 (Probability)
- 우도 계산(베르누이분포, P=불량률, k=불량수량, n=샘플수량): Pk * (1-P)n-k
- 온도 우도
- 압력 우도
- (여기서 A는 B의 약 4.7배이다. 직접 계산해 보라)
- 증거 확률 P(D) 계산:
- 사후 확률 P(HT|D):
- 이 복잡한 식을 계산기로 두드리면? 놀랍게도 정확히 가 나온다.
결론 (Writer’s Conclusion)
우리는 왜 오즈(Odds) 방식을 쓸까?
전통적 방식은 매번 P(D)라는 전체 합계를 구해야 해서, 데이터가 계속 들어오는 스트리밍 상황(Loop)에서는 계산이 느려진다.
반면 오즈 방식은 단순 곱셈만 계속하면 된다.
이것이 바로 현장의 엔지니어와 AI가 베이즈를 사랑하는 이유이자, 이야기 속에서 오즈방식을 쓴 이유이다.
