베이지안네트워크
#
Find similar titles
-
최초 작성자
jheepark@insilicogen.com
- 최근 업데이트
Structured data
- Category
- Statistics
Table of Contents
베이지안 네트워크 #
배경 #
현재 많은 Task 들에 대해 딥러닝 기반 모델들이 훌륭한 성능을 내고 있으나, 이에 비해 어떤 방식으로 예측값을 도출하였는지에 대한 설명이 부족하기에 XAI 등 딥러닝 성능의 설명력 연구가 활발히 이루어지고 있습니다.
설명력 기반 모델로는 딥러닝 이전 통계 기반의 예측 방법으로 많은 주목을 받은 모델인 베이지안 네트워크(Bayesian Network)가 있습니다. 해당 알고리즘은 조건부 확률 기반의 모델로 예측에 대한 명확한 설명이 가능합니다.
베이지안 네트워크란? #
베이지안 네트워크는 확률 변수 간의 인과 관계를 그래프 형태로 나타낸 후 주어진 데이터에 대한 확률 변수의 분포를 학습하는 확률 그래프 모형입니다. 베이지안 네트워크는 방향성 비순환 그래프로서 그래프는 노드(Node)와 엣지(Edge)로 표현할 수 있습니다. 베이지안 네트워크에서 노드는 확률 변수가 되고, 엣지는 확률적인 관계가 됩니다.
베이즈 정리 #
베이지안 네트워크는 베이즈 정리(Bayes' theorem)를 기반으로 두는 모델입니다. 베이즈 정리는 어떤 사건이 서로 배반하는 원인 둘에 의해 일어난다는 전제하에 실제 사건이 일어났을 때 이것이 두 원인 중 하나일 확률을 구하는 정리로 조건부 확률의 정의를 바탕으로 도출합니다.
베이즈 정리 예제 #
예제 : 위암 환자로 판정되었을 때 진짜 위암 환자일 비율 P(G|+) 을 구하시오
- P(G) : 전체 위암 환자의 비율은 2%
- P(+|G) : 지표를 통해 실제 위암 환자를 정확하게 판정할 확률 98%
- P(+|Gc) : 위암 환자가 아닌 환자를 정확하게 판정할 확률 95% (위암 환자가 아닌 환자를 양성으로 오진할 확률 5%)
아래 수식에 따라 위암 환자 판정의 적중률은 약 28%라고 할 수 있습니다.
베이지안 네트워크의 활용 #
베이지안 네트워크는 생물 정보학, 약학, 문서분류, 영상처리 등의 분야에서 지식을 모형화하는 데 사용되고 있으며, 베이지안 네트워크의 확률값을 계산하여 예측이나 추론에서도 열거에 대한 추론, 변수 제거에 의한 추론, 샘플링을 이용한 근사치 추론 등 다양한 방법으로 활용되고 있습니다.
참고 #
- https://tmaxai.github.io/post/intro_bayes/
- https://comdolidol-i.tistory.com/148
- https://sumniya.tistory.com/29
- https://ko.wikipedia.org/wiki/%EB%B2%A0%EC%9D%B4%EC%A6%88_%EB%84%A4%ED%8A%B8%EC%9B%8C%ED%81%AC
- https://datascienceschool.net/03%20machine%20learning/17.02%20%EA%B7%B8%EB%9E%98%ED%94%84%20%ED%99%95%EB%A5%A0%EB%AA%A8%ED%98%95.html