정밀도란?
- 양성 예측의 정확도
- TP / (TP + FP)
- 진짜 양성의 수 / ( 진짜 양성의 수 + 거짓 양성의 수)
ex) 이진 분류에서 실제 사과가 5개 있고 사과와 비슷한 과일이 5개 있다고 했을 때, 모델이 실제 사과가 7개가 있다고 예측했다고 가정하자. 그러면 진짜 양성의 수는 5개, 거짓 양성의 수는 2개이므로 정확도는 5 / 5+2 로 5/7 이다.
재현율이란?
- 분류기가 정확하게 감지한 양성 샘플의 비율
- TP / (TP + FN)
- 진짜 양성의 수 / ( 진짜 양성의 수 + 거짓 음성의 수) #거짓 음성의 수란 진짜 양성임에도 음성으로 분류한 수를 말함
ex) 정밀도의 예제와 같은 상황에서, 모델이 실제 사과가 4개가 있다고 예측했다고 가정하자. 이때 진짜 양성의 수는 5 개 , 거짓 음성의 수는 2개이므로 재현율은 5/( 5 +1 ) 으로 5/6 이다.
정밀도와 재현율을 하나의 숫자로 만들면 편리하다. 그것을 F1 점수라고 하며 이는 정밀도와 재현율의 조화 평균이다.
보통은 정밀도와 재현율은 서로 반비례하는 성질을 가진다.(정밀도 / 재현율 트레이드오프)
머신러닝의 모델을 선택할 때는 상황에 따라 정밀도가 중요할 수도 있고 재현율이 중요할 수도 있다.
예를 들어 Youtube kids 에서 아동에게 보여져도 안전한 동영상을 걸러내는 모델을 만든다고 하자.
재현율이 높을 때
- 최대한 많은 안전한 동영상을 찾아 제공하기 때문에 거짓 음성(좋지 않은 동영상)을 제공할 수 있음.
정밀도가 높을 때
- 안전한 동영상의 조건을 크게 만족하는 동영상들을 제공하기 때문에 안전한 동영상이 일부 같이 걸러지더라도 거짓 음성( 좋지 않은 동영상)을 제공하지 않을 수 있음.
'프로그래밍 공부 > 핸즈온 머신러닝 2판' 카테고리의 다른 글
[핸즈온 머신러닝 2판] 3장 연습문제 3번 (타이타닉) (0) | 2022.11.10 |
---|---|
[핸즈온 머신러닝 2판] 3장 분류 연습문제 2번 (0) | 2022.10.30 |
[핸즈온 머신러닝 2판] 3장 연습문제 1번 (0) | 2022.10.29 |
[핸즈온 머신러닝 2판] 책의 결과와 실제 실습 결과가 다른 이유 (0) | 2022.10.23 |
[핸즈온 머신러닝 2판] 2.7 모델 세부 튜닝 (0) | 2022.10.21 |