<aside> ✏️ 예측하고자 하는 y변수가 이산형 값(discrete valued)를 가지는 경우
</aside>
2진분류(binary-class)
2개의 class로 분류하는 문제
$y∈{0,1}$
선형회귀 방식을 적용했을 경우 분류가 제대로 되지 않음
다중분류(multiclass classification)
여러개 의 class로 분류하는 문제
용어 주의!
= S자형 함수(sigmoid function)
$g(z)=\frac{1}{1+e^{-z}}$
가설함수로 로지스틱 함수 사용
로지스틱 회귀 모델
가설함수$h_\theta(x)$는 입력값 x에 대해서 y가 1일 확률을 추정하는 함수
$h_\theta(x) = P(y=1 | x ; \theta) = 1 - P(y=0 | x ; \theta)$
$P(y = 0 | x;\theta) = 1 -P(y = 1 | x ; \theta)$
$hθ(x)=P(y=1|x;θ)$ 해석: y가 1일 가능성, 주어진 x, 즉 환자가 특징 x로 나타내지는 특정 종양의 크기를 가질때, 이것이 $θ$에 매개된 가능성이다.
로지스틱 함수의 y값 예측
가령 $h_θ(x)≥0.5$ 일때 $y = 1$이라고 가정한다면, $h_θ(x)=g(θ^Tx)≥0.5$ 와 같다. 그래프를 보면 $z≥0$ 일때 $g(z)≥0.5$ 이므로 $z=θ^Tx≥0$ 일때 와 같다.
즉 $θ^Tx≥0$ 이면, $y=1$ 로 예측할 수 있다.
$h_θ(x)≥0.5→y=1$
$h_θ(x)<0.5→y=0$