Performance evaluation




if (training data set) == (test data set) ?

: 당연히 높은 accuracy일 것이다. -> 시험이 족보 그대로 나오는 것 마냥...


따라서, training data set과 test data set은 달라야 한다.

입력 자체를 다르게 하던지, 

입력 데이터를 비율에 맞게 나누어, 일부는 training data로, 나머지는 test data로 사용.


validation set?


training set으로 학습을 시키고, validation set을 활용 모의 시험을 해보고, test로 마지막 점검.


training => 공부

validation => 모의 시험

test => 실제 시험


왜 모의 시험이 필요한가? learning rate와 lambda(정규화 정도 상수)의 적절한 값 선정을 위해.


Online learning


1) training data가 엄청 많다면?? 

-> 한 번에 다 학습 시키지 말고,  데이터를 잘라서 입력.


2) 시간이 지나 training data가 추가로 수집되었다면?

-> 학습된 모델에 추가적으로 학습



Accuracy


예측이 얼마나 정확한지 따지는 것.

이미지의 경우 95% ~ 99% 정도 되고 있다.

뒤에서 계속!

+ Recent posts