8-1. 성능 최적화
8-1-1. 데이터를 사용한 성능 최적화
- 최대한 많은 데이터를 수집하여 활용하는 방법
- 그러나 데이터 수집이 어려운 경우 임의로 데이터를 생성하는 방법도 고려
최대한 많은 데이터 수집하기

데이터가 많을수록 성능이 좋음
데이터 생성하기
데이터 범위 조정하기
- 활성화 함수에 따라,,
sigmoid(): 데이터셋 범위가 0 ~ 1이 되도록
tanh(): 데이터셋 범위가 -1 ~ 1이 되도록
정규화, 규제화, 표준화 등
8-1-2. 알고리즘을 이용한 성능 최적화
- 유사한 용도의 알고리즘들을 선택하여 모델을 훈련시켜 보고 최적의 성능을 보이는 알고리즘을 선택
8-1-3. 알고리즘 튜닝을 위한 성능 최적화
- 다양한 하이퍼 파라미터를 변경하면서 훈련시키고 최적의 성능 도출
진단
- 모델 평가 결과를 바탕으로 모델이 과적합(over-fitting)인지 혹은 다른 원인으로 성능 향상에 문제가 있는지에 대한 인사이트를 얻을 수 있음
과적합(over-fitting)
- 훈련 성능이 검증보다 눈에 띄게 좋은 경우
- 이를 해결하기 위해 규제화 적용 가능