머신러닝

AI/Hands-on ML

[핸즈온 머신러닝] 9장 - 비지도 학습 1 (군집)

9. 비지도 학습 - 많은 데이터는 대부분 레이블이 없음 - 레이블을 부여하는 작업은 비용이 크며 오래걸림 => 레이블이 없는 데이터를 바로 사용하기 위한 비지도 학습 9. 1 군집 비슷한 샘플을 구별해 하나의 클러스터 또는 비슷한 샘플의 그룹으로 할당하는 작업 분류 - 데이터셋이 레이블 되어 있음 - 로지스틱 회귀, SVM, 랜덤 포레스트 분류기 같은 분류 알고리즘이 잘 맞음 군집 - 레이블이 없음 - 대부분의 군집 알고리즘은 왼쪽 아래 클러스터를 쉽게 감지하지만, 오른쪽 위의 클러스터는 두 개의 하위 클러스터로 구성되었는지 확실하지 않음 - 모든 특성을 사용하면, 클러스터 세 개를 잘 구분할 수 있음 - 다음과 같은 어플리케이션에서 사용 고객 분류 (ex. 추천 시스템) 데이터 분석 - 군집 알고리즘..

AI/Hands-on ML

[핸즈온 머신러닝] 8장 - 차원 축소

8. 차원 축소 차원의 저주 - 많은 머신러닝 문제는 훈련 샘플이 각각 수천 수백만개의 특성을 가지고 있음 - 이런 많은 특성은 훈련을 느리게 할 뿐만 아니라, 좋은 솔루션을 찾기 어렵게 만듦 - 이러한 차원의 저주 문제들은 특성 수를 크게 줄여 불가능한 문제를 가능한 범위로 변경할 수 있음 MNIST 이미지처럼, 이미지 경계에 있는 픽셀은 거의 흰색이므로 훈련 세트에서 이런 픽셀을 제거해도 많은 정보를 잃지 않음 인접한 픽셀은 종종 많이 연관되어 있으므로, 두 픽셀을 하나로 합치더라도 잃는 정보가 많지 않음 훈련 속도를 높이는 것 외에 차원 축소는 데이터 시각화에도 유용 - 차원 수를 둘로 줄이면 고차원 훈련 세트를 하나의 압축된 그래프로 그릴 수 있으며, - 군집 같은 시각적인 패턴을 감지해 통찰을 ..

KIM DEON
'머신러닝' 태그의 글 목록