본문 바로가기

Machine Learning/Model7

3. SVM 3. SVM1. SVM서포트 벡터 머신(SVM)은 분류 문제에 주로 사용되는 지도 학습 알고리즘으로, 데이터 포인트를 최적의 초평면(hyperplane)으로 구분하여 분류한다.SVM은 각 클래스와의 거리가 최대가 되는 초평면을 찾는 방식으로 작동하며, 이 초평면에 가장 가까운 데이터 포인트를 서포트 벡터(support vector)라고 부른다.장점고차원 데이터에 효과적으로 적용 가능비선형 결정 경계를 허용하기 위해 커널 함수를 사용하여 복잡한 경계 형성 가능과적합에 강하고 일반화 성능이 뛰어남단점큰 데이터셋에 대해 학습 속도가 느림커널 선택이 모델 성능에 큰 영향을 미침하이퍼파라미터 튜닝이 필요함2. SVM의 작동 원리각 클래스의 데이터를 구분할 수 있는 최적의 초평면을 찾음.서포트 벡터를 사용하여 초평.. 2024. 1. 9.
2. Logistic Regression 2. Logistic Regression1. 로지스틱 회귀(Logistic Regression) 알고리즘로지스틱 회귀는 분류 문제를 해결하는 지도 학습 알고리즘.이진 분류(Binary Classification)와 다중 클래스 분류(Multiclass Classification)에서 모두 사용되며로지스틱 회귀는 회귀라는 이름이 붙었지만, 입력값에 대해 시그모이드 함수를 적용하여 결과값을 0과 1 사이의 확률 값으로 반환한다.2. 로지스틱 회귀의 작동 원리선형 회귀 모델을 사용하여 입력 데이터와 가중치의 선형 결합 계산$$z = w_1x_1 + w_2x_2 + \dots + w_nx_n + b$$시그모이드를 통해 확률로 변환$$\sigma(z) = \frac{1}{1 + e^{-z}}$$시그모이드 함수는 .. 2023. 12. 25.
1. K-NN (K-Nearest Neighbor) 알고리즘 1. K-NN (K-Nearest Neighbor) 알고리즘1. K-Nearest Neighbor 알고리즘K-NN(K-Nearest Neighbors) 분류분석은 대표적인 분류 지도 학습 알고리즘이다.새로운 데이터 포인트가 주어졌을 때, 기존 데이터 세트에서 그 데이터 포인트와 가장 가까운 K개의 이웃을 찾아, 이 이웃들이 가장 많이 속해 있는 레이블로 새 데이터 포인트를 분류.장점K-NN은 데이터의 분포를 가정하지 않기 때문에 (비모수적), 다양한 형태의 데이터 세트에 적용 가능.여러 특성(Feature)을 가진 데이터에도 적용 가능.단점데이터 크기가 커질수록, 모든 데이터 point 간의 거리를 계산해야 하므로 계산 비용이 높음데이터 feature 수가 많을수록, point간 거리를 구하는 연산량이 .. 2023. 12. 18.