목록머신러닝 (3)
SiLaure's Data

선형 회귀분석(Linear Regression) 독립변수와 종속변수가 선형적인 관계가 있다라는 가정 하에 분석 선형적인 관계 : 𝑋가 증가하면 𝑌도 증가하는 관계 직선을 통해 종속변수를 예측하기 때문에 독립변수의 중요도와 영향력을 파악하기 쉬움 의사결정 나무(Decision Tree) 독립변수의 조건에 따라 종속변수를 분리(비가내린다 -> 축구를 한다/하지 않는다) 이해하기 쉬우나 overfitting이 잘 일어남 overfitting : 과적합. 학습데이터에 대해 지나치게 정확하게 맞춘 결과로 실제 데이터에는 맞지 않아 예측이 어려워 지는 것 KNN(K-Nearest Neighbor) 새로 들어온 데이터를 주변 k개의 class 중 하나로 분류하는 기법 k는 사용자가 지정한다.(Hyper Paramet..

지도학습(Supervised Learning) 컴퓨터에게 가르치는 것 𝒀 = 𝒇 (𝑿)에 대하여 입력변수 (𝑿)와 출력변수 (𝒀)의 관계에 대하여 모델링 하는 것 (𝒀에 대하여 예측 또는 분류하는 문제 회귀(regression) : 입력변수 𝑿에 대해서 연속형 출력변수 𝒀를 예측 키, 몸무게, BMI 지수 등 분류(classification) : 입력변수 𝑿에 대해서 이산형 출력변수 𝒀(class)를 예측 성별, 흡연 여부, 질병 여부, 비만 여부, 주가 등락 등 클래스를 가지는 것 비지도학습(Unsupervised Learning) 출력변수 (𝒀)가 존관하지 않고, 입력변수 (𝑿) 간의 관계에 대하여 모델링 하는 것 군집 분석 : 유사한 데이터끼리 그룹화 PCA : 독립 변수들의 차원을 축소화 강화학습..

무엇(𝑿)으로 무엇(𝒀)을 예측하고 싶다 Machine Learning의 개념 기계학습 또는 머신러닝(Machine Learning)은 인공지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야를 말한다.(wikipedia) 주어진 데이터를 통해서 입력변수와 출력변수 간의 관계를 만드는 함수 f를 만드는 것 주어진 데이터 속에서 데이터의 특징을 찾아내는 함수 f를 만드는 것 Machine Learning으로 할 수 있는 것들 X Y Machine Learning 결과 고객들의 개인정보 및 금융 관련 정보 대출 연체 여부 대출 연체자 예측 탐지 모델, 대출 연체 관련 주요 feature 추출 게임 유저들의 게임 내 활동 정보 게임 이탈 여부/어뷰징 여부 이상 탐지 모델 숫자 손..