ML_DL/ML(9)
-
ML) Ridge Regression
범주형데이터 OneHotEncoder 정규화모델 Ridge Regression Lambda, Alpha, t RidgeCV SelectKBest 범주형데이터 https://horae.tistory.com/entry/범주형수치형이상형연속형명목형순서형-정리 범주형,수치형,이상형,연속형,명목형,순서형 정리 출처: KQTI 오늘은 기본적인 데이터의 종류에 대해서 알아보도록 하겠습니다. 데이터의 종류를 알아보는 것은 데이터 수집시 어떤 유형으로 수집하는 것이 좋은지를 설정하는 것부터 분석이나 horae.tistory.com 순서형 : 만족도 (1~5) , 성적등급(1~9) Q) 범주형데이터는 컴퓨터가 어떻게 처리하게 해야할까? Onehotencoding **주의점 및 문제점** Onehotencoding이 아닌 ..
2022.08.29 -
ML) Multiple Regression
다변수 선형회귀 RSS 식의 벡터화 RSS의 식과 벡터의 norm을 연관 지을 수 있다. e =(e(1),...,e(n)) e(i) = y(i) - y(hat)(i) 를 이용하면, 이때, 벡터 y 와 predictor matrix X가 주어지면, 해당 식은 beta의 함수로 표현이 되어 지는 것이다. 추정모형의 결과로 Coefficient (beta_value) 를 구했을 때, 음수의 값을 갖거나 굉장히 작은 경우에는 해당 predictors는 다른 predictor와 독립적인 관계가 아닐 수 있다. HOW TO UNDERSTAND ? response, predictor 관계 파악 어떤 변수가 중요한가? 모형이 얼마나 잘 적합 되었는가? 설명변수들의 값이 있을때, 예측된 반응변수값과 해당 예측값은 얼마나..
2022.08.29 -
ML) 선형회귀 ( Linear Regression )
Linear Regression 단순 선형회귀 모델 단순 선형 회귀 모델 Model : Y 는 Real response, X1 = Predictor 이다. 추정 모형 : y(hat) = x(i1)에 대한 예측되어 지는 값 Beta(hat) = 우리가 추정한 상수값 모형의 도입을 위해서는 True Model을 가정해야한다. (1)번 모델 즉, 이론적 결과는 True Model 의 가정하에서 유도된다는 것이다. 훈련용데이터를 통해서 Beta(hat) 값들은 계속해서 변화하게 되지만, 많은 경우를 진행한 후 평균적인 값을 내게 되면, 실제 True Model과 유사한 값을 가지게 된다. Beta(hat)값은 훈련용데이터에 의존하는 랜덤한 값이다. 추정방법: RSS = 실제 결과값과 추정값 간의 오차 y(n) ..
2022.08.25