728x90
R
이번 part는 R을 직접 다루는 것이 아니라 머신러닝에 대한 전체적인 개요를 훑은 part였습니다.
이는 다른 강의에서 몇번 중첩된 내용이 대부분이였기 때문에 복습의 개념으로 쭉 봤습니다.
덕분에 잊고 있었던 부분과 평소 알고 싶었던 것들을 간략하게 정리 할수 있었던 시간이였습니다.
특히 likelihood는 작년 처음 수학공부했을때, 한창 혼란스러웠던 시기라서 개념조차 어렵다고만 생각했는데 지금 들으니까 한결 이해하기가 편했습니다. 솔~직히 깊은 내용의 강의가 아니라 머신러닝의 개요 수준이라서 제가 아는 범위였기 때문에 집중력이 많이 떨어지긴 했습니다;; 그래도 꾸역꾸역 들으면서 수강완료를 했습니다
필기부분은 제가 까먹고 있었거나 하는 내용을 위주로 적었습니다. 저만 볼 생각에 대충 적었는데 보기 불편 하시다면 양해 부탁드립니다 ><
*확률변수-> 숫자로 맵핑 시켜주는 것.
ex)우리집에서 천왕역을 가는 방법
사거리->네네치킨->천황역: 1
사거리->초등학교->천황역: 1
사거리->풍성마트->천황역: 1
세가지 경우가 있을때 각 경우를 숫자로 맵핑 시켜주는 것을
이산 확률 변수
확률분포->확률변수값을 확률로 대응시키는 함수를 확률 분포라고 한다.
사거리->네네치킨->천황역: 1, 1/3
사거리->초등학교->천황역: 1, 1/3
사거리->풍성마트->천황역: 1, 1/3
*MLE : 모수를 추정하는 방법 중 하나이다.
likelihood를 최대화 하는 모수를 추정한다.
likelihood? 이미 주어진 표본적 증거를 토대로 모집단에 관해 통계적 추정이
그럴듯한 정도.
ex) 뽑은 데이터를 토대로 뮤=5로 놓으면 그럴듯 하겠다
회귀분석part
SST= SSE+SSR
SSR이 많아야 제대로된 회귀식이다. 이를 이용하여 결정계수로 나타낼수있다
R^2 = 1-SSE/SST = SSR/SST
결정계수는 유의하지 않는 변수가 추가 되어도 값이 올라가는 문제점이 있다.
이를 해결하기 위해서 수정 결정계수가 나타남
다중선형회귀 계수 해석시
다른 독립변수가 고정되었을때의 변화량이다.
예를들어 y =10+10x1+20x2 에서 x1은 광고비, x2 판매원 수이다.
이때 광고비의 10은 판매원 수의 값이 고정 되었을때의 10이 나온다는 의미
스케일이 작은 데이터의 오차를 상대적으로 추정하기 위해서 MAPE를 사용
태양열 예측
저번 시간에 문제였던 예측값과 True 값의 벌이짐을 해결했습니다. 여러가지 실험하다가 스케일러를 Robust로 바꾸니까 겹쳐졌습니다. 하지만 여전히 자기상관, 등분산성,정규성을 만족을 못하고 있기 때문에 정상성을 못만들고 있습니다.
728x90
'Data Diary' 카테고리의 다른 글
2021-06-21(R 데이터 분석_5(나이브베이즈)& 태양열예측24) (0) | 2021.06.21 |
---|---|
2021-06-17(R 데이터 분석_4(knn,logitstic)) (0) | 2021.06.19 |
2021-06-15(R 데이터 분석_3(가설검정)) (0) | 2021.06.15 |
2021-06-14(R 데이터 분석_2(시각화,전처리 기본기) & 태양열 예측22) (0) | 2021.06.14 |
2021-06-11(R 데이터 분석_1 & 태양열 예측21 & 앞으로의 계획) (0) | 2021.06.11 |