728x90
R
오늘은 R 전처리를 위한 기본 다지기 강의를 들으면서 실습을 진행했습니다
part3는 기본기 다지기 과정이라서 실습코드는 따로 올리지 않을려고 합니다.
간략하게 학습내용을 적어보자면 산점도,막대그래프,박스플롯,결측치 처리,이상치 정제 그리고 마지막엔 한국복지패널 데이터를 가지고 분석해 보는 실습을 진행했습니다.
학습내용중에 조금 버벅거리고 낯선 함수가 있습니다. 바로 mutate 함수 입니다. 함수를 통해 변수를 생성하는 것과 직접 $로 변수를 생성하는 코드 과정이 조금 헷갈리는 것같아요
이 함수를 좀더 주의깊게 봐야 할것 같습니다. 내일은 part4 가설검정을 학습 합니다.
태양열예측
모든 변수를 넣었을때의 결과 값과 REV로 선별된 변수로 돌린 결과값이 상당히 차이나게 나왔습니다(파라미터는 같게)
게다가 REV에서 선별된 변수로 했을경우에 val 시각화가 이상했습니다.
True 값과 pred 값이 서로 겹치지 않고 위 아래로 따로 분리가 되었습니다. 패턴은 따라가는 것같은데
예측값이 True 값과 전혀 달라서 조금도 겹쳐지지 않았습니다. 그러다 보니 성능도 안좋게 나왔구요
거의 점수가 47이 나왔습니다(데이콘의 베이스 코드 점수는 8점대) 데이콘 점수와 크게 차이가 납니다.
시간이 오래 걸려서 train 값을 2020년만 따로 짤라서 하고 있는데도 불구하고 걸리다 보니까 진도가 빨리 안나간다는 점이 안타깝습니다 다음주면 pro 기간 만료라서 더 조급합니다
728x90
'Data Diary' 카테고리의 다른 글
2021-06-16(R 데이터 분석_3(머신러닝_개요)& 태양열 예측23) (0) | 2021.06.16 |
---|---|
2021-06-15(R 데이터 분석_3(가설검정)) (0) | 2021.06.15 |
2021-06-11(R 데이터 분석_1 & 태양열 예측21 & 앞으로의 계획) (0) | 2021.06.11 |
2021-06-09(태양열 에너지 예측20) (0) | 2021.06.09 |
2021-06-08(태양열 에너지 예측19) (0) | 2021.06.08 |