728x90

바로 지난 번에 겪었던 문제점은 회귀분석 결과 R-squared가 1이라는 점이였습니다. 그래서 스케일링과 다중공선성을 진행할 필요가 있어 보여서 실행해 보았는데요

결과는 크게 달라지지 않았습니다

일단 계수들만 봐도 상당히 부자연스러웠습니다. 태양열 에너지가 최대값이 600정도였는데 

몇천 단위가 나온다는건 납득하기가 쉽지 않아 보입니다. 그 외로 다른 통계치들을 봤을때도 일관성이 떨어져서 고쳐야 할점이 많아 보입니다. 다음 시간에는 일괄적으로 적용한 스케일링 수정과 원핫인코딩을 새로 적용할 생각입니다. 그리고 시계열 분해한 정보를 빼고 순전히 기상예보 데이터만을 가지고 예측을 해보도록 재 수정을 해볼 생각입니다. 서적을 보니까 시계열 모델을 앙상블해서 예측을 또 하더라구요 이런 것도 있구나 싶었습니다

ARIMA의 차수를 자동으로 정해주는 forecast 패키지를 저도 이용해 보고 싶더라구요 

 

그리고, 태양열 에너지가 없는 시간대에 마이너스가 찍혔습니다. 아마 위 계수중 마이너스가 크게 작용 한 것같은데 이 문제도 제대로 전처리를 할수만 있다면 고쳐질것 같습니다 

 

그러면, 다음 진도 상황을 가지고 다시 업로드하겠습니다.

(할 얘기가 더 있지만 현재 대회중인 프로젝트라서 규칙에 어긋날까 노심초사 중 ㅜㅜ ) 

 

728x90

+ Recent posts