728x90

어제부터 오늘까지는 부득이한 집안일 사정때문에 업로드 및 진도에 차질이 잠시 있었습니다.

조금씩 진도 나갔던 부분을 짧게나마 기록하겠습니다.

 

저번시간에는 SARIMA 파라미터에 있어서 log 전/후 결과값에 차이가 있었습니다.

그래서 log 후 SARIMA 적용을 했을때 등분산과 자기상관이 조건에 만족하는지에 대한 파라미터를 실험해 봤습니다.

실험결과 특이사항은 없었습니다. 몇 주전에 진도 나갔던 코드 내용을 보니까 트렌드 차분+계절성 차분+ log 한 값이

정상성 상태와 가장 흡사했기 때문에 그대로 SARIMA에 적용해 봤는데도 결과가 전과는 다르게 나왔습니다.  

 

정리가 필요해 보여서

version1,2를 나눠서 전처리 방식을 조금 다르게 설정했습니다. 스케일링 부분과 target의 log, 설명변수의 스케일링 등 

여러가지를 실험해 가면서 최적화를 찾아 내려고 시도 중에 있습니다.

데이콘에서 제시했던 lgb와 랜덤포레스트 모델을 사용하고 있습니다. 그런데 target의 log로 모델을 학습 시킨뒤 log reverse를 시킨 값의 시각화를 그려보면 

위와 같은 현상이 발생했습니다. 예측값이 너무 낮게 잡히고 있더라구요. 현재 원인을 조사?중에 있습니다

내일도 짧게나마 진도가 나갈 것 같습니다.. 

내일 학습 내용으로 다시 업로드 올리겠습니다.

 

728x90

+ Recent posts