어제 진행했던 sarimax의 파라미터를 보완하기 위해서 여러가지를 시도했습니다.
한번 시행하는데 시간이 워낙 많이 걸려서 진도는 제자리 였지만 몇가지 알수 있었던 점은
target를 log화 하면 AIC가 감소 한다는 점입니다. log를 한다고 무조건 감소하진 않는다고 합니다.
log는 작은 단위 값을 크게 만드는데 용이한데, 본래 큰 사이즈를 log화 하면 오히려 성능이 나빠진다고도 합니다.
실제로 몇 주전에 log의 성능을 알아보려고 실험했던게 기억이 납니다. 그 당시 결과는 log 화 하면 성능이 나빠진 걸로 기억합니다. 그런데 이번 실험에서는 log를 취한 AIC값이 더 낮으니 혼란이 옵니다. 하기 전에는 AIC는 260000 대 였고
log 후 AIC는 20000대 였습니다. 상당히 큰 차이를 보입니다.
교재를 보니까 변동계수를 구해서 threshold 기준으로 log를 적용한 걸 봤습니다.
태양에너지는 최저점과 최고점 차이값이 좀 나기 때문에 변동계수를 적용해야 하나 고민 중에 있습니다.
sarimax 파라미터 결과, trend 차분이 오히려 성능 악화에 일조 한다는 것이였습니다.
현재 AIC만 보고 있는데, 아직은 다른 통계값을 보진 못했습니다. 최근에 본 결과는 등분산은 일정하지만 정규분포는 아니며 자기상관이 있었습니다. 다음시간에는 새로 적용한(설명변수 포함 + log화) 파라미터의 통계값을 봐야 세부 계획을 잡을수 있을 것같습니다.
실험 과정 중 아쉬운 점이 있다면 역시 컴퓨터의 제한 이지 않을까 하네요
corab pro 메모리를 적용해도 sarimax 의 trend & seasonal 파라미터 자동화는 돌아가지 않았어요 ; (중간에 중단)
그래서 임의로 seasonal_order를 정하고 trend만을 계산을 했는데,,
다음엔 반대로 trend를 고정하고 seasonal을 봐야 할 것같습니다
'Data Diary' 카테고리의 다른 글
2021-05-27~8(태양열 에너지 예측13,14) (0) | 2021.05.28 |
---|---|
2021-05-26(딥러닝 수학7_이론 실습) (0) | 2021.05.26 |
2021-05-24(태양열 에너지 예측11) (0) | 2021.05.24 |
2021-05-22(태양열 에너지 예측10) (0) | 2021.05.22 |
2021-05-19(태양열 에너지 예측9) (0) | 2021.05.19 |