오늘은 태양광 프로젝트를 진행했습니다.
데이터 전처리 예시 중 선형보건법이 있었습니다. 처음 본 방법이라서 신기했어요
이게 없었더라면 결측치를 삭제하거나 아마 ffill / bfill로 채웠을텐데 말이죠
결측치가 연쇄적으로 따닥 따닥 붙어 있다면 fillna 보다는 선형보건법이 유용할것같네요
아무튼 오늘 진도 나간 부분은 일기예보 시간 정하기 와 데이터 concat 정도입니다.
주어진 데이터 중에서 일기예보가 있었어요 11시,14시,17시,20시 이렇게 하루에 4번씩 일기예보를 한다고 합니다.
데이콘 예시를 보니까 임의로 11시 일기예보를 사용했더라구요
저는 각 예보의 오차를 알아내서 시간을 정하고 싶었어요
그래서 실제 관측치 데이터를 가지고 직접 MSE 방법으로 오차를 구했습니다. (온도로 비교했습니다)
20시가 가장 오차가 적었는데 사실 4개 모두 대동소이 했어요
시행착오
비교할때 시각화를 그렸는데 온도가 한줄로 쭉 그어져 있더라구요
띠용했죠 이게 문제가 싶어서 고치고 또 고치고 삽질 좀 하다가
설마해서 Xlim을 제거하니까 제대로 나오더라구요 Xlim에 날짜를 적어 놨는데
데이터에는 index가 그냥 숫자로 되어 있는데 이게 불일치 해서 그런가 싶어요
내일모레는 EDA 목록을 만들고 마무리했습니다 이 전에 택시 프로젝트를 했었던 터라 한결 수월하게 진행 할수 있을것같은 예감이 듭니다 :)
얼른 EDA끝내고 다음단계로 들어가고 싶네용
내일은 딥러닝 수학을 진행할 예정입니다
내일 수업 내용 포스팅을 가지고 다시 돌아오겠습니다
'Data Diary' 카테고리의 다른 글
2021-04-29(태양열 에너지 예측3) (0) | 2021.04.29 |
---|---|
2021-04-28(딥러닝수학4_Linear Regression & Gradient Descent) (0) | 2021.04.28 |
2021-04-26(딥러닝 수학3_Vector Chain Rule) (0) | 2021.04.26 |
2021-04-23(태양열 에너지 예측) (0) | 2021.04.23 |
2021-04-22(딥러닝 수학2_Gradient & Jacobian) (0) | 2021.04.22 |