728x90
이틀 전 부터 따릉이 수요예측 프로젝트를 시작했습니다. 깜빡하고 당일에 업로드를 하지 않아서 지금 몰아서 적성하게 되었습니다.
일단 간단하게 EDA는 진행했고 전처리 과정을 진행 중입니다. 그런데 몇 시간 동안 매달려 해결 되지 않은 문제가 있어서 정체 되었습니다
본 데이터는 위와 같이 되어 있습니다. 결측치가 많습니다. 일괄적으로 bfill을 사용하려고 했으나 hour가 뒤죽박죽이라서 적용하지 못했습니다. 각 시간대 별 평균 값을 넣어 볼려고 아래처럼 시도를 했습니다.
위 코드를 실행해도 결측치가 그대로여서 이것저것 실험해 본 결과, fillna 같은 경우는 위 처럼 train[train 블라블라] 와 같은 필터? 조회형식으로는 채워지지 않는다는 걸 알게 되었습니다. train.fillna() 혹은 train['column'].fillna() 형식으로 해야 적용이 되더라구요. 그래서 현재는 결측치를 어떻게 하면 될까 고민 중에 있습니다.
진도가 진행되면 그때 또 다시 진도 내용을 업로드 해보겠습니다.
728x90
'Data Diary' 카테고리의 다른 글
2021-09-08(딥러닝 수학 13_ for Several Samples Theory & Implementation) (0) | 2021.09.08 |
---|---|
2021-09-07(따릉이 프로젝트 완성하기 3) (0) | 2021.09.07 |
2021-08-26(딥러닝 수학 12_mini batch & for one sample-Theory) (0) | 2021.08.26 |
2021-08-24(딥러닝 수학11_Cost function & Feature Scaling) (0) | 2021.08.24 |
2021-08-20,23,30,31(태블로 최종편_포트폴리오 만들기) (0) | 2021.08.20 |