728x90
택시 수요예측 시각화를 끝냈습니다 다만 에러가 한 가지 발생했는데
이 에러는 강사와 똑같은 코드인데도 불구하고 발생한 에러 현상입니다 도저히 이유를 알 수가 없었습니다
plt.figure(figsize=(16,6))
sns.boxplot(x='hour', y='cnt', data=base_df3)
참고로 base_df3은 아래와 같습니다
제 생각엔 y축 cnt 맨 하단에 박스가 있는걸로 봤을 때
전체를 대상으로 계산된 박스가 아니라 특정 몇개만을 가지고 박스가 계산된 걸로 생각됩니다
일단 이 문제를 뒤로하고 모델을 어떤걸 써야 할지 고민하다가 파이썬 머신러닝 완벽 가이드 책을 보면서 앙상블 기법을 공부했습니다 평소에 XGBoost, LightGBM에 관심이 있었던 터라(캐글에서 유명한 모델이라는 소문을 들었습니다) 실습도 진행해 가면서 살펴봤습니다 실습한 코드는 내일쯤에 업로드할 예정입니다
그 외에도 스태킹과 딥러닝의 RNN 등 여러 모델을 공부해서 견문 좀 넓히려고 합니다:)
머리에 인풋이 있어야 활용을 할 수 있으니까요
아마 다음주도 모델 공부를 계~속 할 것 같아요
이번 프로젝트 기회로 여러가지를 경험할 수 있어서 좋은 것 같습니다
CNN이나 토픽 모델링을 했을 때와는 다르게 이번에는 시간을 좀 넉넉하게 하려고 합니다
목표는 다음 주까지 완성하는 건데, 시간에 쫓겨서 대충 만들기는 싫으므로 완성도 있게 만들도록 노력해보겠습니다
실습 코드보기↓
728x90
'Data Diary' 카테고리의 다른 글
2015-01-26 공부기록(택시수요예측) (0) | 2021.01.26 |
---|---|
2021-01-25 공부기록(택시수요예측) (0) | 2021.01.25 |
2021-01-21 공부기록(택시수요예측) (0) | 2021.01.21 |
2021-01-20 공부기록(택시수요예측) (0) | 2021.01.20 |
2021-01-19 공부기록 (0) | 2021.01.19 |