728x90
어제에 이어서 시각화를 진행했습니다~
크게 막히는 것은 없었지만 생각을 많이 해야 했던 부분이 있었습니다
바로 데이터의 의미를 파악하는 것이죠
시각화를 해도 무슨말인지 어떤 의미를 가지는지 모른다면 말짱 도루묵 이니까요
그래서 제 나름대로 좀 생각정리하는데 시간이 좀 걸렸죠
한 가지 특이한 점이
택시 운행 거리가 증가를 하는데 비용이 그만큼 들지 않았다는 겁니다
장거리 운행을 하게 되면 당연히 비용이 많이 오를 텐데... 그 반대 현상이 일어났죠
상관관계도 0.07을 보였습니다
상당히 의아했고 좀 충격이었어요 이게 무슨 일인가 싶어서 뉴욕 택시 요금이나 구글링을 해봤는데
확실한 근거는 못 찾았답니다
새로운 발견을 한 것 같아서 재미있었고 흥미로웠습니다 빨리 데이터를 능숙히 다뤄서 재미있게 회사에 다니고 싶어요:)
오늘은 zip_code 위주로 시각화를 했고 내일까지는 시간대 별 시각화로 마무리 지을 예정이에요
그 이후로는 모델링을 어떻게 해볼 건지 공부하고 고민해볼 생각입니다 카카오 브레인의 택시 수요예측을 신기하게 다뤘더라고요 보고서를 다시 읽어 보면서 제가 비슷하게나마 적용할 수 있을지 시도해볼 겁니다:) (만일 성공한다면 상당히 짜릿할 것 같다는 생각에 설레네요)
728x90
'Data Diary' 카테고리의 다른 글
2021-01-25 공부기록(택시수요예측) (0) | 2021.01.25 |
---|---|
2021-01-22 공부기록(택시수요예측) (0) | 2021.01.22 |
2021-01-20 공부기록(택시수요예측) (0) | 2021.01.20 |
2021-01-19 공부기록 (0) | 2021.01.19 |
2021-01-16 공부기록 (0) | 2021.01.16 |