728x90

버스 승차인원예측을 오늘 모두 끝냈습니다.

이번에도 앙상블기법이 나왔고 익숙한 XGBoosst,LightGBM,RandomForest가 등장했습니다.

 

변수 선택 Part에서 A/B test를 실습했습니다. 기본 변수를 정하고 하나씩 교차검증을 진행하는 내용이였는데

변수의 수가 100개 넘는데 이걸 하나씩 검증했다는 것자체에 좀 놀랬습니다

 

이렇게 까지해야 일등을 하는구나 생각이 들었어요 이 부분도 분명히 일일이 넣었다 뺐다 하지 않고 

코딩으로 구현 하셨을텐데 개인적으로 어떻게 하셨을지 궁금하네요

A/B테스트를 말로만 들었지 실제로 실습과정에서 적용한 예시는 처음 본 것같습니다 

 

하이퍼 파라미터 튜닝에도 저는 항상 그리드만 사용했는데 임의 탐색이라는 또다른 방법이 있었더라구요

그리드는 시간이 오래 걸리는 단점이 있어서 이를 보완할 방법으로 임의탐색이 있다고 소개합니다

 

저도 진행하면서 그리드가 너무 오래걸려서 불편한 적이 여러번 있었는데 다음에 기회가 생긴다면 임의탐색을 사용해보고싶네요

 

몇달전에 앙상블 처음 배우면서 들었던 것이 완성된 모델을 앙상블하는 방법은 있을까 생각한 적이 있었는데

이거를 오늘 보게 되었습니다! 5개의 모델을 만들고 이를 앙상블해서 더욱 일반화 성능에 가까운 수치를 얻을수 있다고 합니다. 이 부분도 매력적으로 보였어요 정말 다양한 방법들이 많더라구요. 제가 들은 얘기로는 이렇게 고도의 앙상블은 실제로 사용되지 않는다고 알고 있어요 그러니까 완전 대회용으로 앙상블을 사용한다고 하더라구요 (제가 듣기로는..)

 

아무튼 데이콘 1등 코드를 1장과 3장을 실습해 봤어요 

제가 이번 실습 직전에 택시수요예측을 진행했는데 ... 하.. 부끄럽더라구요 .. 뭔가 다 틀린것같고 ㅋㅋ 자신이 없어졌습니다 ㅎㅎ; 이 실습을 진행 후 택시예측을 했다면 좀더 세련된 프로젝트가 되었을 텐데 좀 아쉽습니다 

 

하지만 이 경험 덕분에 프로젝트를 어떻게 하는지에 대한 방향을 잡을수 있었습니다 정~말 좋은 선생님에게 코치 받은 느낌이였어요 

 

내일부터는 컵퓨터 비전 강의를 들으면서 실습한 내용을 업로드 할 예정입니다. open CV를 해야지 해야지 했는데 

좋은 기회가 생겨서 결제하고 공부 할수 있게 되었습니다 

 

마지막으로 실습한 내용은 차근차근 올리도록 하겠습니다 

2021/02/20 - [실습 note] - 버스 승차인원 예측 실습(데이콘 경진대회 1등 솔루션)

728x90

'Data Diary' 카테고리의 다른 글

2021-02-18(OpenCV_2)  (0) 2021.02.18
2021-02-17(OpenCV_1)  (0) 2021.02.17
2021-02-15(데이콘_버스 승차인원예측 실습)  (0) 2021.02.15
2021-02-13 기록(데이콘_KBO 실습4)  (0) 2021.02.13
2021-02-12 기록(데이콘_KBO 실습3)  (0) 2021.02.12

+ Recent posts