택시 수요예측에 적용할 모델을 정하기 위해서 저번 주에 이어서 앙상블 기법을 공부했습니다
Smote와 LightGBM을 기반한 신용카드 사기 검출 실습을 진행했죠
조금 많은 페이지였는데 중간마다 생각 좀 해야 할 부분들이 있어서 예상보다 진도를 많이 못 나간 것 같아요
중요한 건 진도보다는 이해가 중요하니까 이번만큼은 시간에 쫓기지 않고 임하려고 합니다
지금은 방법만을 배우고 있는 것 같아서 미완성이라는 느낌을 받습니다
내가 쓰고있는 알고리즘이 수학적으로 어떻게 연결이 되고 작동이 되는지를 알아야 비로소 속이 좀 풀릴 것 같아요 지금은 많은 기법들을 실습하고 이해하는데만 꽤 많은 시간이 걸릴 것 같더라고요 정말 많~~ 은 기법들이 있어서 깜짝 놀랐습니다 잠시 딴 얘기로 넘어갔네요; 다시 본론으로 와서
실습을 끝난 후에는 카카오브레인의 TGnet을 다시 봤습니다 초보 지식으로는 이해하는데 무리가 있었고 적용하기에도 힘들 것 같더군요
하지만 좀 깜짝놀랄만한 걸 알게 되었습니다 시간 안내 임베딩이라는 건데
정말 사람처럼 시간적인 개념을 학습 시켜서 방대한 시퀀스 데이터가 필요 없게끔 만드는 기술인 것 같아요
이런 개념이 딥러닝과 가깝다고 기재한 카카오브레인팀이 대단해 보였습니다
덕분에 저도 딥러닝에 대해서 좀더 다른 시각을 바라볼 수 있는 눈이 생긴 것 같아서 기뻤습니다
제 프로젝트에 이런 아이디어를 적용 할순 없는지 , 그리고 새로운 아이디어는 있는지 탐색을 하고 싶은 욕구가 오릅니다!
스태킹 기법은 말로만 들었지 실제로 실습해본 건 오늘이 처음이었습니다
예측한 데이터를 기반으로 다시 예측하는 과정이 흥미로웠습니다:) 그런데 서적에서는 실제 현실에서는 잘 사용되지 않는다는 말에 좀 아쉬웠습니다 ㅠ 예측을 다시 예측한다는 개념이 현실에서는 잘 맞아떨어지지 않은가 봅니다
그리고 문뜩 생각이 드는 게,
예측을 100%로 끌어올리는 미지의 숫자가 있진 않을까 라는..
몇십 년 후 사람을 뛰어넘는 인공지능이 나왔을 때
그 인공지능은 그 숫자를 찾아 내진 않을까 상상해봤습니다
회귀에서 잡음은 어쩔 수 없는 현상이라고 배웠는데 이 잡음을 찾아내야 한다면 뭘 고려해야 할까
평소에도 상상을 많이 하는 편이라서 공부하다가 나도 모르게 그쪽으로 빠집니다
아인슈타인? 잘 생각이 안 나지만 어느 수학자가 말하길 모든 현상은 수학적으로 표현 가능하다고 합니다
그러면 주식 예측이나 잡음처럼 예측하기 어려운 분야에 딱 들어맞는, 사회적 현상을 모두 고려한 최적의 숫자를 찾아낸다면 인공지능 개발자가 더이상 필요 없게 되진 않을까 합니다
공부 기록을 해야 하는데 적다 보면 맨날 생각의 흐름대로 흘러 가네요
다음번엔 좀 더 공부 기록 다운 기록을 적어보도록 노력해 보겠습니다
오늘 실습한 내용은 매일 포스팅 작업 중입니다 ~ 이번주 안으로 완성해서 이 블로그 글에 url 남기겠습니다
'Data Diary' 카테고리의 다른 글
2021-01-27 공부기록(택시수요예측) (0) | 2021.01.27 |
---|---|
2015-01-26 공부기록(택시수요예측) (0) | 2021.01.26 |
2021-01-22 공부기록(택시수요예측) (0) | 2021.01.22 |
2021-01-21 공부기록(택시수요예측) (0) | 2021.01.21 |
2021-01-20 공부기록(택시수요예측) (0) | 2021.01.20 |