본문 바로가기

728x90

전체 글

(219)
2021-02-09 기록 오늘 자소서를 드디어 끝냈습니다 오전부터 자소서한테 후두려 맞은 터라 오후에 정신 차라리 정~~~ 말 힘들어... 중간에는 원인모를 어지러웠어요 한창 스트레스 받았던 터라 그런진 몰라도 숨도 막히는 것 같고 다 기분 탓인가 싶기도 하고 ㅎㅎㅎ 자소서 두 번 적다가는 관짝에 들어 눕겠네요 ^^ 내일은 일단 명절도 겹치기 때문에 일정을 어떻게 짤건지 먼저 정할 생각입니다 바로 전 기록에서 언급했듯이 데이콘 경진대회 실습을 생각 중인데 자세한건 내일 다 결정 할려고 합니다 전 주로 단기적으로 일정을 짜는게 저랑 맞더라구요 장기계획을 짜서 그대로 실행한 적도 없고, 중간에 변수가 많기 때문에 단타로 진행합니다:) 그럼 내일 다시 기록하러 오겠습니다
2021-02-08 기록 예정대로라면 오늘 택시 프로젝트가 업로드 될테였지만 딥러닝의 loss='mse', metrics=['mae']로 수정했습니다. 머신러닝과 성능비교를 직관적으로 보고 싶어서 고쳤습니다 현재 6개 모델중 1개 진행 중입니다 :) 어제 정장을 사고 서점에 가서 데이터 관련 책들을 훑어 봤어요 배워야 할게 너~~무 많다는게 기대가 되기도 하지만 그만큼 부족한게 많다는 뜻이기도 하니까 불안해 지네요 하루하루 계획대로 하고 있는데 나이가 취업 마지노선이라는게 함정이란거죠 ;; 좀만 어렸다면 즐기면서 공부 했을텐데 그게 쪼~끔 아쉽습니다 먼저 쫓기듯 공부하니까 ㅎㅎ 그래도 제 꿈을 위해 열심히 할일 하는 제게 칭찬 해주고 싶어요 오늘도 어김없이 자소서를 적었어요 정말 하루에 한 문항을 겨우 적고 있습니다 워낙에 글재..
2015-02-06 기록 오늘은 택시수요예측 포스팅 작업을 했습니다. 하면서도 자잘한 장애물이 있어서 생각보다 시간이 꽤 걸렸네요 그리고 자연스럽게 복습도 되고 잘못된 정보도 보였습니다 pca를 할때 변수 선택을 잘못 했던거죠 면밀히 보고 했어야 했는데 그러질 못했습니다 ㅠ 이번 계기로 다음 프로젝트는 더 신중하게 접근하겠습니다 포스팅은 현재 임시저장했고 작업은 95%정도 끝냈습니다 마지막 CV을 적용한 Gru가 있는데 두가지 문제 있습니다 전에 언급 했던 것처럼 첫번째 문제는 성능값이 음수가 나오는 점이라는 것. 분명히 제가 놓친게 있다거나 혹은 잘못된 정보적용 한게 아닐까 의심이 됩니다 현재까지는 원인파악을 못하고 있어요 문제의 원인도 모르고 포스팅 올리는 건 보는 분에게 피해가 갈수 있기 때문에 반드시 원인 파악 후 올려야..
2021-02-05 기록 오늘은 자소서 항목중 성장과정을 진행했습니다 워낙에 글 재주가 없다보니까 항목 하나 적는데 하루가 꼬박 걸리네요 ㅠ 합격자소서들을 읽고 핵심이 뭔지를 숙지 하고 있습니다 생각보다 자료가 부족해서 난감하네요 :) 내일은 택시수요 프로젝트를 포스팅할려고 합니다 아마 이것도 꽤 많은 시간을 잡아 먹을 것같아요 일요일은 갈 곳도 있고 좀 쉬고 월요일 부터 다시 적어 내려 갈것같아요 월요일은 직무관련경험을 적을 차례인데 고민이 많~습니다 자소서를 다음주 화요일이나 수요일까지 마무리 하고 이후로는 이커머스 관련 강의를 수강하면서 실습도 진행할 생각입니다:) 어떤 내용을 배울지 벌써부터 궁금합니다 . . . ... 아.. 자소서 .. 후
2021-02-04 기록 오늘은 공부보다는 자소서를 했습니다 퇴사 후 오랜만에 적어보는 건데 역시나 머리에 쥐가 나는건 똑같더라고요 첫 취업 했을때 가장 좋았던 점이 자소서를 안 적어도 되는 거였는데 말이죠 :) 이 분야를 공부한 시기가 작년 5월부터입니당 5월부터는 바쁘게 뭔가를 하면서 지낸거 같은데 막상 자소서에 적으려고 하니까 남들 자소서와 비교가 되더랍니다 감이 안잡혀서 합격 자소서를 보는데 정말 똑똑이들이 많더라구요 내일도 이어서 작업을 해야 하는데 내일부터는 다시 힘내서 도전 해보겠습니다 :)
2021-02-03 공부기록(택시수요예측) 추가적인 모델은 없는지 찾아 보던중에 딥러닝+Cross Validation 방법을 알게 되어서 시도를 해봤습니다 시계열 데이터라서 CV를 하면 순서개념이 틀어져서 효과가 있을까 싶었지만 해보지도 않고 단정하는건 싫은지라 일단 해봤습니다 게다가 zip_code도 7개로 줄인 탓에 데이터 부족하기도 하고 해서 겸사겸사 했죠 그런데.... 메모리가 또 부족하더라구요 CV할때 GridSearch도 했는데 여기서 부터 메모리 부족이 떳습니다 ㅠVㅠ 그도 그럴게 모델 한번만 돌려도 메모리 3분의 1을 차지하는데 제 생각이 짧았죠 그렇게 해서 5개로 또 줄여서 해봤습니다 가까스로 실행이 되었더라구요 근데 으흠.. 결정계수에서 마이너스가 가..가능해..했던가..?? 범위가 0~1사이 값이고 1에 가까울수록 좋은 성능을..
2021-02-02 공부기록(택시수요예측) 구글링과 서적을 참고 해봤는데 내가 원했던 LSTM, GRU는 차지 못했습니다 좀 특이하고 오? 이건 뭐지? 라는 모델을 적용해 보고 싶었어요 물론 기존의 모델도 모두 이해하지 못하는 주제지만 ㅎㅎ.. 성격이 좀 색다른 경험을 즐겨 하는 편이라 그런것 같아요 그래서 오늘은 저 두 알고리즘을 가지고 각각의 경우로 돌려 봤어요 1번: LSTM,GRU 기본 모델 2번: 각 층을 추가한 모델 3번: 각 층을 추가 +Dropout 추가 모델 100회까지만 해봤을땐 과적합은 보이지 않았어요 만일 과적합이 있었으면 recurent dropout을 해보려고 했었어요 내일이 일정 상 택시수요예측 마지막날이라서 기회가 되면 1000회 정도 돌려 볼 생각입니다 :) 책에서 보니까 모델을 돌릴때는 과적합이 될때까지 돌리는 게..
2021-02-01 공부기록(택시수요예측) 개인 공부하면서 오늘이 가장 집중력이 안 좋았습니다 왜냐면.. 그전에 발생한 택시수요예측의 문제점들이 하~나도 물 꼬리를 틀지 못했기 때문이죠.. 기존에 발생한 문제점 1. 각 zip_code별 카운트가 다르다! 예를들어 14:30분의 콜수와 15:00시의 콜수가 다른 거죠 왜냐면 각 지역별 콜수가 다르므로.. 그래서 timestep을 어떻게 해결할 건지를 정해야 했습니다 저의 목적은 30분 단위로 짜른 데이터를 가지고 과거 데이터 4시간을 timestep으로 묶으려 했었습니다 2. 메모리 초과 일단 5월 데이터를 30분 단위로 자르니까 15만 개 이상의 데이터가 나왔습니다 timestep을 해결했다 해도 많은 데이터? 그렇게 많다고는 생각 안 하지만 코랩의 메모리가 12기가 밖에 제공하지 않습니다 찾아..