본문 바로가기

728x90

Data Diary

(166)
2021-01-19 공부기록 오늘 택시수요예측 강의와 실습을 모두 마쳤습니다 강의 중에 google-composer가 있었는데 솔직히 무슨 소리인지 잘 이해가 가지 않았습니다 이걸 이해하기 위해서 쓸 에너지와 시간을 생각하니까 일정에 문제가 생길것같아서 과감히 중단하고 개인 프로젝트에 먼저 집중하기로 결정했습니다 :) 프로젝트가 끝나고 여유가 있을 때 공부해도 늦진 않을 것 같습니다 정말 배울게 너~무 많네요 전 직장에서 품질신뢰성 업무를 했었습니다 누구나 할 수 있는 업무난이도가 제게는 정신적 고통? 성취감이 없었는데 IT에 뛰어들면서 이런 배움의 신세계를 느껴보니까 큰 벽을 마주하는 느낌을 받으면서도 이걸 써먹을 줄 아는 제 모습을 생각하면 많은 동기 부여가 됩니다 아무튼, 나머지 시간에는 실습에서 사용한 뉴욕택시 데이터 말고 ..
2021-01-16 공부기록 taxi 수요예측 실습을 어제에 이어서 진행했습니다 쿼리문에 난이도가 올라가서 잠시 중단하고 한참을 구글링을 했습니다 함수는 이해했지만 왜 이런 변수를 만들었는지는 설명이 없어서 뒤적뒤적 만져보며 이해하려 했지만 실패했습니다 이틀 뒤에 다시 시도해 보겠습니다! 데이터 다룰때는 코딩 실력도 중요하지만 내가 무엇을 할 건지를 정하는 스킬이 가장 중요한 것 같아요 그리고.. 아직 에러 원인조차 파악 못한 코드가 있습니다 분명.. 같은 코드인데 에러 내용이 또 바꿨네요 끄응 아까 에러 내용은 5번 줄의 x_train의 type 관한 내용이었던 걸로 기억해요 강사님과 정말 같은 내용으로 실습하는데 말이죠 이래서 팀 단위로 모여서 프로젝트를 하면 실력이 빨리 오른다는 게 이런 이유이지 않을까 하네요 피드백이 빨라야..
2021-01-15 공부기록 taxi 수요예측 실습을 계속 진행 중입니다. 남의 코드를 보고 실습하는건 정말 좋은 참고서가 되는 것같아요 이렇게도 할수 있구나 라는 생각을 자주하게 돼요 색다른 코드들을 보니까 코딩 실력을 좀더 창의적으로 하고 싶다는 생각을 해봤어요 사실 한달 전쯤에 코딩테스트 준비를 할려고 책까지 사놨는데 포트폴리오가 먼저라는 교수님 말씀에 이렇게 열공하고있네요ㅎㅎ 만일 제가 취업을 하더라도 개인적인 호기심과 자기개발을 위해서 코딩테스트를 하지 않을까 싶어요 아 그리고 1월1일에 데이터 분석 강의(이러닝)를 신청했었는데 오늘 개강했다는 알람을 받았습니다 온라인으로 진행되는 수업이죠 그곳은 바로!!! ekoreatech 라는 사이트입니다 무료 강의와 수료증 발급까지 해줍니다 저처럼 자격증이나 수료증이 필요한 분들에게..
2021-01-14 공부기록 어제 실습에 이어서 오늘도 택시 수요예측 실습을 진행했습니다. 원래 계획은 하루에 강의 10개씩 진도를 나가는 걸로 정했는데 실습도 하고, 시행착오도 있다 보니까 겨우 2개만 진도를 나갔습니다 쿼리문은 나름 익숙해서 큰 문제는 없었지만 데이터 시각화(시간별, 지역별) 부분에는 조금 더 유심히 봤습니다. 제 약점? 중에 하나가 ~~ 별로 group by입니다 예를 들어 시간별, 지역별 등등 위처럼 간단한 문제라면 괜찮지만 문제가 복잡하게 되면 헷갈립니다 아마 익숙하지 않아서 그런 거라 생각됩니다 그리고 가장 시간을 많이 잡아먹었던 건 아래 코드입니다. 날짜를 가지고 주말을 구분해야 했는데, 날짜 함수가 머릿속에서 정리가 안되고 처음 본 것들이라서 삽질이 좀 길었습니다. 시간을 더 이상 지체할 수 없어서 강..
2021-01-13 공부기록(토픽모델링) 오전에 LDA 토픽결과를 가지고 계층 군집화를 할수 있을지 시도해 봤습니다. 강의도 들어보고 예시 코드도 봤지만 결코 쉽지 않았습니다 ;; 오후에는 taxi 수요예측 실습을 해야 했기 때문에 어쩔수 없이 책을 덮었습니다ㅠㅠ.. 화장지가 모잘라서 제대로 못 닦고 나온 느낌처럼 매우 찝찝했습니다 문서 유사도를 토픽모델링에 접목시킬려면 각 분류에 해당하는 문서들끼리 (청원글에는 '행정','정치개혁' 등 17개의 분류가 있습니다) 얼마나 유사한지 구할수는 있을것 같았지만, 그 결과가 새로운 인사이트를 주진 못할것 같아서 접었습니다. LDA에서 나온 토픽 갯수가 만일 4개라면, 각 토픽에 해당하는 단어를 하나의 객체로 만든 후 ->백터화 -> 모델 적용 하게 되면 가능하지 않을까 조심스레 생각해봅니다 아직 초보라..
2021-01-12 공부기록(토픽모델링) 저번주 금요일부터 시작했던 국민청권글을 가지고 토픽모델링을 진행하고 있습니다~! 원래 강의 내용은 카카오톡 분석이였지만 어떠한 이유로 인해서 카톡으로 진행을 하지 못했습니다 그래서 청원글로 대체 했습니다. 이 청원글로 토픽 모델링 한다면 주로 어떤 종류의 청원을 많이 올리는지 볼수 있을것 같아서 시작하게 되었습니다. 어제했던 내용을 이어 받아서 오늘도 하루 종일 여러 시도를 했지만 좀 처럼 해결이 나질 못했습니다. 아침부터 나를 당황하게 만들었던 이 에러 문구.. 어제까지만 해도 됐었잖아 ㅠ ㅠ 무슨변덕이람..ㅠㅠ 어쩔수 없이 기존 코드를 여차저차 수정했습니다 오늘 진행한 내용은 아래와 같습니당~ 1. 전처리 2. LDA,ATM 모델 수정 3. pyLDAavis 시각화 4. 문서 군집화 오늘 가장 많~이..