2021-01-13 공부기록(토픽모델링)

오전에 LDA 토픽결과를 가지고 계층 군집화를 할수 있을지 시도해 봤습니다. 강의도 들어보고 예시 코드도 봤지만 결코 쉽지 않았습니다 ;; 오후에는 taxi 수요예측 실습을 해야 했기 때문에 어쩔수 없이 책을 덮었습니다ㅠㅠ..

화장지가 모잘라서 제대로 못 닦고 나온 느낌처럼 매우 찝찝했습니다

문서 유사도를 토픽모델링에 접목시킬려면 각 분류에 해당하는 문서들끼리 (청원글에는 '행정','정치개혁' 등 17개의 분류가 있습니다) 얼마나 유사한지 구할수는 있을것 같았지만, 그 결과가 새로운 인사이트를 주진 못할것 같아서 접었습니다.

LDA에서 나온 토픽 갯수가 만일 4개라면, 각 토픽에 해당하는 단어를 하나의 객체로 만든 후 ->백터화 -> 모델 적용 하게 되면 가능하지 않을까 조심스레 생각해봅니다 아직 초보라 뭔가 맨땅에 헤딩하는 기분이라 깝깝~~합니다 :)

오후에는 수요예측 실습강의를 들으면서 따라해 봤습니다. 구글 SQL을 처음 사용해 봤습니다

다른 DBMS는 설치과정 만만치 않아서 언제나 장벽처럼 느껴졌는데 구글 SQL은 접근하기가 너무 간편해서 좋았습니다

지금은 EDA과정을 하고 있는데

강사가 다양~한 방법으로 시각화를 소개 해줍니다

생소한 방법들이 많아서 새로웠고 또 하나 배운것같아서 좋았습니다!!

사실 오늘따라 집중도 잘 안되고 아침부터 계층군집 실패를 맛본터라

의욕이 다소 떨어졌습니다 ㅠ 그러다 보니

취업걱정에 한숨만 늘어지게 쉬었네요

오늘은 좀 일찍 마무리하고 산책도 하고 운동하면서 환기좀 시켜야 할것같습니다 :)

H_record