전체 글 (219) 썸네일형 리스트형 2021-01-13 공부기록(토픽모델링) 오전에 LDA 토픽결과를 가지고 계층 군집화를 할수 있을지 시도해 봤습니다. 강의도 들어보고 예시 코드도 봤지만 결코 쉽지 않았습니다 ;; 오후에는 taxi 수요예측 실습을 해야 했기 때문에 어쩔수 없이 책을 덮었습니다ㅠㅠ.. 화장지가 모잘라서 제대로 못 닦고 나온 느낌처럼 매우 찝찝했습니다 문서 유사도를 토픽모델링에 접목시킬려면 각 분류에 해당하는 문서들끼리 (청원글에는 '행정','정치개혁' 등 17개의 분류가 있습니다) 얼마나 유사한지 구할수는 있을것 같았지만, 그 결과가 새로운 인사이트를 주진 못할것 같아서 접었습니다. LDA에서 나온 토픽 갯수가 만일 4개라면, 각 토픽에 해당하는 단어를 하나의 객체로 만든 후 ->백터화 -> 모델 적용 하게 되면 가능하지 않을까 조심스레 생각해봅니다 아직 초보라.. 2021-01-12 공부기록(토픽모델링) 저번주 금요일부터 시작했던 국민청권글을 가지고 토픽모델링을 진행하고 있습니다~! 원래 강의 내용은 카카오톡 분석이였지만 어떠한 이유로 인해서 카톡으로 진행을 하지 못했습니다 그래서 청원글로 대체 했습니다. 이 청원글로 토픽 모델링 한다면 주로 어떤 종류의 청원을 많이 올리는지 볼수 있을것 같아서 시작하게 되었습니다. 어제했던 내용을 이어 받아서 오늘도 하루 종일 여러 시도를 했지만 좀 처럼 해결이 나질 못했습니다. 아침부터 나를 당황하게 만들었던 이 에러 문구.. 어제까지만 해도 됐었잖아 ㅠ ㅠ 무슨변덕이람..ㅠㅠ 어쩔수 없이 기존 코드를 여차저차 수정했습니다 오늘 진행한 내용은 아래와 같습니당~ 1. 전처리 2. LDA,ATM 모델 수정 3. pyLDAavis 시각화 4. 문서 군집화 오늘 가장 많~이.. CNN_BTS 멤버 image classification 시작하기에 앞서 첫 블로그 내용으로는 BTS 이미지를 분류해봤습니다. BTS를 선택한 이유는 팬이기도 하고 유명하니까 자료 얻기도 쉽지 않을까 하는 생각에 선택했습니다! 그래서 BTS 멤버 이미지를 가지고 분류하는 코드를 작성해봤는데, 틀렸다거나 다른 이견이 있으시다면 언제든 말씀해 주시면 감사하겠습니다 ^^ 자료는 다음 이미지를 크롤링했습니다. 한명 당 1300건을 수집했고, 훈련에 부적합한 이미지를 거른 후 총 7649장을 사용했습니다. 업로드할 코드 이미지는 추가적인 설명 또는 막혔었던 부분을 설명하겠습니다. 참고서적은 케라스 창시자에게 배우는 딥러닝, 핸즈온 머신러닝입니다. CNN 딥러닝 분류 모델 성능을 높히기 위해서 데이터 증식과 VGG16 사전 학습 모델을 적용시켜봤습니다. 큰 틀의 내용은 .. 이전 1 ··· 25 26 27 28 다음