projects (6) 썸네일형 리스트형 따릉이 자전거 이용 예측_dacon https://colab.research.google.com/drive/1CsnK5YrMDtSiAeQezPmw_7YPjZlg_8uS?hl=ko Google Colaboratory Notebook Run, share, and edit Python notebooks colab.research.google.com dacon의 따릉이 자전거 이용 예측 프로젝트입니다. 현재 기준으로 데이콘 리더보드에서 6위를 기록하고 있습니다. 감사합니다 :) Face Mask Detection https://colab.research.google.com/drive/1eesj-6EBRPpZn6AebXDIOhdULzh7x_BU?hl=ko Google Colaboratory Notebook Run, share, and edit Python notebooks colab.research.google.com Mask Detection을 수행해 봤습니다. dataset은 캐글에서 받았습니다. 아래 그림은 유튜브 영상 중 일부를 편집하여 모델로 돌린 결과로써 threshold 0.1로 설정했음을 알려드립니다. dataset이 좀 더 많고 다양하다면 지금의 성능보다 훨씬 좋아 질것 같습니다. 자세한 내용은 위 링크에서 보실수 있습니다. 동서발전 태양광 발전량 예측 프로젝트_dacon 본 내용은 Dacon의 동서발전 태양광 발전량 예측 AI 경진대회에 참가한 프로젝트 내용입니다. 주어진 데이터를 통해 태양광 발전량 예측 모델을 만들어 봤습니다. 아래는 Data& Target Data 일부분을 캡처한 그림입니다. 1. Import and Libraries !pip install tsfresh import pandas as pd import numpy as np import matplotlib.pyplot as plt import os from tqdm import tqdm # Ignore the warnings import warnings warnings.filterwarnings('ignore') # 경고 뜨지 않게 설정 # System related and data input con.. 뉴욕 택시수요예측 뉴욕 택시수요예측 2015년 5월의 yellow 뉴욕택시 데이트를 사용해서 수요량을 예측합니다. 시간은 30분 단위로 진행되었으며 주 평가척도는 mae입니다. 외부데이터는 날씨 데이터를 참고했으며 LSTM, Gru의 timestep은 메모리 크기에 맞게 유동적으로 변경하면서 진행했습니다. 목차 1. EDA 1. 1 EDA(Region) 1.1.1 퍼센트 별 Trip_cnt 1.1.2 zip_code별 Trip_cnt 1.2 EDA(Time) 1.2.1 시간 1.2.2 요일 1.2.3 주말 2. 데이터전처리 2.1 target 분포 확인 / log 적용 2.2 날씨변수 추가 2.3 Scaling 2.4 PCA 생성 2.5 원핫인코딩 Train/Test Dataset 3. 모델 구축과 검증 3.1 XGBoo.. 국민청원글 토픽모델링 국민청원글을 대상으로 토픽모델링을 진행했습니다. 첫번째로 LDA를 활용하여 토픽모델링 함으로써 공통적인 속성을 알고자 했습니다 두번째로 ATM은 카테고리별 문서주제 분포를 파악하여 유사도를 분석해 보고자 했습니다 corab url Google Colaboratory colab.research.google.com 1. import/ 파일 불러오기 2. 텍스트 전처리 전 시각화 >각 청원글을 공백 기준으로 단어로 만듭니다 >공백으로 잘라준 total_tokens의 빈도를 확인합니다 > 전처리 전 청원글의 빈도 그래프 입니다. 보다시피 유의미한 의미를 찾기 힘들기 때문에 명사만을 추출하여 진행했습니다. 3. 텍스트 전처리 후 시각화 전처리 과정에 앞서서 먼저 author2doc를 만들어 줍니다 (전처리 후에 .. CNN_BTS 멤버 image classification 시작하기에 앞서 첫 블로그 내용으로는 BTS 이미지를 분류해봤습니다. BTS를 선택한 이유는 팬이기도 하고 유명하니까 자료 얻기도 쉽지 않을까 하는 생각에 선택했습니다! 그래서 BTS 멤버 이미지를 가지고 분류하는 코드를 작성해봤는데, 틀렸다거나 다른 이견이 있으시다면 언제든 말씀해 주시면 감사하겠습니다 ^^ 자료는 다음 이미지를 크롤링했습니다. 한명 당 1300건을 수집했고, 훈련에 부적합한 이미지를 거른 후 총 7649장을 사용했습니다. 업로드할 코드 이미지는 추가적인 설명 또는 막혔었던 부분을 설명하겠습니다. 참고서적은 케라스 창시자에게 배우는 딥러닝, 핸즈온 머신러닝입니다. CNN 딥러닝 분류 모델 성능을 높히기 위해서 데이터 증식과 VGG16 사전 학습 모델을 적용시켜봤습니다. 큰 틀의 내용은 .. 이전 1 다음