본문 바로가기

728x90

전체 글

(219)

bitcoin 예측 실습 시계열 데이터 심화 강의의 마지막 단계인 실습프로젝트들 중 bitcoin을 포스팅하겠습니다. MLP from keras.models import Sequential, Model, load_model from keras.layers import Input, Dense, Activation, Flatten, Dropout from keras.layers import SimpleRNN, LSTM, GRU ###MLP #Data Loading location= './Data/Cry/Bitcoint.csv') raw_all= pd.read_csv(location, index_col='Date') #Parameters criteria ='2020-01-01' scaler= predprocessing.minMaxSc..

2021-04-13(시계열데이터 심화17_RNN,LSTM,Gru) *본 내용은 시계열데이터 강의 내용 중 일부분을 요약한 내용입니다 개요 오늘은 시계열 딥러닝에 대한 내용을 포스팅합니다. 시계열 딥러닝은 구간추정값 없이 오직 점추정값을 출력하고 연산과정에서의 설명력이 떨어지므로 신뢰성이 낮다는 단점이 있습니다. 그런데도 불구하고 시계열 딥러닝을 이용하는 이유는 뭘까요? 대략 세가지의 장점이 있습니다. 1. Feature Engineering을 자동으로 구해줍니다. 히든레이어를 통해서 데이터 안에 숨겨진 패턴을 찾아낼 수 있습니다. 히든레이어의 층이 깊어 질수록 1차,2차,3차 쭉죽 늘어나게 됩니다. 그래서 3차식에서 알수 있는 특징이 있고, 4차식에서 알수 있는 특징을 찾아 낼수 있습니다. 2. 입력& 출력의 자유도 높습니다. 입력을 어떻게 줄건지, 출력은 어떤 형태로..

2021-04-12(시계열데이터 심화16_딥러닝) *본 내용은 시계열데이터 강의 내용 중 일부분을 요약한 내용입니다 개요 오늘은 딥러닝에 대해서 포스팅 하겠습니다. 발전 개요는 생략했고 중요하다고 생각하는 것들만 정리해 보았습니다. 단층퍼셉트론(Single-Layered Perceptron: SLP) 위 이미지는 단층 구조입니다. H0와 이를 가리키는 X들만 따로 구별해서 본다면 우리가 알고 있는 회귀분석 y=f(x) 구조와 같습니다. 즉 ho=f(x) 구조 형식을 띕니다. 즉 각 노드가 하나의 회귀분석이며 딥러닝은 이러한 회귀분석을 여러개 계산하는 것입니다. H0 -> Y으로 넘어 갈때 활성함수가 들어가게됩니다. 활성함수는 비선형으로 만들어 주는 장치입니다. 따라서 정리하면 뉴런(노드)의 수만큼 회귀분석 한 다음에 이를 결합 하고 또다시 회귀 분석을 ..

2021-04-10 기록(시계열 데이터 심화_비선형 복습) 오늘 비선형 알고리즘을 복습 했습니다 워낙 복잡해서 강사가 내용만 훑어주는 정도로 넘어갔는데 그것만으로도 복잡했습니다 정말 멘탈 털털 털렸습니다 마코프 영역은 뭔가 뜬 구름 잡는 것처럼 이해가 안되서 상당히 힘이 들었어요 지금도 이해 못하고 있습니다 ;; 통계학과가 아닌게 이렇게 비통할수가 없네요ㅠ 다음주 부터는 딥러닝 파트로 넘어가고, 실습 프로젝트까지 해서 다음주 금요일까지 마무리 하는걸로 계획을 짜놨습니다 그 이후에는 데이콘에 시계열 데이터로 진행하는 대회가 있더라구요 연습삼아 그 경연에 참가 할려고 생각중입니다. 아마 5월에나 끝날것같아요

2021-04-09(시계열데이터 심화15_비선형 알고리즘) *본 내용은 시계열데이터 강의 내용 중 일부분을 요약한 내용입니다 전 포스팅까지는 선형알고리즘을 다뤘다면 오늘 포스팅은 비선형 알고리즘에 대한 간략한 개념정도만 올리겠습니다. 비선형이 상당히 많은 내용과 복잡한 내용이 있다고 하셔서 깊은 내용까지는 강의에서 다루지 않았어요 확실히 선형보다는 복잡한 수식이 많았습니다. 저도 완전히 100% 숙지 한게 아니라서 부족한 설명이 있더라도 양해 부탁드리겠습니다 상태 공간 모형(State Space Models) 상태 공간 모형에 앞서서 위 이미지를 통해서 비선형이 뭔지를 먼저 설명드리겠습니다. 지구의 온도를 측정하기 위해서 태평양 온도 수치를 녹색이라 하겠습니다. 파란색도 태평양 온도이긴 하지만 실제로 측정한 값이 아니고 다른 우회적인 방법을 통해서 얻어낸 근사값..

2021-04-08기록 오늘은 강의 진도보다 더 중요한 자소서를 작성했습니다. 자소서는 할때마다 늘 짜릿하고 신선하네요 너무 힘이 듭니다 ㅎㅎㅎ 공부하는 것보다 더 힘든 것같아요 오전과 오후 13시까지는 유튜버 이형님을 보면서 어떻게 써야 할지 나름 생각하고 고민하는 시간을 가졌어요 말만 들으면 뭔가 알것같고 면접관이 원할만한 내용이 뭔질 딱 촉이 오는데 막상 적을려고 하면 꽉 막힙니다 운동 갔다 와서 쉬지도 않고 내리 적고만 있었습니다 사실 기존에 작성된 자소서가 있었지만 개선해야될 부분이 너무 많아서 전면 재 수정을 해야 했습니다 아무튼 .. 작업이 이제 막 끝냈고 12시 마감이였는데 5분전에 제출은 할수있었습니다. 미리 자소서를 확인해 봤더라면 더 완성도 있게 만들었을 텐데 많이 아쉽네요 .. 점 찍어둔 기업이라서 신중히..

2021-04-07(시계열데이터 심화14_공적분 모형) *본 내용은 시계열데이터 강의 내용 중 일부분을 요약한 내용입니다 공적분 모형(Cointegration Model) 공적분이란 두 비정상성 시계열을 선형조합(Linear Combination)하여 생성한 시계열의 적분(Integration) 차수가 낮아지거나 정상상태가 되는 경우입니다. 위 정의가 어떤 의미인가를 생각해 보자 일단 두 비정상성 시계열 데이터가 필요해 보이고 이 둘 사이에서 뭔가 ''공통''인 부분이 있습니다. 결론부터 말씀드리자면 이 공통이어야 하는 것은 방향입니다. 보통 술에 취한 사람과 개로 예를 듭니다. 술 취한 사람은 비틀비틀 걸어 다녀서 어디로 튈지 모릅니다. 가다가 갑자기 넘어질수도 있고 중심을 잃어서 갑자기 왼쪽으로 휙 방향을 틀 수도 있습니다. 만일 술 취한 사람이 두 명이..

2021-04-06(시계열데이터 심화13_VAR&Granger Causality ) *본 내용은 시계열데이터 강의 내용 중 일부분을 요약한 내용입니다 오늘의 포스팅 내용은 다변량 선형확률입니다. 지금껏 진행 한 것은 Y가 1개인 경우였습니다. 다변량은 Y가 2개 이상인 것을 말합니다. 매출과 광고비가 있을때 단변량에서는 매출이 Y라고 정해놓고 시작했습니다. 하지만 반대로 광고비가 종속변수로써 영향을 더 많이 받는다면 말이 달라지게 됩니다. 따라서 어떤 변수가 가장 영향을 많이 받는 종속변수 인지를 알고자 할때 필요한게 단변량입니다. 단변량 알고리즘 중에서 대표적으로 벡터자기회귀 모형을 먼저 보겠습니다. 벡터자기회귀 모형(Vector Autoregressive Model) 교재에서는 위 내용을 VAR의 정의로 적혀 있는데 직관적으로 이해하기 힘들어서 구글링을 해봤습니다. 나의 과거에만 영..

이전 1 ··· 14 15 16 17 18 19 20 ··· 28 다음

티스토리툴바