728x90

오늘 새롭게 계획을 세웠습니다. 그 첫걸음은 R! 

작년에 R 강의 들으면서 공부하다가 중간에 중단을 하게 되었습니다. 살짝 늦은 감이 있는 것같지만

처음부터 강의 들으면서 공부하려고 합니다. 

 

가장 베스트는 이번달 안에 태양열에너지 프로젝트 + R 온라인 완강이 목표입니다.

그래서 틈틈히 R공부하면서 태양프로젝트까지 같이 하고 있습니다. 

 

오늘 R 배운 내용은 처음부터 하는 거라 가장 기본적인 것들이였습니다. 그래서 실습으로 업로드 하기엔 아닌것 같아서 

이 기록장에 간단하게 열거로 기록하겠습니다.

 

1. R studio 설치 및 사용법

2. 데이터 분석 기본기 (아래 진도 나간 부분)

 작년에 모두 배웠던 내용이였는지라 이해하기 편했습니다. 

 

아 그리고 6월달 목표한 R + 프로젝트가 계획대로 끝난다면 바로 computer vision 중급 과정을 배우려고 합니다. 

이미지와 관련된 학문이므로 딥러닝이 반드시 나올텐데, 이때 제가 배우고 있었던 딥러닝수학을 함께 병행하면서 

이해력을 높히고자 합니다. 

 

요약하자면

6월 : 태양열 에너지 프로젝트 + R 완강&실습

7월 : computer vision 중급 + 딥러닝 수학

8월 : 태블루,SQL,하둡 or ADSP자격증 시험 준비를 계획중입니다.

 

*태양 프로젝트

오늘은 로그 정규화 하기 전후를 비교 해봤습니다.

log 정규화 시킨 validation plot
log 정규화 안한 validation plot

두 그래프의 눈에 띄는 차이점은 에너지값 0에 대한 예측값입니다. log를 취해주면 0을 0이라 인식하고 

log를 하지 않으면 마이너스값을 출력합니다. 사실 그동안 0값을 마이너스값으로 예측하는 점 때문에 고민을 많이 했었습니다. 그래서 저 두 결과값을 합쳐봤습니다. 

합친 결과값

성능값이 그닥 좋지 않습니다. 두 결과값에 각각 비율을 할당해도 성능은 제자리 걸음이였습니다.

현재 val 값이 가장 좋은 모델은 랜덤입니다. 저는 시계열 모델로 어떻게든 성능을 뽑아 내고 싶은데 쉽지 않습니다.

 

내일은 log정규화 상태에서 성능을 어떻게 하면 더 끌어 올릴지 연구 해봐야 할것같습니다 

728x90

+ Recent posts