본문 바로가기

728x90

Data Diary

(166)
2021-08-12(태블로_중급) *중급편 부터는 기초편과 중복되는 학습 내용을 스킵했습니다.* 1.대시보드 만들기 대시보드를 통해 연간매출,월매출,시도별매출을 연결 가능하다. 1-1.연간매출 1-2.월매출 1-3.시도별매출 1-4.대시보드 만들기 순서: 맨 밑에 대시보드 워크시트를 클릭 -> 왼쪽 상단 크기 항목 부분에 고정된 크기(데스크타 브라우저)로 설정 -> 왼쪽 시트란에 있는 연간, 월간, 시도 매출을 드래그 하여 아래 그림처럼 배치 -> 고객 세그먼트 범례는 아래 그림처럼 부동을 클릭하여 위치 자유롭게 설정 -> (아래 이어서) -> 대시보드 메뉴의 동작 클릭 -> 동작 추가 -> 필터 -> 아래처럼 설정하게 되면 특정 연간 매출을 클릭시 월간, 시도별 매출에 영향을 준다 -> 같은 과정을 반복하여 월간 매출 클릭 시 연간 및..
2021-08-11(딥러닝 수학8_Mini-batch and vectorization) minibatch x,ydata를 위와 같이 하나씩 가져와서 업데이트를 진행할때의 문제점은 cost가 크다는 점이다. 만일 백만개 데이터가 있다면 이를 하나씩 접근해서 구하기엔 비효율적이다. 이를 해결하기 위해서 아래와 같이 접근할수 있다. 5개를 한번에 뽑아서 각 loss들의 평균을 구한 cost 가지고 편미분하여 theta를 업데이트한다. 5번 실행 할 것을 한번으로 끝낼수 있다는 장점이 있다. 배치를 이용하면 cost를 사용하게 되므로 위 그림과 같은 과정으로 업데이트가 이뤄진다. dn 까지의 dataset이 있을때, 각 dataset 마다 superscript를 표시 할수 있다. 두개의 dataset 각각 loss를 구한 뒤, 평균을 내면 cost로 바뀐다. 배치 사이즈가 2라면 위 과정처럼 진행..
2021-08-10(태블로_기초편) 1. 부분 전체 분석 1) 누적 막대 차트 1-1) 절대값을 토대로 누적막대차트 보기 -> 각 연도별로 100% 비율로 맞출려면 아래 그림처럼 테이블 아래로를 클릭해야 한다. 1-2) 상대값을 토대로 누적막대차트 보기 행 선반에 있는 합계(매출)를 누른 뒤 구성비율을 % 변경 후, 위와 마찬가지고 테이블을 아래로 버튼을 누르면 각 년도별 100%비율로 변경되어서 각 연도별로 어떤 변화가 있었는지 비교해보며 인사이트를 얻을수 있다. 2) 파이 차트 3) 도넛차트-파이차트에서 표현 못한 요약정보를 표시할수 있다. 두개의 파이차트를 겹쳐서 만들수 있다. 4) 트리맵- 구성비율이 비슷하 자잘한 항목이 많을때 유용하다 부분 전체 분석은 전체에서 각각의 멤버들의 값이 어느 정도의 비율을 차지하는지 살펴보는데 적합하..
2021-08-09(딥러닝 수학 7_ gradient descent2 & learning late) 1. Gradient Descent Method 2 실제 문제에서는 변수가 여러개 있으므로 위 그림처럼 convex한 모양을 가지고 있지 않을 것이다. 어떤 모양인지는 모르겠지만 핵심은 특정 포인트에 대한 gradient만을 알수 있다. 초록색 점 포인트의 gradient는 음수가 나왔음을 알수가 있는 것이다. 비유를 한다면, 껌껌한 밤에 땅에 기울기만을 느끼면서 우리는 본능적으로 기울기가 아래로 향하는 쪽으로 내려갈것이다. 그렇다면 산 아래쪽으로 내려가는 방향을 알려주는 것이 마이너스 gradient이다. 일반적으로 미분하여 나온 gradient는 값이 증가하는 방향을 기본적으로 가리킨다. 여기에 마이너스를 붙여주면 반대방향을 가리키므로 기울기가 감소하는 방향, 즉 0이 되는 지점을 가리키게 된다. 따..
2021-08-06(태블로 기본컨셉 이해하기) iflearn의 태블로 강의내용입니다.혹시 태블로 관심 있으신 분은 iflearn에서 무료로 수강 하시면 됩니다 *본 강의에 앞서 측정값 측정값은 #모양으로 아래에 배치가 되어있고, 차원은 그 위에 배치되어 있다. (#은 숫자타입을 뜻함) 기본 속성으로 합계로 설정되어 있어서 매출을 더블클릭할 경우 매출의 합계가 자동으로 계산된다. 수입은 합계가 타당하지만 할인율도 합계로 계산되다 보니까 1637로 표현되었다. 할인율은 평균으로 계산되도록 아래와 같이 수정 해야한다 시트가 바뀌면 할인율 집계방식은 본래대로 합계로 계산된다. 이를 고치기 위해서는 아래와 같은 방법을 통해서 해당 컬럼에 대한 기본 집계방식을 수정하면 된다. 차원 -현재view에 만들어진 1개의 차트를 어떻게 나눠서 볼건지를 결정 전체를 드래..
2021-07-29(Mask-RCNN_Segmentation) Semantic Segmentation이란 masking 정보를 씌어서 전체 이미지에서 문맥적으로 의미 있는 형태를 찾아내는 개념이다. Instance Segmentation과 차이점이 있다면 동일한 객체에 대한 표현방식에 있다. Semantic은 동일 객체를 같은 색으로 분류했고 Instance는 Object Detection처럼 개별 객체에 masking 정보가 적용된다. 지금부터 배울 Mask-RCNN은 Instance Segmentation의 대표적인 방법이다. 이에 앞서 Semantic 지식이 필요하다. 왜냐하면 Mask-RCNN은 Faster-RCNN과 Semantic Segmentation 기법 중에 하나인 FCN이 결합된 형태이기 때문이다. 따라서 Semantic Segmentation 의..
2021-07-26(RetinaNet & EfficientDet) RetinaNet RetinaNet이 나오기 전까지는 one-stage 는 수행 시간이 짧아서 좋지만 수행능려은 faster RCNN보다 떨어진다는 인식이 있었다. one-stage의 고질병이던 작은 객체검출 문제를 개선시킴 검출해야할 객체보다 백그라운드가 많아서 대부분 앵커박스들이 백그라운드에 학습값으로 치중이 된다. 반면 적은 수의 foreground에서 정보를 가져와야하는데 백그라운드 정보 때문에 압도가 된다. 따라서 Object Detection은 본질적으로 이런 문제를 안고 있다. 동적으로 Cross entropy를 조절하는 방법이 focal Loss이다. focal Loss focal Loss는 Cross entropy에 가중치를 부여하는 개념이다. 위 그림이 Focal loss의 factor..
2021-07-20(Yolo) 실습 링크 2021.07.20 - [기록 note] - 2021-07-20(Yolo) 2021-07-20(Yolo) 간략한 개요 *V2는 V1보다 성능 개선 되었지만 SSD보다는 떨어짐 V1 448*448이미지를 7*7 Grid로 만들면 위 그림처럼 49개의 sell이 생성된다. 생성된 각각의 셀(작은 정사각형) 이 하나의 Object에 대한 dete ghdrldud329.tistory.com 간략한 개요 *V2는 V1보다 성능 개선 되었지만 SSD보다는 떨어짐 V1 448*448이미지를 7*7 Grid로 만들면 위 그림처럼 49개의 sell이 생성된다. 생성된 각각의 셀(작은 정사각형) 이 하나의 Object에 대한 detection을 수행한다. 기존 two-stage에서는 객체의 위치를 찾기 위해서 ..