일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- hierarchical clustering
- GAN
- 이미지 초해상화
- K-means
- CV
- Faster R-CNN
- 군집화
- SRGAN
- Clustering
- super-resolution
- Object Detection
- 적대적 생성 신경망
- Deep Learning
- Fast R-CNN
- Region Proposal Networks
- RPN
- 비지도학습
- 군집
- Today
- Total
목록데이터과학을 위한 통계 (6)
수혁지능
이 글은 데이터 과학을 위한 통계(앤드루 브루스)를 참고했음을 미리 밝힙니다. 회귀의 목적 전통 통계학: for 설명을 위한 모델링 데이터 과학: for 예측 외삽(데이터 범위 초과)의 위험 회귀분석은 충분한 데이터 값이 있는 예측변수(독립변수)에 대해서만 유효하다 >> 데이터 범위를 초과하면서까지 모델을 확장하면 안된다! 신뢰구간과 예측구간 신뢰구간: 회귀계수 주변의 불확실성 정량화 / 여러 값에서 계산된 평균이나 다른 통계량과 관련. 예측구간: 개별 예측값의 불확실성 정량화/ 하나의 값에 대한 불확실성 (P개의 예측변수(X)와 n개의 레코드가 있는 데이터) 각 행(결과변수 Y 포함)을 하나의 티켓으로 생각하고 개수가 모두 N개인 티켓 박스에 넣었다고 가정 무작위로 티켓 뽑아 값을 기록하고 다시 박스..
사전지식 두 확률 변수 A,B 의 조건부확률,사전 확률,사후 확률에 대해 알아보고 베이즈 정리에 대해 살펴보자. 여기서 P(A|B)라는 조건부확률은 사건 B가 일어난 후 사건 A가 일어난 확률이다. 여기서 사건 B는 먼저 일어난 일이므로 Before라 정의하고 사건 A는 나중에 일어난 일이므로 After라고 정의한다. 조건부확률 P(B)는 사건 A가 발생하기 전 사건 B가 일어난 확률이므로 사전 확률이라 할 수 있고, P(B|A)는 사건 A가 일어났을 때 사건 B가 앞서 일어났을 확률이므로 사후 확률이라고 할 수 있다. 이 확률들은 아래 그림과 같이 '베이즈 정리'로 묶일 수 있다. 베이즈 정리 나이브 베이즈 나이브 베이브 알고리즘은 주어진 결과에 대해 예측변숫값을 관찰할 확률을 사용하여, 예측변수가 주..
트리 모델 트리 모델은 CART(classification and regression tree), 의사결정트리(decision tree), 트리(tree)라고 불리며, 효과적이고 대중적인 분류 및 회귀 방법이다. 여러 가지 규칙을 순차적으로 적용하면서 독립 변수 공간을 분할하는 분류 모형이라고 할 수 있다. 즉, 트리 모델은 if-then-else 규칙의 집합체이며 이해하기도 쉽고 구현하기도 쉽다. 선형회귀나 로지스틱 회귀와 반대로 트리는 데이터에 존재하는 복잡한 상호관계에 따른 패턴들을 발견하는 능력이 있다. KNN이나 나이브 베이즈 모델과는 달리, 예측변수(X)들 사이의 관계로 단순 트리 모델을 표시할 수 있고 쉽게 해석도 가능하다. 간단한 예제 코드 저번 주차에 사용했던 loan3000 데이터를 이..
K-Means Clustering Clustering(군집화)이란 데이터를 서로 다른 그룹으로 분류하는 기술을 말한다. 각 그룹에는 서로 비슷한 데이터들이 속하며, 클러스터링의 목적은 데이터로부터 유의미한 그룹들을 구하는 것이다. K-Means는 최초로 개발된 클러스터링 기법으로서 알고리즘이 상당히 간단하고 데이터가 커져도 손쉽게 사용할 수 있다는 장점이 있다. K-Means는 데이터를 K개의 클러스터로 나눈 뒤, 할당된 클러스터의 평균(클러스터 안에 속한 레코드들의 평균 벡터)과 포함된 데이터들의 거리 제곱합이 최소가 되도록 한다. 데이터들의 거리 제곱합을 클러스터 내 제곱합 혹은 클러스터 내 SS라고도 한다. 또한, 클러스터들끼리는 최대한 멀리 떨어지도록 한다. 예시를 하나 들어보면서 K-Means에..