전체 글

싱싱한 자연어를 탐구합니다.
Image Digitization : Sampling & Quantization 샘플링(Sampling) Continuous한 데이터들 가운데 적당히 유한한 개수의 데이터를 뽑아내면서, 전체의 패턴을 추정하기 위한 데이터 수집 행위 해상도와 관련있는 개념이며, 연속적인 신호에서 일정한 간격으로 샘플을 추출하여 pixel 단위로 나누는 과정이다. 샘플링은 이미지의 해상도를 줄이거나, 이미지에서 필요한 정보를 추출하는 등의 용도로 사용된다. e.g., 영상에서 일정한 간격으로 픽셀을 추출 양자화(Quantization) 아날로그 형태로 Sampling한 데이터(신호)를 디지털화하는 작업 bit 수와 관련있는 개념이며, 연속적인 신호를 분할하여 이산적인 값을 가지도록하는 과정이다. e.g., 이미지에서 픽셀의..
원본 문제 석차 계산 [문제 2] 정렬되지 않은 학생들의 임의의 점수를 입력하여 석차를 계산하는 프로그램을 작성하시오. 점수는 동점이 있을 수 있으며, 이러한 경우 같은 석차로 처리한다. 예를 들어 5명의 점수 100, codeup.kr #include struct group { int idx; int score; int grade; }; int main() { struct group student[200]; int n; scanf("%d", &n); for (int i=0; i0; i--){ for (int j=0; j
(Shannon) Entropy, Cross Entropy, KL Divergence 참고하면 좋은 자료 : KL divergence - 공돌이의 수학정리노트 KL divergence - 공돌이의 수학정리노트 angeloyeo.github.io Entropy Entropy는 정보 이론에서 사용되는 개념 중 하나로, 어떤 확률 분포가 가지는 정보의 평균적인 양을 나타내는 값이다. 정보량이 많을수록 Entropy 값은 높아지며, 정보량이 적을수록 Entropy 값은 낮아진다. 여기서 p(x)는 확률 분포를 나타낸다. Examples 엔트로피를 이해하기 위해 동전 던지기의 예를 고려할 수 있다. 공정한 동전이 있다면 이 시스템의 엔트로피는 1이 될 것이다. 즉, 평균적으로 각 동전 던지기에서 1비트의 정보를 ..
K-Nearest Neighbors What is K-Nearest Neighbors? K-Nearest Neighbors(K-최근접 이웃, K-NN)은 머신 러닝 알고리즘 중 하나로, 데이터 분류 및 회귀 분석에 사용되는 Supervised-learning 방식의 알고리즘이다. K-NN은 데이터를 분류할 때, 가장 가까운 K개의 이웃 데이터 포인트를 찾아 이들의 클래스를 기반으로 해당 데이터 포인트의 클래스를 결정한다. 이 때, 데이터 간의 거리를 측정할 때에는 L2 Distance (Euclidean distance)가 사용된다. K-NN의 장점 단순하고 효율적이다. 모델 훈련이 필요하지 않다. 학습 데이터가 많은 경우에도 학습 시간이 빠르다. 다중 클래스 분류가 가능하다. K-NN의 단점 데이터가 ..
Distance Metric to Compare Vectors (Data) L1 Distance (Manhattan distance) VS. L2 Distance (Euclidean distance) L1 Distance와 L2 Distance는 두 벡터 간의 거리 또는 유사성을 측정하는 일반적인 방법이다. Manhattan distance라고도 하는 L1 Distance는 두 벡터의 해당 요소 간 절대 차이의 합이다. 수학적으로 두 벡터 p와 q 사이의 L1 Distance는 아래와 같이 정의된다. L1 Distance (Manhattan distance): 택시가 한 지점에서 다른 지점으로 이동하기 위해 그리드와 같은 도로 시스템을 따라 이동해야 하는 거리를 측정한다는 사실에서 이름을 얻었다고 한다...
Class Variation Intra-class Variation vs. Inter-class Variation Class Variation이란 데이터의 클래스가 얼마나 떨어져 있는지(분산)을 나타내는 표현이다. Class Variation의 표현에는 크게 Inter-class Variation과 Intra-class Variation이 있다. Inter-class Variation : 다른 클래스 간의 분산을 나타내는 표현 Intra-class Variation : 같은 클래스 내부의 분산을 나타내는 표현 두 단어들의 발음이 비슷해서 더 헷갈리는 것 같다. 하지만 인트라넷이 어떤 조직의 폐쇄적인 내부망을 의미한다는 것을 떠올리면 어렵지 않다. Examples 위 두 예시들은 데이터들의 클래스 분포를 ..
oneonlee
One Only