전체 글 288

통계 - Random Variable, Probability Distribution, PDF, CDF, PMF, CMF

확률 변수, 확률 분포, PDF, CDF 는 통계에서 항상 따라 다니지만, 개념이 제대로 안집히면 항상 햇갈리고 고생하는 용어이며 개념입니다. 이번 기회에 용어 및 개념 정리를 합니다. ※ 통계는 개념 못지 않게 Definition이 중요한 것 같습니다. 햇갈리지 않게 용어에 대한 개념을 확실히 익힙니다. Random Variable(확률변수) Definition 1. 확률적인 결과에 따라 결과값이 바뀌는 변수를 묘사하는 통계학 및 확률론의 개념 2. 어떤 시행의 결과에 따라 변수 X가 가지는 값과, 확률이 정해질 때, 이 변수 X를 확률 변수라 함. 즉, 어떤 확률 공간에서 확률 값을 나타내는 특정 값이 될 수 있는 변수를 확률 변수라 합니다. ※ 확률 공간(probability space) : 전체 ..

머신러닝/통계 2021.03.13

python - Mixin

Python에서 Mixin 개념을 정리합니다. Mixin네 이렇게 섞는 겁니다.. (포스팅에서는 python class code를 Mixin합니다.) DefinitionMixin은 OOP 프로그래밍 개념으로 특정 클래스의 코드를 다른 클래스에 삽입(혼합) 할 수 있도록 합니다. Python에서는 다중 상속 문법으로 Mixin을 구현합니다. 개념적으로 Mixin 클래스는 부모클래스가 되지 않으면서 어떤 클래스에서 사용할 수 있는 메소드를 포함하는 클래스입니다. 다시 한번, Mixin은 상속의 개념으로 쓰는 것이 아니라 끼워넣는 개념에 가깝습니다. Charateristic1. Mixin 할 때, 동일한 속성 및 메소드는 Overriding이 됩니다. Python 에서 다음처럼 다중 상속을 하면12class ..

Tensorflow 2.0 - Text classification by TF Hub

※ Tensorflow Hub : 일반화된 문제들에 대해서 모델의 재사용성을 극대화 하기 위해 구글에서 공개한 API, 미리 훈련된 모델을 FIne Tuning하여 쉽게 사용할 수 있음. ※ hub 설치 pip install tensorflow-hub ※ tfds 서치 pip install tensorflow_datasets Tensorflow Hub를 이용해서 기존 text classficiation 을 해봅니다. Code 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 import numpy as np import tensorflow as tf i..

Leetcode - [Medium]3. Longest Substring Without Repeating Characters

leetcode.com/problems/longest-substring-without-repeating-characters/ Longest Substring Without Repeating Characters - LeetCode Level up your coding skills and quickly land a job. This is the best place to expand your knowledge and get prepared for your next interview. leetcode.com Solution 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 3..

통계 - Normal distribution 어렵지 않아요

Normal Distribution Definition 기초 통계에서 빠질 수 없는 Normal distribution(정규 분포)에 대해 정리합니다. 독일 수학자 가우스(1777 ~ 1855)가 처음 개념을 정립해서 '가우시안 분포'라고 하기도 합니다. 우선 생긴건 이렇게 생겼습니다. 이 종모양의 확률밀도함수를 어떻게 해석하고 의미를 부여하느냐에 따라 상당히 많은 것을 할 수 있습니다. 자연 현상이나 사회 현상에서 나타나는 여러가지 통계자료를 히스토그램으로 그리면, 자료의 개수를 늘릴수록, 계급의 크기를 작게 할수록 좌우대칭인 종모양의 곡선에 가까워집니다. 데이터 분석이라고 하는 것이, 데이터의 특성을 파악하고 분포에 따른 분류 작업이 주를 이룹니다. 그래서 보통 데이터 분포가 Normal Distri..

머신러닝/통계 2021.03.07
반응형