본문 바로가기

분류 전체보기84

[통계학 기초] 자료(data)의 종류, 중심과 퍼짐, 상관관계 자료의 종류 양적 자료(numerical data) 양적 자료를 자료 자체가 숫자와 1:1로 대응하는 자료를 의미합니다. 1. 연속형 자료(continuous data) 연속형 자료는 일정 구간의 실수 값을 모두 취할 수 있는 경우를 의미합니다. 2. 이산현 자료(discrete data) 이산형 자료는 정수값을 취하는 자료를 의미합니다. 질적 자료(qualitative data) 질적 자료는 자료가 숫자의 개념이 아닌, 단순히 구분하기 위해서 사용하는 자료를 의미합니다. 1. 명목형 자료(nomial data) 명목형 자료는 단순히 데이터의 구분을 위해 데이터와 숫자를 대응한 것을 의미합니다. 성별을 예로 들어보면, 남자를 1 여자를 0으로 대응시키면, 0과 1은 명목형 자료라고 할 수 있습니다. 2... 2020. 7. 15.
[딥러닝 기초] 총 정리 : 신경망, 경사하강법, 오차역전법 (수정 중) 안녕하세요 :) 이번 게시물에서는 여태까지 배운 내용들을 총 정리해보겠습니다. 아직 이전 게시물을 다 읽어보지 못하신 분들을 한번 쭉~ 읽어보시는걸 추천드립니다! 이번 게시물에서는 신경망의 구조 경사하강법(gradient descent) 오차역전법(back propagation) 합성곱 신경망(convolution neural network) 에 대해서 다뤄보겠습니다. 1. 신경망(neural network) 뉴런 (neuron) 딥러닝 신경망은 우리 몸에 있는 뉴런을 기반으로 만들어졌습니다. 그렇기에 뉴런의 동작 방식을 먼저 알아보겠습니다. 뉴런의 가장 큰 특징은 입력값의 크기가 임계값보다 크거나 같아아지 반응을 한다는 것입니다. 입력값 ≥ 임계값 : 뉴런이 반응함 입력값 < 임계값 : 뉴런이 반응하지.. 2020. 7. 15.
[통계학 기초] 모집단과 표본 우리가 흔히 말하는 빅데이터(big data)는 3V라는 특징을 가지고 있습니다. Velocity : 빠른 속도로 데이터가 증가합니다. Volume : 대용량의 데이터로 구성됩니다. Variety : 여러 형태의 데이터로 구성됩니다. 이러한 데이터는 인공지능(Artificial Intelligence, AI)에서도 중요한 역할을 하고 있습니다. 인공지능에서 입력은 반드시 데이터(자료)의 형태를 갖습니다. 인공지능을 이용한 핵심 기술은 크게 2가지로 볼 수 있는데, 음성인식(voice recognition)과 형상인식(pattern recognition) 입니다. 자율주행 자동차를 두 가지 기술을 모두 사용하는 미래 기술의 대표적인 예시로 들 수 있습니다. 자율주행 자동차에서 사용되는 인공지능에 제공되는 .. 2020. 7. 14.
[딥러닝 기초] 합성곱 신경망(CNN) - 2 안녕하세요 :) 오늘은 저번 게시물에서 마저 다루지 못한 합성곱 신경망에 대해서 더 다뤄보겠습니다. 이전 게시물을 아직 보지 못하셨으면 여기를 클릭해주세요! 이번 게시물에서는 이전에 다룬 유닛의 오차를 합성곱 신경망에서 어떻게 사용할 것인지에 대해서 알아보겠습니다. 합성곱 신경망 합성곱 신경망에서 유닛의 오차(δ) 합성곱 신경망에서는 두 가지 종류의 유닛의 오차가 존재합니다. 합성곱층의 유닛의 오차 출력층의 유닛의 오차 합성곱층과 출력층에 대해서 서로 다른 방법으로 유닛의 오차를 사용하게 됩니다. 1. 출력층 유닛 출력층 유닛의 기울기 성분 유닛의 오차를 이용해서 출력층 유닛의 기울기 성분을 표현해보겠습니다. 출력층을 간략하게 그려보면 다음과 같습니다. 유닛의 오차(δ)를 이용해서 출력층 유닛의 기울기 .. 2020. 7. 13.
[딥러닝 기초] 합성곱 신경망(CNN) - 1 안녕하세요 :) 오늘은 신경망의 여러가지 종류 중 합성곱 신경망(Convolutional Neural Network, CNN)에 대해서 이야기해보겠습니다. 합성곱 신경망(CNN) 합성곱 신경망은 기존에 배운 신경망과는 다르게 은닉층이 여러개의 합성곱(convolution)층과 풀링(pooling)층으로 이루어져 있습니다. 합성곱층에서는 이미지 데이터에 비교하는 패턴과 일치하는 부분이 얼마나 포함되어 있는지 확인합니다. 원하는 패턴이 많이 포함되어 있으면 정보를 적극적으로 다음 층으로 전달합니다. 전달하는 정보는 합성곱층의 유닛에 기록합니다. 풀링층에서는 합성곱층의 활동 정보를 묶어서 정리합니다. 기존의 신경망과 다른 합성곱 신경망의 장점은 다음과 같습니다. 복잡한 패턴인식 문제도 간결한 신경망으로 해결할.. 2020. 7. 11.
[딥러닝 기초] 오차역전법 (back-propagation) 안녕하세요 :) 오늘은 경사하강법의 문제를 해결하기 위한 오차역전법 (back-propagation)에 대해서 다뤄보겠습니다. 오차역전법 (back-propagation) 경사하강법 오차역전법에 대해 이야기해보기 전에 경사하강법을 복습해보겠습니다. 경사하강법을 오차함수에 적용시켜보겠습니다. 간단한 다변수 함수의 최소값을 찾는 경우, 경사하강법은 효율적으로 사용될 수 있습니다. 하지만, 많은 파라미터가 포함되는 경우, 경사하강법으로 최소값을 계산하기 어려워집니다. 경사하강법을 위와 같이 적용하는 경우, 다수의 기울기 성분을 계산하는 비용이 커지게 됩니다. 여러 항을 한꺼번에 미분해서 계산하려면 너무 많은 비용이 들기 때문에 효율적이지 못합니다. 이러한 문제를 해경하기 위해서 오차역번법(back-propag.. 2020. 7. 10.
[Python 기초] 기본 자료형 : 불(bool) 이번에는 파이썬의 기본 자료형 중, 불(bool)에 대해 알아보겠습니다. 불 (bool) 불 자료형은 참(True) 또는 거짓(False)을 나타내는 자료형입니다. 불 자료형은 조건문의 반환값으로 사용됩니다. >>> 2 == 1 # False >>> 1 == 1 # True >>> 2 >> 2 > 1 # True 자료형에도 참/거짓이 있습니다. 문자열, 리스트, 튜플 등의 자료형은 비어있으면 거짓으로 인식합니다. 참(True) 거짓(False) "Fine thank you" "" [1, 2, 3] [] (1, 2, 3) () {"key":"value"} {} 1 0 None bool() 함수를 통해서 해당 값의 참/거짓을 알 수 있습니다. >>> bool("Hello world").. 2020. 7. 10.
[Python 기초] 기본 자료형 : 집합 (set) 이번에는 파이썬의 기본 자료형 중, 집합(set)에 대해 알아보겠습니다. 집합(set) 집합 자료형은 집합과 관련된 연산을 처리하기 위해 파이썬 2.3부터 지원하기 시작한 기본 자료형입니다. 집합 자료형은 set 키워드를 사용해서 생성이 가능합니다. >>> s1 = set([1, 2, 3]) # {1, 2, 3} >>> s2 = set('Hello') # {'H', 'e', 'l', 'o'} >>> s3 = set() 아무런 파라미터 없이 set()만으로 빈 집합을 생성할 수 있습니다. 집합 자료형의 특징은 다음과 같습니다. 원소의 중복을 허용하지 않습니다. 원소의 순서가 없습니다. (unordered) 순서가 없다는 두번째 특징 때문에 집합 자료형에서는 인덱스로 값을 접근할 수 없습니다. 인덱스로 접근.. 2020. 7. 10.
[딥러닝 기초] 신경망과 학습 안녕하세요 :) 오늘은 여태까지 배운 지식들을 기반으로 신경망과 신경망 학습에 대한 이야기를 해볼까 합니다! 1. 신경망 신경망의 파라미터와 변수 파라미터(parameter)는 신경망의 수학적 모델을 정하는데 필요한 상수입니다. 이전에 대분 가중치(weight)와 편향(bias)을 파라미터라고 부릅니다. 파라미터를 제외하고, 신경망의 입력으로 주어지는 데이터 값에 따라서 변하는 변수가 필요합니다. 그러므로, 신경망에서는 데이터를 저장하는 변수 모델을 결정하는 파라미터 로 구성됩니다. 이해하기 쉽게 단순회귀분석을 예시로 들어보겠습니다. y = px + q 라는 회귀방정식을 살펴보면, 절편(q)과 회귀계수(p)는 파라미터에 해당하고, 독립변수(x), 종속변수(y)는 변수에 해당합니다. 파라미터와 변수의 이름.. 2020. 7. 9.