🎸/딥러닝

[딥러닝의 정석] 신경망 (1장 - 1: 신경망 필요한 개념 정리)

컴공생 C 2020. 7. 8. 11:33
반응형

딥러닝의 정석 1장 - 신경망

 

기존의 컴퓨터와 머신러닝은 무엇이 다른가?

지금까지의 프로그램은 1)연산하기 2) 명령어 리스트 수행하기 

 

머신러닝

사람이 감각적 입력을 받아 사물을 인식하는 것처럼 어떠한 모델을 통해 문제를 해결하는 것

수학 공식 처럼 규칙을 컴퓨터에 가르치는 것이 아니라 실제 사례를 통해 배운다는 개념! 

컴퓨터에 제공하는 것 : 경험을 평가할 수 있는 모델+ 실수했을 때 모델을 수정하기 위한 작은 명령어 집합

 

딥러닝

머신러닝의 한 부분. 개념으로 따지자면 딥러닝⊂ 머신러닝

"딥러닝은 사물이나 데이터를 군집화하거나 분류하는 데 사용하는 기술"

딥러닝은 인공 신경망의 한계를 극복하기 위해 제안된 방법

 

인공신경망

인공신경망을 이해하기 위해서는 뉴런에 대한 이해가 필요하다.

뉴런은 사람 뇌의 기본단위로 가지돌기-신경세포체-축삭돌기- 신경말단의 기본구조를 갖는다.

생1에서 배울때 신경의 기본단위라고 배웠던 거같은데 어떠한 자극을 받으면 뉴런 A에서 B로, C로 쭉쭉 전달해서 뇌로 전달하고 뇌에서 판단을 하고 명령을 내린다.

 

뉴런의 기능은 단순화 시켜서 생각하면 

외부 자극을 받아들이고 -> 자극을 신호로 바꾸고 -> 신호를 다른 뉴런으로 전달 
      ( 가지돌기 )                      ( 신경 세포체  )                     ( 축삭 돌기 )

 

생명과학에서는 이거를 상당히 관념적으로 역치이상의 자극,,이 오면 어떻게 되고 이렇게 배운것 같은데 여기서는 조금 더 수학적으로 접근한다.

 

가지돌기에서는 외부자극을 입력 받는다.

이 자극이 활동전위보다 큰 자극만을 신경세포체로 전달한다. 이 입력되는 연결이 얼마나 빈번한지에 따라 강도가 약해지거나 강해진다. 이 연결이 자주 사용되면 입력의 기여도가 증가하고 이 강도만큼 입력은 가중되어 신경세포체에서 모두 더해진다.

 

입력받은 데이터 x=[ x1, x2 ] 에 대해 파라미터 벡터 [θ1, θ2] 를 곱해 연산한다. 

이 합이 일정한 값을 넘으면 활성화되어 출력값을 내보낸다. 

그러면 이 출력값을 다른 뉴런으로 축삭돌기를 통해 전달한다.

 

이 출력값을 분류하는 기준이 되는 함수로 선형 퍼셉트론을 사용하거나 비선형성을 도입한 뉴런은 시그모이드 함수(Sigmoid function), 쌍곡탄젠트(tanh), 제한된 선형유닛(렐루 ReLU) 함수를 사용한다.

반응형