ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Perceptron
    AI 2026. 1. 29. 05:37

    퍼셉트론은 1957년 프랑크 로젠블라트가 제안한 초기 형태의 인공 신경망 알고리즘입니다. 인간의 뇌 세포인 뉴런(Neuron)이 신호를 전달하는 방식을 모방했습니다.

     

    하나의 노드(원) 안에서는 다음과 같은 일련의 과정이 일어납니다.

    $$y = f(\sum_{i=1}^{n} (w_i x_i) + b)$$

    [입력($x$) × 가중치($w$) + 편향($b$)] → 활성화 함수 → 출력($y$)

    • 가중치($w$): 각 입력 신호가 결과에 주는 영향력을 조절하는 '중요도'입니다.
    • 편향($b$): 노드가 얼마나 쉽게 활성화(1을 출력)될지를 결정하는 '민감도'입니다.
    • 활성화 함수($f$): 계산된 총합이 기준을 넘으면 신호를 보내고, 아니면 차단하는 역할을 합니다.

    노드(Node) vs 퍼셉트론(Perceptron)

    보통 혼용해서 쓰지만, 엄밀히 따지면 다음과 같습니다.

    • 노드(또는 뉴런): 신경망을 구성하는 동그라미 하나를 의미하는 단위입니다.
    • 퍼셉트론: 저 노드가 '입력-계산-활성화-출력'을 하는 알고리즘 그 자체를 부르는 명칭입니다.

    시작은 '이진 분류'였습니다. 초기의 퍼셉트론은 입력 데이터를 바탕으로 "이것은 A인가, B인가?"를 결정하는 분류(Classification) 목적으로 태어났습니다. 하지만 현대의 딥러닝에서는 이 퍼셉트론들이 수없이 모여 회귀(수치 예측)나 생성(텍스트/이미지) 등 모든 인공지능 작업의 가장 작은 계산 단위(Building Block)로 사용됩니다.

     

    Signle Layer Perceptron

    단층 퍼셉트론은 노드를 활용해 실제 정답과 비교하고, 오차를 줄이기 위해 가중치를 갱신하며 스스로 학습하는 '시스템' (단일 층으로 이루어진 학습 모델)입니다.

     

    단층 퍼셉트론은 입력층과 출력층으로만 구성됩니다. 이는 수학적으로 선형 분리(Linear Separation)만 가능하다는 뜻입니다.

    • AND, OR, NAND: 직선 하나를 그어 참/거짓을 완벽히 분리할 수 있습니다.
    • XOR 문제: 하지만 입력값이 서로 다를 때만 1이 되는 XOR는 어떤 직선을 그어도 0과 1을 분리할 수 없습니다.

    AND, OR (직선 하나로 해결 가능)

    OR 게이트를 예로 들어볼게요. (입력 중 하나라도 1이면 결과가 1인 경우)

    • (0,0) → 0 (빨간 점)
    • (1,0) → 1 (파란 점)
    • (0,1) → 1 (파란 점)
    • (1,1) → 1 (파란 점)

    이 점들을 좌표평면에 찍으면, (0,0) 근처에 직선 하나만 슥 그어도 0(빨강)과 1(파랑)을 완벽하게 가를 수 있습니다. 이걸 "선형 분리가 가능하다"고 합니다.

    XOR (직선 하나로 절대 불가능)

    하지만 XOR은 다릅니다. (입력이 서로 다를 때만 1인 경우)

    • (0,0) → 0 (빨간 점)
    • (1,1) → 0 (빨간 점)
    • (1,0) → 1 (파란 점)
    • (0,1) → 1 (파란 점)

    좌표를 찍어보면 파란 점 두 개가 대각선으로 마주 보고 있고, 빨간 점 두 개가 반대쪽 대각선으로 마주 보고 있습니다.

    여기서 직선 하나만 그어서 파란 점 두 개만 따로 묶어보세요.

    • 가로로 그으면? 안 됩니다.
    • 세로로 그으면? 안 됩니다.
    • 대각선으로 그으면? 하나는 묶이지만 다른 하나가 빠집니다.

    결국 직선(Linear) 하나로는 이 데이터를 절대 나눌 수 없습니다. 

     

     

     

    Multi-Layer Perceptron, MLP)

    1960년대 인공지능 연구의 암흑기를 끝낸 해답은 의외로 간단했습니다. "직선 하나로 안 되면, 여러 개를 겹치면 된다!"는 것이었죠.

    은닉층(Hidden Layer)의 등장

    입력층과 출력층 사이에 은닉층이라는 중간 단계를 추가하여 층을 쌓기 시작했습니다.

    1. 은닉층에서 데이터를 여러 번 가공합니다.
    2. 가공된 데이터들이 조합되면서, 직선으로는 불가능했던 곡선(비선형) 형태의 경계선을 만들어냅니다.
    3. 결국 XOR 문제뿐만 아니라 훨씬 더 복잡한 패턴(이미지, 음성 등)도 인식할 수 있게 됩니다.

    이것이 바로 '딥러닝(Deep Learning)'의 시작입니다. 층(Layer)을 깊게(Deep) 쌓을수록 모델은 더 똑똑해집니다.

     

     

     

Designed by Tistory.