LeNet

정의
LeNet은 컨볼루션 신경망(CNN, Convolutional Neural Network)의 초기 형태로, 주로 손글씨 숫자 인식을 위해 개발된 인공신경망 아키텍처이다.

개요
LeNet은 1990년대 초 요슈아 벤지오(Yoshua Bengio), 얀 르쿤(Yann LeCun) 등이 벨 연구소(Bell Labs)에서 개발한 신경망 구조로, 딥러닝 발전의 기초를 다진 중요한 모델로 평가받고 있다. LeNet은 특히 미국의 우체국에서 수동으로 작성된 우편번호 인식을 자동화하는 데 활용되었으며, 이미지 인식 분야에서 컨볼루션 레이어, 풀링 레이어, 전결합 레이어를 체계적으로 구성한 최초의 사례 중 하나이다. 이후 나온 더 복잡한 CNN 아키텍처(예: AlexNet, VGG 등)는 LeNet의 기본 구조를 확장하여 발전시킨 것으로 간주된다.

어원/유래
“LeNet”이라는 이름은 주요 개발자인 얀 르쿤(Yann LeCun)의 성(Lecun)에서 유래하였다. 네트워크의 초기 버전인 LeNet-1부터 후속 모델인 LeNet-5까지 개선되며, 가장 널리 알려진 구조는 LeNet-5이다. LeNet-5는 1998년에 발표된 논문 《Gradient-Based Learning Applied to Document Recognition》에서 구체적으로 기술되었다.

특징
LeNet의 주요 구성 요소는 다음과 같다:

입력 이미지(예: 32×32 픽셀 그레이스케일 손글씨 숫자)를 처리하는 컨볼루션 레이어.
하위 샘플링(즉, 풀링) 레이어를 통해 특징 맵의 공간 차원을 축소.
다수의 컨볼루션 및 풀링 계층을 반복적으로 적용한 후, 전결합 레이어를 통해 최종 분류 수행.
시그모이드 또는 하이퍼볼릭 탄젠트 함수를 활성화 함수로 사용(최근에는 ReLU 등 다른 함수로 대체 가능).

이러한 구조는 이미지 데이터의 공간적 계층 구조를 효과적으로 학습할 수 있게 하였으며, 역전파 알고리즘을 기반으로 가중치를 학습하는 방식을 채택하였다.

하나의 검색으로 의미, 맥락, 관련 주제까지 바로 찾으세요.

더 찾아볼 만한 주제