2014-05-01 6 views
0

일부 서적을 읽었지만 네트워크를 어떻게 구성해야하는지 아직 알 수 없습니다. 예를 들어, 크기 120 * 100 인 pgm 이미지가 있고, 입력이 (120 * 100 크기의 1 차원 배열처럼) 어떻게되어야합니까? 그리고 얼마나 많은 노드를 적용해야 하는가.얼굴 인식에 BP 네트워크를 사용하기 위해 노드 수를 선택하는 방법은 무엇입니까?

+0

노드 수와 관련하여 사용할 "올바른"노드 수가 없습니다. 입력은 1 차원 행렬 (벡터)이어야합니다. 너무 많은 정보를 잃지 않고 이미지 픽셀 그룹을 클러스터링하여 더 작은 이미지를 얻을 수 있다면 학습 과정의 속도가 빨라집니다. – jorgenkg

+0

@ jorgenkg 고마워요! – litaoshen

답변

1

일반적으로 입력 이미지를 2D 매트릭스로 구성하는 것이 가장 좋습니다. 그 이유는 기계 인식 작업에 사용되는 신경망의 하위 레벨에있는 레이어가 일반적으로 로컬로 연결되기 때문입니다. 예를 들어, 그러한 신경망의 제 1 층의 각 뉴런은 입력 이미지의 작은 N × N 패치의 픽셀만을 처리 할 것이다. 이것은 자연스럽게 2D 행렬로 더 쉽게 설명 될 수있는 2D 구조로 연결됩니다.

자세한 내용은 얼굴 인식 시스템의 최신 기술을 설명하는 DeepFace 종이를 참조하십시오.

1

120 * 100 일차원 벡터는 이다. 모든 노드가 다음 계층의 노드와 완전히 연결되어 있기 때문에 해당 벡터의 픽셀 값 위치는 중요하지 않습니다. 그러나 교육, 검증 및 테스트 사이의 위치와 일치해야합니다.

1

지금까지 가장 성공적인 접근 방식은 @benoitsteiner가 말한 것처럼 2D 입력이있는 길쌈 신경망을 사용하는 것이 었습니다. 훨씬 간단한 예를 들면, MNIST 손으로 쓴 숫자 인식을 위해 개발 된 작은 신경망 인 LeNet-5를 소개합니다. 그것은 꽤 좋은 결과와 함께 얼굴 인식을 위해 EBLearn에서 사용됩니다.