2017-04-10 10 views

답변

2

을 (직접 이미지를 게시 할 수있는 충분한 명성을하지 않음), 시대는 하나의 전진 패스와 모든 훈련 예제의 뒤로 패스로 정의 할 수 있습니다. 우리는 즉시 모든 뉴런을 네트워크에 공급하지 않습니다. 대신, 우리는 일련의 뉴런 (미니 배치)을 선택하고 그들을 공급합니다. 우리는 훈련 데이터의 작은 하위 집합을 앞뒤로 처리합니다. 우리는 확률적인 그래디언트 디센트를 수행 할 수 있고 네트워크가 오버 피팅되는 것을 방지하기 위해이 작업을 수행합니다. 개별 교육 단계 시간과 총 교육 시간에는 차이가 있습니다. 예를 들어, 네트워크에 30 개의 교육 단계가있는 경우 총 교육 시간 = 30 개의 모든 교육 단계를 완료하는 데 필요한 시간.

enter image description here

[15] S. Chintala. convnet-benchmarks, github.com/soumith/convnet-benchmarks.

AlexNet 들어

enter image description here

가 CAFFE 훈련 공정 시간은 324이다

enter image description here

다음 테이블을 참조 [15]을 확인하십시오 ms. 총 시간 = 앞으로 + 뒤로 = 121 + 203