2017-04-07 10 views
2

내 tensorflow 모델의 입력 이미지에서 이미지 패치를 추출하고 싶습니다. 입력 이미지가 [batch, in_width, in_height, channels]이라고 가정하면 [no_patches, patch_width, patch_height, channels]을 출력하고 싶습니다. no_patchesinput_image에서 추출 할 수있는 총 패치 수입니다.tf.extract_image_patches의 인수를 설정하는 방법

나는 tf.extract_image_patches이 작업을 수행 할 수 있음을 알았습니다. 그러나 인수의 차이를 이해하지 못합니다. stridesrates.

위의 기능을 사용하여 작업을 수행하는 방법을 설명 할 수 있습니까?

답변

0

strides은 데이터 이동에 관한 것입니다.

rates은 '펼쳐지는 방법'에 관한 것입니다.

예를 들어 strides = [1,5,5,1]을 사용하면 1 차원 및 2 차원 모두에서 창이 5 픽셀 씩 이동합니다. rates = [1,1,1,1]을 사용하면 창이 '압축'되어 모든 픽셀이 인접 해 있음을 의미합니다. , 우리가 사용하는 왼쪽, rates = [1,1,1,1]에, 우리는 rates = [1,1,2,1]를 사용하는 중간에 : 당신이 rates = [1,1,2,1]를 사용하는 경우, 다음 창은 2 차원에서 확산하고 (지금은 진보를 무시) ksizes = [1,3,2,1]와 모든 2.

예는 픽셀 소요 오른쪽에 우리가 사용하는 것 rates = [1,2,2,1] :

* * 3 4 5   * 2 * 4 5   * 2 * 4 5 
* * 8 9 10   * 7 * 9 10   6 7 8 9 10 
* * 13 14 15   * 12 * 14 15   * 12 * 14 15 
16 17 18 19 20   16 17 18 19 20   16 17 18 19 20 
21 22 23 24 25   21 22 23 24 25   * 22 * 24 25