저는 파이썬에서 이미지의 분류 (한 클래스)를위한 간단한 신경망을 구현했습니다. 레이어는 단순합니다 (image_matrix, 5,1). 숨겨진 레이어에 relu와 sigmoid 사용하기. 나는 5000 번 반복하고있다. 처음에는 비용이 합리적으로 점차 감소하는 것처럼 보입니다. 그러나, 아무리 내가 사용 얼마나 많은 훈련 예, 또는 내 learning_r
미리 정의 된 포즈를 모방해야하는 프로젝트에서 작업하고 있습니다. 사진은이 미리 정의 된 포즈를 모방 한 사람이 만듭니다. 그런 다음이 이미지에서 사람의 인간 포즈를 추출하고 미리 정의 된 포즈와 비교합니다. 마지막으로 스코어링 메커니즘은 두 포즈가 얼마나 잘 일치하는지 또는 전혀 일치하는지 결정합니다. 스마트 폰용으로 개발하고 싶습니다. 이상적으로 모든
단어로 명확하게 표현하기가 어렵습니다. 궁금한 점이 있으면 알려주세요. 저는 CNN을 사용하여 이미지 인식 모델을 교육하고 있습니다. 그러나 저는 각기 다른 각도의 이미지를 가지고 있으므로 각 사진의 각 각도로 여러 레이어를 만들고 싶습니다. 이 과정에서 각 각도의 출력을 1로 줄이고 결국 모든 각도의이 출력을 결합하고 2 층 신경망을 만듭니다. 테스트로
모양 (600,400)의 히트 맵 numpy 배열이 있습니다. 히트 맵은 탐지 확률을 나타냅니다. 내 경우, 이미지에서 얼굴 탐지의 가능성. 내 목표는이 히트 맵을 사용하여 가장 높은 확률이 발생하는 좌표 (X 및 Y)를 얻는 것입니다. 저는 한 얼굴의 경우에이를 해결했습니다. 그 코드는 다음과 같습니다 : face_location = np.unravel_
단일 이미지에 대한 결과를 예측하려고하지만 관련성이없는 결과가 나타납니다. https://github.com/09rohanchopra/cifar10/blob/master/cifar10-simple-cnn.ipynb 코드 내가 가진 # from keras.preprocessing import image
from keras.models import load_
저는 동전 인식 프로젝트를하고 싶습니다. 카메라가 동전 몇 장을 찍은 후 값으로 인식하고 금액을 합산하여 출력합니다. 나는 동전 크기가 커지면 값을 인식하는 것을 생각하고 있었지만 동전이 더 커지면 값이 커졌습니다. 그러나 생각할 수있는 문제는, 다른 각도에서 사진을 찍거나 카메라가 평소보다 동전과 다른 거리가 있다면 어떨까요? 그것을 해결하는 방법 또는
나는 라스베리 파이 (카메라가있는)에 대한 추론을 수행하는 Keras 모델을 가지고 있습니다. Raspberry Pi는 CPU가 매우 느리고 (1.2GHz) CUDA GPU가 없으므로 model.predict() 단계가 오래 걸립니다 (~ 20 초). 가능한 한 많이 줄이는 방법을 찾고 있습니다. 나는 시도했다 : CPU (+ 200MhZ)를 오버 클럭하고
위에 인쇄 let request = VNCoreMLRequest(model: model) { [weak self] request, error in
guard let results = request.results as? [VNClassificationObservation],
let topResult = results.first else
ARkit의 원시 특징 점을 얻고 싶습니다.이 API는 희소 점 구름을 노출합니다 : https://developer.apple.com/documentation/arkit/arframe/2887449-rawfeaturepoints을 입력하고 vector_float3의 목록으로 출력합니다. 또한이 포인트 구름 좌표 각각에 특징점 벡터 표현을 사용하고 싶습니다