Microsoft Computer Vision API 또는 Google Cloud Vision API에서 개체 위치를 가져올 수 있습니까?

이미지의 태그가있는 객체의 위치를 알아야하는 응용 프로그램을 개발하려고합니다. 이미지에 "피아노"가 있음을 알면 충분하지 않습니다. 피아노가 이미지에있는 곳을 알아야합니다.Microsoft Computer Vision API 또는 Google Cloud Vision API에서 개체 위치를 가져올 수 있습니까?

마이크로 소프트의 컴퓨터 비전 API와 구글의 클라우드 비전 API는 어떤 형태의 자르기 제안/스마트 썸네일 생성 서비스를 제공하여 특정 객체의 위치가 감지되었다고 생각하게합니다. 그러나 그 정보를 얻을 수있는 방법이 있습니다. Microsoft의 Computer Vision API 또는 Google의 Cloud Vision API에서 각 탐지 된 개체 주변의 테두리 상자처럼 사용할 수 있습니까?

편집 : 자동차, 피아노, 나무, 사람 : 내가 그러나 나는 이미지의 위치와 모든 객체의 크기를 찾고 있어요, 두 API는 이미지에서 인식 된 얼굴의 위치를 반환 할 수 있음을 이해합니다. ..아무것도.

출처

2016-12-23 abagshaw

[시각 인식 API를 사용하여 이미지에 맞춤 개체 위치를 얻는 방법] (http://stackoverflow.com/questions/38634409/how-to-get-a-position-of-custom-object) -on-image-using-vision-recognition-api) – Nakilon

Microsoft Vision API는 검색된 개체에 대한 픽셀 좌표를 제공하지 않습니다 (반환 기능 : https://dev.projectoxford.ai/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa 참조).

그러나 사람이 Microsoft API를 감지하고 싶다면 얼굴 사각형의 좌표를 반환 할 수 있습니다.

출처

2016-12-23 21:06:35 DaveStat

제 편집보기 - 얼굴 위치 이상을 찾고 있습니다.하지만이 API가 내가 원하는 정보가 아닐 수도 있습니다. – abagshaw

그런 경우 Microsoft API가 적합하지 않습니다. – DaveStat

Google API 또는 다른 API에 대해 알고 싶습니까? – abagshaw

현재 사용자가 객체 좌표를 제공하는 API에 대해서는 알지 못합니다. 내가 추천하는 것은 객체의 좌표를 제공하는 YOLO입니다. 사전 훈련 된 모델을 사용하거나 직접 훈련 할 수 있습니다.

그러나 API가 아니므로 원격으로 실행하려면 약간의 백엔드 코드를 작성해야합니다.

출처

2017-04-25 10:59:33

Microsoft Computer Vision API 또는 Google Cloud Vision API에서 개체 위치를 가져올 수 있습니까?

답변

관련 문제