빅 데이터에 대해 알아보고 있으며, 내가 만난 용어 중 일부는 structured
및 unstructured data
입니다. 나는 그것이 structured
이고 구조화되지 않은 데이터라는 것을 이해했다.Big 비디오의 컨텍스트에서 비디오가 구조화되지 않은 데이터 인 이유는 무엇입니까?
동영상 및 사진이 unstructured data
카테고리에 속하는 이유를 이해하는 데 어려움이 있습니다.
아무도 이해할 수 있습니까?
빅 데이터에 대해 알아보고 있으며, 내가 만난 용어 중 일부는 structured
및 unstructured data
입니다. 나는 그것이 structured
이고 구조화되지 않은 데이터라는 것을 이해했다.Big 비디오의 컨텍스트에서 비디오가 구조화되지 않은 데이터 인 이유는 무엇입니까?
동영상 및 사진이 unstructured data
카테고리에 속하는 이유를 이해하는 데 어려움이 있습니다.
아무도 이해할 수 있습니까?
'구조화 된'데이터의 대부분의 정의는 조직도가 높은 데이터를 말하며, 일반적으로 사전 정의 된 데이터 스키마를 의미합니다. 스키마는 일반적으로 특정 순서로 필드의 숫자로 구성되어, 많은 고전 DB 테이블과 같은 데이터의 각 포함하는 하나의 유형 :이 경우
userId,username,age,location,joinedOn
12,"Polly",20,"Washington DC","2016-02-23 13:34:01"
14,"Dan",19,"San Diego CA","2016-11-10 18:32:21"
15,"Shania",36,"","2017-01-04 10:46:39"
, 당신은 두 개의 문자열 필드, 두 개의 정수 필드가 및 날짜/시간 유형 필드가 있습니다. 빅 데이터 (Big Data) 컨텍스트에서는 편리한 데이터 쿼리/처리, 대폭 향상된 압축 및 효율적인 저장이 가능합니다. 특히 데이터 양이 커질수록 어려운 문제가 될 수 있습니다.
간단한 비트 맵, 벡터, 점진적 JPEG, 기본 제공 가변 압축 기능, 도형, 애니메이션 프레임 컨테이너 등 여러 가지 방법으로 표현할 수있는 이미지를 생각해보십시오. 크기, 색상 팔레트 및 메타 데이터를 모두 포함하므로이 모든 변형은 서로 다른 속성을 가진 두 개의 이미지를 하나의 데이터 스키마로 취급 할 수 없음을 의미합니다. 즉, 열 기반 저장, 압축 또는 쿼리의 이점을 얻지 못합니다.
동영상의 경우 여러 가지 다양한 비디오 (및 오디오) 코덱 및 압축을 포함 할 수있는 컨테이너 형식이 있고 추가로 복잡성이 추가된다는 것을 제외하면 위의 모든 내용은 여전히 유효합니다.