2017-02-24 12 views
0

, 가지고 몇 가지 물건의 형식은하이브 사용자 정의 Serde 내가 하이브 새로운 오전

[Time Stamp] {Complex JSON data} 

의 로그를 분석합니다.

필요에 맞게 JSON Serde 코드를 확장 할 수 있습니까? 그렇다면 어떤 JSON serde 코드를 선택하는 것이 좋을까요?

이 방법이 좋지 않으면 다른 포인터는 무엇입니까?

감사

대신 다른 오픈 소스 serde를 사용

답변

0

,

나 자신이 훨씬 간단이었다 serde를 작성했습니다. 보일러 플레이트 코드는 별개로, 비즈니스 로직을 deserialize 메서드에 작성해야만했습니다.이 메서드는 매력처럼 작동했습니다.

이 링크는 매우 유용했습니다. http://blog.cloudera.com/blog/2012/12/how-to-use-a-serde-in-apache-hive/

또한 UDTF를 사용해 보았는데 원활하게 작동했기 때문에 serde가 훨씬 빠르다는 것을 알았습니다.

희망이 도움이된다 누군가