2012-02-09 2 views
0

정규식을 사용하여 문자열을 구문 분석하는 대신 ASCII를 이진 동등한 것으로 변환 한 다음 구문 분석하고 대신 조작 할 수 있다는 이점이 있습니까? 주로 HTML 소스 코드 같은 매우 큰 문자열을 구문 분석하는 성능을 주로 생각합니다.바이너리로 ASCII 문자열을 구문 분석하고 조작하는 Java의 장점이 있습니까?

+0

주어진 ASCII 문자와 동일한 이진수 (예 : 'A')는 무엇입니까? –

+0

HTML 소스 코드와 동일한 이진 파일은 무엇입니까? 어떻게 파싱 되나요? –

+0

http://www.roubaixinteractive.com/PlayGround/Binary_Conversion/The_Characters.asp –

답변

1

아스키를 바이너리로 변환하면 실제로 문제가 해결되지 않습니다. 복잡성을 추가하는 것처럼 보입니다.

html을 구문 분석하기 위해 정규식을 사용할 필요가 없습니다. XML 구문 분석기를 사용해보십시오.