나는 웹 사이트를위한 크롤러를 쓰고있다. 응답이 gzip으로 인코딩되었습니다.압축 풀기에 오류가 있습니까?
압축 해제가 성공했지만 특정 필드를 올바르게 구문 분석 할 수 없습니다. I는 그것을 파싱 htmlagilitypack 사용하고 , 필드
파싱 값은 일례로서, 원래 값 의 일부이다 : I가 얻고 만/wEWAwKc04vTCQKb86mzBwKln/PuCg == 은 방화를 도시하는 반면 훨씬 더 오래 실제 값 : /wEWBgKj7IuJCgKb86mzBwKln/PuCgLT250qAtC0 + 8cMAvimiNYD
결국 '=='은 무엇을 의미합니까? 압축 해제기에 오류가 있다고 가정하고 있습니까?
코드를 보여줄 수 있습니까? _How_ 압축 된 데이터를 팽창시키고 있습니까?반환 된 결과를 바이트에서 문자열로 변환하고 있습니까? 그렇다면 인코딩은 무엇입니까? 등등. –
==는 BAS64로 인코딩 된 문자열을 종료하는 데 일반적으로 사용됩니다. – origo
이것은 읽으려는 웹 페이지의 숨겨진 필드입니다. 페이지가 gzip으로 압축되어 있으며이 필드는 다시 게시하는 동안 다시 사용되는 직접 필드입니다. 그래서 의미 론적으로 그것은 세션을 추적하는 상수 변수 일 수 있습니다. – Kushagra