Windows 서버에서 PHP와 IIS 7을 사용하고 있습니다. 내 사이트의 루트 폴더에 사이트 맵 sitemap.xml
을 만들었습니다.'sitemap.xml'을 사용자가 액세스 할 수 없지만 봇이 액세스 할 수있게 만들기
하지만 브라우저 및 GET 요청을 통해 사용자가 쉽게 볼 수 있습니다.
내 질문은 사용자가 액세스 할 수 없도록 설정하는 방법이지만 검색 엔진의 크롤러는 액세스 할 수있는 방법입니다.
예 : https://stackoverflow.com/sitemap.xml은 사용자가 액세스 할 수 없지만 여전히 Google 검색에 포함되며 거기에 (https://meta.stackexchange.com/questions/22308/stack-overflow-sitemap-wtf) 있습니다.
어떻게 처리합니까?
검색 엔진 만 페이지를 크롤링하고 사이트에서 발견되지 않는 페이지를 Google에 알리는 것이 좋습니다. –
사용자가 사이트 맵에 액세스 할 수 있다면 왜 문제가됩니까? – jan
1. xml 파일의 크기는 일반적으로 수 GB입니다. 2. 모든 사용자가 사용자 에이전트를 변경할 수 있으며 이것이 실제로 검색 엔진인지는 알 수 없습니다. 3. 모든 작은 검색 엔진을 허용해야하며 많은 검색 엔진이 있습니다. – jan