2016-10-17 3 views
1

Google에 색인을 달지 않게하려는 ExpressJS 웹 응용 프로그램이 내부 용으로 제공됩니다.적절한 robots.txt 구성에도 불구하고 Google SERP에 사이트가 표시됩니다.

app.get('/robots.txt', function(req,res) { 
    res.set('Content-Type', 'text/plain'); 
    res.send('User-agent: *\nDisallow: /'); 
} 

나는이 URL을 타격하고 그럼에도 불구하고

User-agent: * 
Disallow:/

인 응답을 확인하여, 잘 작동하고 있다는 것을 확인, 내가 볼 수 있습니다 : 그래서 다음과 같은 경로를 구현 내 사이트 제목을 검색 할 때 Google에서 내 페이지 결과. 앱이 1 년 동안 온라인 상태 였기 때문에 캐시 된 결과가 없었을 것입니다. 이것이 일어나는 다른 가능한 이유가 있습니까? 문제를 해결할 수있는 방법은 무엇입니까?

+0

Google에서 색인을 생성하지 않으려는 페이지에는 보안이 설정되어 있지 않습니까? 그렇다면 로그인해야하므로 Google에서 보안 페이지를 색인으로 생성 할 수 없습니다. '내부 용으로 사용됩니다.'해당 인용문 실제로 어떤 종류의 인증이 필요하다고 나에게 말할 것입니다. – Keith

+0

예, OAuth2 인증을 받았습니다. 로그인 페이지는 색인이 붙은 페이지입니다. – nikjohn

+0

내부 페이지이고 내부 페이지가되도록하려는 경우. IP 주소를 확인할 수 있습니다. 귀하의 웹 사이트에 어떤 메타 태그를 추가했는지에 상관없이 귀하의 페이지가 색인 생성되지 않는다는 것을 아는 것은 결코 보장되지 않습니다. Google은 로봇에 복종 할 수 있습니다.txt &'meta name'하지만 다른 인덱싱 서비스가 똑같이 할 것이라는 보장은 없습니다. – Keith

답변

0

https://webmasters.stackexchange.com/questions/54879/does-google-ignore-robots-txt

구글은 여전히 ​​robots.txt에 의해 차단 된 사이트를 볼 수 있습니다, 심지어 검색 결과를 나열 할 수 있습니다.

전체 도메인/하위 도메인이 차단 된 경우 특히 그렇습니다. Google은 텍스트와 함께 이들에 대한 링크를 나열합니다.이 사이트의 robots.txt로 인해이 결과에 대한 설명을 사용할 수 없습니다 - https://support.google.com/webmasters/answer/156449에 대한 자세한 내용을 알아보십시오.

출력 페이지에 <meta name="robots" content="noindex, nofollow">을 추가하십시오.

편집 주석의 discission에서 : 당신이 robots.txt에있는 페이지를 허용하지만, 메타 태그를 사용하여 색인되는 것을 차단하면

는 Googlebot이 메타를 읽고 페이지에 액세스합니다 태그를 만들고 색인을 생성하지 않습니다.

그래서 Google이 사이트를 크롤링하지 못하게하려면 robots.txt에서 deny를 사용하고 메타 태그가 필요 없습니다.
사이트를 가리키는 외부 링크가있는 경우 : google에 표시되는 페이지에서 allow robots.txt를 사용하고 noindex를 사용하고 nofollow를 사용하십시오.

검색 쿼리로 사용 site:stackoverflow.com, 그리고 구글이 색인을 해당 웹 사이트의 기본적으로 모든 페이지를 나열합니다 :

어떻게 구글은 당신이있는 페이지를 참조 easely합니다.

이 구글에서 귀하의 페이지를 크롤링하는 방법에 대한 자세한 내용을 보려면 : https://support.google.com/webmasters/topic/4617736?hl=en&ref_topic=4589290

은 또한, 기억, 구글은 유일한 검색 엔진이 아니다. bing, yahoo, baidu 및 기타 검색 엔진이 많으며 메타 태그 또는 로봇으로 모두 잘 돌아가는 것은 아닙니다. 일부는 다른 검색 엔진 인 척하면서 크롤링이 차단되지 않습니다.

+0

아, 로봇 메타가 설정되지 않았습니다. 내가 정할거야. 귀하의 답변에 감사드립니다. Google에서 색인을 업데이트하는 데 시간이 얼마나 걸리나요? – nikjohn

+0

은 크롤링 빈도에 따라 다릅니다. 사이트가 자주 업데이트되고 하루 만에 많은 외부 링크가 나와있는 경우 웹에서 숨겨진 사이트 인 경우 최대 한두 달 정도 걸릴 수 있습니다. – Tschallacka

+1

이것은 좋은 해결책이지만, 로봇 메타 태그를 추가하면 robots.txt의 사이트 차단을 해제해야합니다. 그렇지 않으면 Google은 페이지를 크롤링하지 않으므로 로봇 메타 태그를 볼 수 없습니다. – plasticinsect