Google이 다국어 웹사이트를 인덱싱하지 않는 이유와 해결 방법
Google이 다국어 웹사이트를 인덱싱하지 않는 가장 흔한 이유는 잘못된 hreflang 설정, 중복 콘텐츠, 언어별 URL 구조 오류, 또는 자동 번역 품질 문제 때문이다. 해결하려면 hreflang을 정확히 구성하고, 언어별 고유 URL을 사용하며, 각 페이지의 품질과 크롤링 접근성을 개선해야 한다.
Ramki.co.kr
다국어(multilingual) 웹사이트를 운영할 때 가장 자주 마주치는 문제 중 하나는 바로 Google 다국어 사이트 인덱싱 실패 현상이다. 특히 WordPress 기반 사이트에서 TranslatePress, WPML, Polylang 등으로 번역 사이트를 구축한 뒤 Search Console을 확인해 보면, 한국어·영어·일본어 중 특정 언어만 인덱싱되고 나머지는 누락되는 일이 흔하게 발생한다. 이 문제는 단순한 크롤링 지연이 아니라 URL 구조, hreflang, Canonical 설정, Sitemap, 중복 콘텐츠 처리 방식 등 복합적인 요인 때문에 생긴다. 이 글에서는 Google이 다국어 웹사이트를 인덱싱하지 않는 이유를 깊이 있게 분석하고, 실제로 검색 노출을 정상화하기 위한 실질적인 해결책을 제시한다.
목차
Google이 다국어 사이트 인덱싱을 실패하는 가장 흔한 원인
1) 언어별 URL 구조가 잘못됨
Google이 가장 중요하게 보는 다국어 기준은 “명확한 URL 구조”이다.
다음 4가지 구조가 Google이 권장하는 방식이다:
- 도메인 분리: example.com, example.kr
- 서브도메인 분리: kr.example.com, en.example.com
- 서브디렉토리 분리 (가장 흔함): example.com/ko/, example.com/en/
- URL 파라미터 (비권장): ?lang=ko, ?lang=en
이 중 서브디렉토리 방식이 가장 안정적이며 SEO 친화적이다.
하지만 많은 사이트가 기본 언어만 루트(/)에 두고 다른 언어만 /ko/ /en/ 을 사용하여 인덱싱 누락이 발생한다.
특히 TranslatePress에서 “Default language in subdirectory” 옵션이 꺼져 있으면 Google은 사이트가 다국어라고 인식하지 못한다.
2) hreflang 태그 누락 또는 잘못된 설정
hreflang은 Google에게 “이 페이지의 다른 언어 버전”을 알려주는 중요한 신호다.
문제는 다음과 같은 실수 때문에 인덱싱 오류가 반복된다:
- hreflang이 한쪽 언어만 존재
- x-default가 없음
- 언어와 지역코드가 잘못됨 (예: ko-KR vs ko)
- self-referencing hreflang 누락
예시 (정상):
<link rel="alternate" hreflang="ko" href="https://example.com/ko/">
<link rel="alternate" hreflang="en" href="https://example.com/en/">
<link rel="alternate" hreflang="x-default" href="https://example.com/">
hreflang 문제가 있으면 Google은 한 언어를 “중복 콘텐츠”로 판단해 인덱싱을 막는다.
3) Canonical 설정 충돌
다국어 페이지가 서로 다른 URL을 가지고 있어도 Canonical이 잘못 연결되면 문제가 발생한다.
예시로, 한국어 페이지(ko)가 영어 페이지(en)를 Canonical로 지정하는 경우:
Canonical: https://example.com/en/
이렇게 되면 Google은 한국어 페이지를 “중복”으로 판단하고 인덱싱하지 않는다.
4) 언어별 Sitemap 분리가 안 됨
Google은 다국어 사이트에서 언어별 Sitemap 분리를 매우 선호한다.
예시 (정상 방식):
- /ko/sitemap_index.xml
- /en/sitemap_index.xml
- /ja/sitemap_index.xml
일반 sitemap 하나만 있으면 Google은 “점검할 수 있는 언어 신호”가 부족하다고 판단하여 인덱싱을 미루거나 누락시킨다.
Rank Math Pro는 다국어 sitemap을 자동 생성하지만, TranslatePress 설정이 잘못되면 분리되지 않는다.
5) 내부 링크가 모든 언어를 동일한 기본 언어로 연결
예:
한국어 페이지에서 클릭하면 영어 페이지로 이동하는 경우
Google은 이것을 “언어 신호 비일관성”으로 판단하여 인덱싱을 막는다.
6) Google Search Console에서 언어별 속성(Property)을 만들지 않음
예:
- example.com (루트만 등록)
➡ /en/ 또는 /ko/는 인덱싱 우선순위가 매우 낮아짐
다국어 사이트는 반드시 언어별 속성이 필요하다.
7) 크롤링 예산 문제 (Crawl Budget 부재)
Google은 소규모 사이트라면 한 번에 모든 언어를 크롤링하지 않는다.
하지만 구조가 잘못되면 Google은 “우선순위 낮음”으로 분류하여 매우 느리게 크롤링한다.
다국어 웹사이트 인덱싱 문제 해결을 위한 핵심 조치

1) 기본 언어도 반드시 서브디렉토리에 넣기
한국어 사이트 기준:
https://example.com/ko/
영어:
https://example.com/en/
Google이 언어 체계를 가장 명확하게 인식하는 구조다.
2) 언어별 Sitemap을 생성하고 Search Console에 따로 제출
예:
/ko/sitemap_index.xml
/en/sitemap_index.xml
/ja/sitemap_index.xml
Search Console:
- 도메인 속성(domain property) + URL prefix 속성(언어별)을 모두 추가
3) hreflang 정교하게 구성
TranslatePress, Rank Math 사용 시 아래 3가지가 자동 생성되는지 확인해야 한다:
- self-referencing hreflang
- alternate hreflang
- x-default hreflang
4) Canonical을 언어별 자체 URL로 통일
각 언어 페이지는 반드시 해당 언어 URL을 Canonical로 가져야 한다.
5) 내부 링크를 언어별로 정확히 연결
한국어 페이지 → 한국어
영어 페이지 → 영어
언어 섞이면 Google이 중복 콘텐츠로 판정한다.
6) 크롤링 요청 + URL 검사 + 색인 생성 문제 해결
색인이 안 되는 페이지는 Search Console의 “URL 검사 → 색인 생성 요청”을 반복한다.
하지만 구조가 잘못되어 있으면 여전히 색인이 되지 않기 때문에 반드시 HTML 구조를 먼저 바로잡아야 한다.
WordPress에서 다국어 인덱싱을 안정적으로 만드는 최적 조합
● 가장 오류가 적은 조합
- TranslatePress + Rank Math Pro
- URL 구조:
/ko/ /en/ /ja/ - Rank Math Sitemap: 언어별 자동 분리
- Canonical: 언어별 self
- hreflang: TranslatePress 자동 생성
- Search Console: 언어별 prefix 등록
이 조합은 실제 현업 SEO 전문가들도 가장 많이 선택하는 구조다.
실제로 인덱싱을 빠르게 개선한 사례
한 쇼핑몰은 한국어·영어·일본어를 운영했지만, 처음에는 한국어만 인덱싱되고 영어·일본어는 2개월째 인덱싱되지 않았다.
문제 요약:
- 기본 언어가 루트(/)였고 영어·일본어만 서브디렉토리
- hreflang 오류
- 언어별 sitemap 부재
해결 조치:
- 기본 언어도 /ko/로 이동
- TranslatePress 설정 재구성
- Rank Math Sitemap 재생성
- Search Console 3개 prefix 추가
결과:
- 7일 만에 각 언어 100% 인덱싱 완료
- 해당 사이트의 일본어 페이지가 일본 Google SERP에서 TOP 10 진입
결론: 다국어 사이트 인덱싱 문제는 구조의 문제다
Google이 다국어 웹사이트를 인덱싱하지 않는 이유는 대부분 다음 세 가지에 요약된다:
- URL 구조가 언어별로 명확하지 않다.
- hreflang / canonical이 충돌한다.
- 언어별 sitemap이 존재하지 않는다.
이 세 가지를 정확하게 세팅하면 Google은 다국어 웹사이트를 매우 안정적으로 인덱싱한다.

자주 묻는 질문
Google이 다국어 웹사이트를 인덱싱하지 않는 가장 흔한 이유는 무엇인가요?
Google이 다국어 웹사이트를 인덱싱하지 않는 이유는 잘못된 hreflang 태그 설정, 중복된 콘텐츠, 자동 번역 품질 저하, 언어별 URL 구조 문제, 그리고 사이트맵의 언어별 분리 미지원 등이 주요 원인입니다.
hreflang 태그 오류는 Google 인덱싱에 어떤 영향을 주나요?
hreflang 태그가 잘못되면 Google이 각 언어 버전의 페이지를 올바르게 식별하지 못해 잘못된 국가로 인덱싱되거나 완전히 인덱싱되지 않는 문제가 발생합니다. 이는 다국어 사이트에서 가장 중요한 요소입니다.
다국어 웹사이트는 언어별 URL 구조가 필요한가요?
네. Google은 /en/, /ko/, /fr/처럼 언어별 고유 URL 구조를 권장합니다.
동일 URL에서 언어가 자동 변경되면 Google이 페이지를 “단일 콘텐츠”로 인식해 인덱싱되지 않을 수 있습니다.
자동 번역 콘텐츠도 Google에 인덱싱되나요?
자동 번역만 있는 페이지는 중복 콘텐츠 또는 품질이 낮은 페이지로 간주될 위험이 있습니다.
언어 품질이 낮으면 Google은 해당 언어 버전을 인덱싱하지 않거나 검색 노출을 제한할 수 있습니다.
언어별 사이트맵은 Google 인덱싱을 개선하는 데 도움이 되나요?
네. 언어별 사이트맵을 생성하면 Google이 각 언어 페이지를 더 정확하고 빠르게 인덱싱할 수 있습니다.