같은 콘텐츠를 가진 여러 URL이 있을 때 어느 쪽을 정본으로 인덱싱할지 검색엔진에 알리는 신호. 페이지 URL이 ?utm_source=..., ?ref=... 같은 파라미터로 무한히 늘어나거나, http/https/www/non-www 혼재가 일어나는 사이트에서 반드시 챙겨야 하는 태그.
SEO 관점에서 canonical은 중복 콘텐츠 정리의 가장 강한 단일 신호다. 같은 내용이 5개 URL에 있을 때 — canonical이 없으면 구글이 어느 URL을 인덱싱할지 추측한다. 결과적으로 백링크와 권위가 5개 URL에 분산되어 모두가 약해진다. canonical 하나로 다섯 URL의 신호를 한 곳에 집중시킨다. 잘못된 canonical은 더 위험하다 — 모든 페이지의 canonical이 홈을 가리키면 전체 사이트의 세부 페이지가 인덱싱되지 않는 재앙이 발생한다.
GEO 관점에서 AI 인덱서(GPTBot, ClaudeBot, PerplexityBot 등)는 페이지를 크롤링할 때 canonical을 참고한다. AI의 답변에 URL이 인용될 때 — canonical로 지정된 URL이 인용된다. 잘못된 canonical은 AI가 잘못된 URL을 사용자에게 안내하게 만든다. 사용자가 그 URL을 클릭했을 때 기대했던 페이지가 아니면 사이트 신뢰도가 떨어진다.
AEO 관점에서 같은 답변이 사이트 내 여러 URL에 있을 때 — 예를 들어 "환불 정책"이 FAQ 페이지와 도움말 페이지 양쪽에 있을 때 — AI가 어느 쪽을 인용할지를 canonical이 결정한다. 명시 안 되면 AI는 링크 수가 많은 쪽이나 최근 업데이트된 쪽을 추측한다.
A11y 관점에서 직접 영향은 없다. 다만 — 보조 기술 사용자가 페이지 URL을 공유했을 때, 그 URL이 정본이 아니면 SEO 신호와 AI 인용에 손해. 간접 영향.
자주 보는 안티패턴: 상대 URL 사용("/blog/post-1" — 환경별 다르게 해석), 모든 페이지가 홈으로 canonical(전체 인덱싱 손실), http/https 혼재, trailing slash 불일치("/blog/post"와 "/blog/post/"가 다른 URL로 취급). 가장 안전한 패턴은 self-canonical을 모든 페이지에 절대 URL로 박는 것. "이 페이지가 자신의 정본"이라고 명시적으로 선언하는 게 표준이다. 단 카테고리 페이지의 페이지네이션(page=2, page=3...)은 첫 페이지를 canonical로 가리키는 게 흔한 예외 패턴.