모든 HTML 문서의 시작점. <!DOCTYPE html> 바로 아래에 단 하나의 <html> 요소가 위치한다. 이 한 줄에 박힌 lang 속성이 스크린리더의 발음, 검색엔진의 언어 인덱싱, AI의 답변 언어 매칭을 한 번에 결정한다.
SEO 관점에서 lang="ko"는 구글의 다국어 인덱싱에 직접 영향한다. 같은 콘텐츠의 한국어 버전과 영어 버전이 있을 때, 구글은 각 페이지의 lang과 hreflang을 종합해 한국어 검색에 한국어 페이지, 영어 검색에 영어 페이지를 노출한다. lang이 비어 있거나 잘못 박혀 있으면 — 구글이 콘텐츠 자체를 분석해 언어를 추측하는데, 추측은 틀릴 수 있다. 한국어 사이트에 영어 키워드("SEO consulting")가 섞여 있으면 영어로 오인되는 경우가 흔하다.
GEO 관점에서 AI Overviews와 LLM은 사용자의 언어 컨텍스트에 맞는 페이지를 인용한다. "한국어로 답해줘"에는 한국어 페이지를, "in English"에는 영어 페이지를. lang이 명확한 페이지는 언어별 인용 후보 풀에 정확히 들어간다.
A11y 관점에서 lang의 중요도가 가장 직접적이다. NVDA·VoiceOver의 발음 엔진은 lang 속성을 보고 어떤 언어 모드로 발화할지 결정한다. lang이 영어인데 한국어 콘텐츠를 만나면 — 스크린리더가 한글을 영어 발음 규칙으로 읽어 들리지 않는 소음이 된다. 시각장애 사용자에게 가장 큰 좌절 중 하나.
자주 보는 안티패턴: lang 자체 누락(스크린리더 fallback이 시스템 기본값으로 가서 환경별로 다름), 부트스트랩 템플릿 그대로 lang="en"을 둔 한국 사이트, region 없는 lang="ko"로 두고 일본어 한자 표기를 섞는 경우. 한국 사이트의 표준은 lang="ko" 또는 더 정확히 lang="ko-KR". Next.js의 layout.tsx에서 <html lang="ko">로 한 번 설정하면 모든 페이지에 적용된다.