TL;DR
- AI 답변에서 경쟁사만 뽑히는 건 운이 아닙니다. 크롤링, 식별 신호, 콘텐츠 구조, 제3자 언급, 신선도, 엔티티 커버리지라는 6가지 층에서 순차적으로 탈락합니다.
- AI 인용의 약 절반은 자사 도메인이 아니라 Reddit·Wikipedia·업계 매체 같은 제3자 소스에서 발생합니다. 사이트만 고쳐서는 판을 못 뒤집습니다.
- GPTBot·ClaudeBot·PerplexityBot은 JavaScript를 실행하지 않습니다. CSR(Client-Side Rendering) SPA는 기본값이 투명 인간입니다.
- 구글 AI Overview는 "검색 1페이지"가 아니라 "retrieval(검색·추출)" 관점으로 소스를 고릅니다. 순위가 낮아도 구조가 좋으면 인용되고, 1위여도 구조가 나쁘면 빠집니다.
- 한국 시장은 네이버 AI 브리핑이라는 별도 알고리즘이 추가로 얹힙니다. C-rank 기반 권위 신호가 없는 독립 도메인은 네이버 답변에서 쉽게 밀립니다.
AI 답변에서 사라진다는 것의 실제 의미
마케팅 팀이 처음 느끼는 증상은 단순합니다. 같은 검색어에서 경쟁사는 AI 답변 상단에 자연스럽게 인용되는데, 우리 브랜드는 이름조차 등장하지 않습니다. 광고비는 그대로 쓰고, 검색 순위도 밀리지 않았는데 트래픽만 조용히 빠집니다.
이 현상은 이미 트래픽 지표로도 확인됩니다. AI Overview가 노출되는 정보성 쿼리에서 유기 클릭률이 1.76%에서 0.61%로 떨어졌다는 대규모 분석이 있습니다.
출처: BrightEdge - ChatGPT Brand Mentions vs. Citations
Seer Interactive 분석에 따르면 AI Overview가 노출된 정보성 쿼리의 유기 CTR이 2024년 6월 1.76%에서 2025년 9월 0.61%로 61% 하락했습니다. 동시에 AI Overview에 인용된 브랜드의 유기 CTR은 미인용 대비 35% 더 높게 측정되었습니다.
즉, AI 답변 노출은 단순한 "추가 노출 채널"이 아니라, 인용 여부에 따라 CTR이 두 배 이상 벌어지는 새로운 순위표입니다. 경쟁사만 인용되는 상황은 가만히 둬도 격차가 벌어집니다.
그렇다면 왜 경쟁사는 뽑히고 우리는 빠질까요. AI 답변 엔진이 소스를 고르는 과정을 역순으로 뜯어보면, 사이트가 6개 관문을 통과해야 합니다. 한 관문이라도 막히면 뒤 관문은 평가 기회조차 얻지 못합니다. 아래 6가지 진단은 이 관문을 위에서부터 내려가는 순서입니다.
진단 1: 기술적 크롤 가능성 (가장 흔한 탈락 사유)
AI 답변은 "AI가 볼 수 있는 페이지"만 대상입니다. 그리고 "AI가 볼 수 있다"는 것은 구글 크롤러 기준이 아닙니다.
GPTBot, ClaudeBot, PerplexityBot 같은 주요 AI 크롤러는 JavaScript를 실행하지 않습니다. 초기 HTML 응답만 읽고, 렌더링을 기다리지 않으며, 재시도도 하지 않습니다.
출처: Passionfruit - JavaScript Rendering and AI Crawlers
GPTBot·ClaudeBot·PerplexityBot은 JavaScript를 실행하지 않고, 렌더링을 기다리지 않으며, 2차 시도를 하지 않습니다. 초기 HTML을 가져가서 추출 가능한 텍스트만 인식합니다. 반면 Googlebot은 JavaScript 렌더링을 지원하는 유일한 주요 크롤러입니다.
이 차이는 SPA(Single Page Application)에서 치명적입니다. React·Vue·Angular로 만든 CSR 사이트에서 초기 HTML이 <div id="root"></div>만 있고 본문이 비어 있다면, AI 크롤러 입장에서 그 페이지는 빈 페이지입니다. 구글 검색 순위는 멀쩡해도 AI 답변에는 진입할 수 없습니다.
두 번째 함정은 robots.txt입니다. Cloudflare가 2026년 1분기 robots.txt 네트워크 전수 분석을 공개했습니다.
출처: TechnologyChecker - robots.txt AI Crawlers Blocking Report Q1 2026
2026년 3월 30일 하루 동안 Cloudflare가 파싱한 robots.txt 4,047건 중 GPTBot을 명시적으로 차단한 사이트가 13.8%, ClaudeBot 11.5%, CCBot 11.2%, Google-Extended 10.7%였습니다. GPTBot은 모든 AI 봇 중 DISALLOW 규칙에 가장 많이 등장하는 봇입니다.
마케팅 팀이 모른 채 개발팀이 User-agent: * + Disallow: / 구버전 템플릿을 쓰고 있거나, 2022년 이전에 만든 화이트리스트 스타일 robots.txt가 AI 봇을 암묵적으로 막고 있는 경우가 실제로 많습니다.
점검 방법
- 크롬에서 페이지 열기 →
Ctrl+U로 소스 보기 → 본문 텍스트가 HTML에 들어있는지 확인합니다. 비어 있으면 AI 크롤러에게도 비어 있습니다. 도메인/robots.txt를 직접 확인해 GPTBot, ClaudeBot, PerplexityBot, ChatGPT-User, OAI-SearchBot이 차단되어 있지 않은지 봅니다.- 자체 서버 로그에서 위 User-Agent의 유입 빈도를 체크합니다. 0에 가깝다면 기술적 차단 가능성이 높습니다.
진단 2: 조직·저자 식별 신호 부재
AI 답변 엔진은 "이 콘텐츠를 만든 주체가 누구인가"를 빠르게 식별해야 인용 위험을 계산합니다. 식별이 안 되면 안전하게 빠뜨리는 쪽을 택합니다.
출처: ALM Corp - AI Search Trust Signals 2026
AI 검색 인용에서 E-E-A-T는 검증된 자격을 가진 저자 바이라인, 리더십 정보가 명시된 About 페이지, 1차 데이터와 원저 연구를 포함한 콘텐츠, 투명한 출처 공개를 통해 드러납니다. 도메인 외부 링크 그래프가 아니라 콘텐츠와 페이지 자체의 맥락 표지가 판단 기준이 됩니다.
구체적으로 AI 답변 엔진이 확인하는 식별 신호는 세 가지입니다.
- Organization 스키마: 회사명, 로고, URL, 소셜 프로필(
sameAs)이 JSON-LD로 명시되어 있는가. - Person 스키마 + 저자 바이라인: 글마다 저자가 누구인지, 그 저자의 전문성은 어디서 증명되는지가 페이지 안에 있는가.
- About·Contact 페이지 품질: "회사 소개" 한 줄이 아니라 설립 정보, 팀, 연락처, 주소가 실제로 기재되어 있는가.
경쟁사 페이지를 view-source:로 열어보면 차이가 선명해집니다. 인용되는 경쟁사는 거의 예외 없이 @type: Organization과 @type: Person JSON-LD를 갖추고 있습니다. 안 뽑히는 사이트는 @type: WebPage 하나만 있거나, 그마저도 없습니다.
다만 스키마가 "마법의 치트키"는 아닙니다. 스키마 커버리지가 넓다고 자동으로 인용되는 것도 아닙니다.
출처: Search Engine Land - Schema markup AI search without hype
2024년 12월 Search/Atlas 연구에서 스키마 커버리지와 AI 인용률 간 유의미한 상관관계가 확인되지 않았습니다. 종합 스키마를 갖춘 사이트가 최소 스키마 사이트를 일관되게 능가하지 못했고, LLM은 관련성, 주제 권위성, 의미적 명료성을 구조화 마크업보다 우선합니다.
정확히 말하면 스키마는 "필수 출입증"에 가깝습니다. 없으면 식별이 늦어지고 인용 위험이 커집니다. 있다고 반드시 뽑히지는 않지만, 없으면 시작 지점에서 불리합니다.
진단 3: 답변형 콘텐츠 구조 없음
여기가 경쟁사와 가장 크게 벌어지는 지점입니다. 순위가 같아도 구조가 다르면 AI 인용은 다르게 갈립니다.
Search Engine Land가 정리한 AI Overview 탈락 사유 첫 번째는 "retrieval 문제이지 ranking 문제가 아니다"입니다.
출처: Search Engine Land - Why content doesn't appear in AI Overviews
이것은 retrieval 문제이지 ranking 문제가 아닙니다. AI Overview는 가장 깨끗하고 추출 가능한 답변이 있는 페이지를 찾습니다. 서론이 3문단 동안 맥락 설명, 독자 warming up, 질문 재진술에 쓰인다면 retrieval 시스템은 그 페이지를 건너뜁니다.
경쟁사 콘텐츠를 보면 공통점이 있습니다. 글 제목 바로 아래 첫 50~100단어 안에 핵심 질문에 대한 정의가 끝나고, H2는 질문형이거나 명확한 주제어로 시작하며, 리스트와 비교 표가 본문에 섞여 있습니다. AI는 이 "덩어리"를 통째로 뽑아 인용합니다.
반대로 인용 안 되는 콘텐츠는 대체로 이렇게 생겼습니다.
- 서론이 "최근 업계에서는…"으로 시작해 3~4문단 동안 맥락을 설명합니다.
- H2가 "우리의 고민"처럼 추상적이어서 질의-응답 매칭이 안 됩니다.
- 리스트나 비교 표가 없고, 모든 정보가 긴 문단 안에 흩어져 있습니다.
- 정의가 본문 중간에 묻혀 있거나, 마지막에 가서야 "결국 핵심은…"이 나옵니다.
출처: Search Engine Land - AI citations favor listicles, articles, product pages study
분석에 따르면 AI 인용의 21.9%가 리스티클, 16.7%가 아티클, 13.7%가 제품 페이지에서 발생했고 이 세 포맷이 전체 인용의 52%를 차지했습니다. 정보성 쿼리에서는 아티클이 다른 포맷보다 2.7배 더 많이 인용됐고, 상업성 쿼리에서는 리스티클이 40.9%로 1위였습니다.
즉 포맷을 트렌드로 따라가는 게 아니라, 의도에 맞는 포맷을 써야 한다는 뜻입니다. "가격 비교" 쿼리라면 긴 에세이보다 비교 표가 있는 리스티클이 이깁니다.
진단 4: 제3자 신뢰 신호 부족
가장 불편한 진단입니다. 자사 사이트를 아무리 최적화해도, 제3자 언급이 없으면 AI 답변에서 계속 밀립니다.
출처: BrightEdge - ChatGPT Brand Mentions vs. Citations
ChatGPT는 브랜드 링크를 실제 인용하는 것보다 3.2배 더 많이 브랜드를 단순 언급합니다. 브랜드 언급의 약 85%는 자사 도메인이 아니라 제3자 페이지에서 발생하며, 인용의 약 48%가 Reddit·YouTube 같은 커뮤니티 플랫폼에서 나옵니다.
플랫폼별 편차도 큽니다.
| 플랫폼 | 주 인용 소스 경향 |
|---|---|
| ChatGPT | Wikipedia 약 7.8% 최다, Reddit 약 11% |
| Perplexity | Reddit·커뮤니티 약 16.9%, 2026년 1월 Reddit만 24% |
| Google AI Overview | Reddit 약 2.2% 비중, 기사형 소스가 더 큼 |
출처: Search Engine Roundtable - ChatGPT sources Wikipedia, Google AIO sources Reddit
ChatGPT는 가장 많이 인용하는 단일 도메인이 Wikipedia로 전체 인용의 7.8%를 차지하고, Perplexity는 Reddit·커뮤니티 포럼에 더 크게 의존해 2026년 1월 Perplexity 인용의 24%가 Reddit 한 곳에서 발생했습니다.
여기서 중요한 결론이 나옵니다. AI 답변 최적화는 자사 블로그만 다듬는 게 아니라, 세 종류의 "제3자 면적"을 확보하는 작업입니다.
- 위키 계열 면적: 위키피디아·나무위키·업계 사전 등재, 일관된 브랜드명 표기,
sameAs로 연결되는 공개 프로필. - 커뮤니티 면적: Reddit·Quora 해외 시장이라면 필수, 국내는 네이버 지식인·관련 카페·업계 슬랙/디스코드의 장기 축적.
- 미디어 면적: 업계 매체 기고, 인터뷰, 기업 뉴스. 이름이 자연스럽게 언급되는 맥락이 쌓여야 합니다.
ChatGPT처럼 학습 데이터 기반 추천이 강한 엔진에서는 이 누적이 더 결정적입니다.
출처: Rankeo - How to Get Cited by ChatGPT, Perplexity & Claude 2026
ChatGPT 인용은 메타데이터나 구조화 콘텐츠 업데이트로 단기간에 최적화할 수 없습니다. 충분히 많은 독립 소스에서 오랜 기간 브랜드가 언급되어 모델이 카테고리-브랜드 연관을 학습한 결과입니다. 지속적이고 대량의 earned media 존재감이 필요합니다.
진단 5: 콘텐츠 신선도 문제
AI 답변은 "오늘" 쓸모 있는 정보를 선호합니다. 오래된 글은 순위가 남아있어도 인용 회로에서 빠르게 배제됩니다.
출처: Qwairy - Content Freshness & AI Citations Guide 2026
Perplexity 통제 실험에서 콘텐츠 업데이트 후 첫 48시간 내 인용 빈도가 37% 증가했고, 2주 후 14% 우위로 안정화되었습니다. 2026년 2월 Perplexity 퍼블리셔 가이드라인은 최근 90일 내 업데이트된 콘텐츠에 freshness 신호 우선순위를 부여한다고 명시했습니다.
경쟁사와 비교했을 때 자사 콘텐츠가 인용되지 않는 사이트는 이런 패턴이 많습니다.
- 글 상단에 발행일만 있고 최종 업데이트일이 없습니다.
- 2023년에 쓴 통계가 그대로 남아있습니다. AI는 구버전 수치를 위험 신호로 봅니다.
- 가격·제품·규제가 바뀌었는데 본문이 그대로입니다.
- Article 스키마에
datePublished는 있지만dateModified가 없습니다.
해결은 "전면 재작성"이 아닙니다. 인용이 중요한 상위 20~30개 글을 반기별로 수치·날짜·스크린샷만 업데이트하고 dateModified를 갱신하는 것만으로도 충분히 신호가 바뀝니다.
진단 6: 경쟁사가 한 일을 우리가 안 한 구조적 차이
마지막 진단은 "경쟁사는 하고 우리는 안 한 것"을 찾는 겁니다. 추상적인 감보다 구체적 항목으로 비교해야 실행이 나옵니다.
실제 현장에서 가장 자주 나타나는 구조적 격차는 네 가지입니다.
- 엔티티 커버리지 (Entity Coverage): 경쟁사는 관련 개념을 10~20개 별도 페이지로 쪼개 다룹니다. 자사는 긴 글 하나에 다 넣습니다. AI 답변 엔진은 "주제 X를 다루는 사이트"가 아니라 "개별 질문에 직접 답하는 페이지"를 뽑습니다.
- 내부 링크 구조: 경쟁사는 허브 페이지에서 세부 FAQ·정의 페이지로 클러스터를 구성합니다. 자사 블로그는 카테고리-게시글 구조만 있습니다.
- 저자·조직 엔티티 그래프: 경쟁사 저자 페이지는 LinkedIn, 회사 소개, 외부 기고 기록까지
sameAs로 연결됩니다. 자사 저자는 "김OO 매니저" 한 줄이 전부입니다. - 정기 데이터 공개: 경쟁사는 분기별 리포트·통계를 내고 미디어가 그걸 인용합니다. 인용이 다시 AI 학습 데이터에 들어갑니다. 자사는 이 루프가 없습니다.
한국 시장에서는 여기에 네이버 AI 브리핑 전용 조건이 추가됩니다. 네이버는 자체 알고리즘으로 답변을 구성하기 때문에 구글 AI Overview 최적화만으로는 커버되지 않습니다.
출처: GEO 실험실 리드젠랩 - 네이버 AI 브리핑 C-rank AEO 최적화 가이드
네이버 AI 브리핑은 권위성(Authoritativeness) 평가에서 C-rank 점수를 핵심 지표로 쓰며, 네이버 내 콘텐츠 공유 횟수, 댓글 품질, 다른 블로거의 인용 빈도가 종합 평가됩니다. 신뢰성(Trustworthiness)은 최신 업데이트 주기, 출처 링크 정확성, 네이버 정책 위반 이력 기준으로 산정됩니다.
즉 자사 도메인이 네이버 블로그 계정과 연결된 언급 자산이 없다면, 구글 AI Overview에는 뽑혀도 네이버 AI 브리핑에서는 계속 밀릴 수 있습니다. 한국에서 경쟁사가 "양쪽 다 뽑히는" 이유가 이 지점입니다.
자가 진단 10분 체크리스트
아래 10개 항목 중 3개 이상이 "아니오"라면 AI 답변 미노출의 구조적 원인이 있습니다.
- 메인 콘텐츠가 JavaScript 없이 HTML에 렌더링되는가. (소스 보기로 본문 텍스트 확인)
- robots.txt에 GPTBot, ClaudeBot, PerplexityBot, ChatGPT-User가 차단되어 있지 않은가.
- Organization 스키마가 JSON-LD로 들어가 있고
name,url,logo,sameAs가 채워져 있는가. - 각 글에 저자 바이라인이 있고 저자 Person 스키마가 외부 프로필로 연결되는가.
- 글 서두 첫 50~100단어 안에 핵심 질문의 정의·답이 나오는가.
- H2가 질문형이거나 명확한 주제어이며, 본문에 리스트·비교 표가 섞여 있는가.
- 지난 90일 내 업데이트된 글이 상위 페이지의 절반 이상인가.
dateModified도 갱신되는가. - 업계 매체, 뉴스, 커뮤니티에 자연스럽게 언급된 사례가 최근 6개월 내 존재하는가.
- 회사명·브랜드명이 위키피디아·나무위키·네이버 지식백과 등 제3자 레퍼런스에 등재되어 있는가.
- 네이버 블로그·카페·지식인 영역에 브랜드명이 등장하는 자산이 있는가.
모든 "아니오" 항목이 곧 경쟁사 대비 결손 영역입니다. 전부 고치는 게 아니라, 위에서부터(진단 1 → 6) 차례로 막힌 관문을 여는 순서가 가장 빠릅니다.
자주 묻는 질문
Q1. 구글 순위 1위인데 AI Overview에 안 나오는 것도 정상인가요.
정상입니다. 2025년 중반까지는 AI Overview 인용 중 상위 10위 페이지 비율이 약 76%였지만 2026년 초 약 38%로 떨어졌습니다. 순위와 AI 인용은 이제 다른 시스템이라고 보는 게 맞습니다.
Q2. 스키마만 추가하면 바로 인용되나요.
아닙니다. 스키마는 "신뢰 가능한 소스인지 식별"을 빠르게 해주는 출입증에 가깝습니다. Search/Atlas 연구에서 스키마 커버리지와 AI 인용률의 유의미한 상관관계는 확인되지 않았습니다. 스키마는 필수 요건이지만, 콘텐츠 구조와 제3자 신호가 함께 있어야 합니다.
Q3. AI 크롤러를 차단하면 순위에 영향이 있나요.
구글 검색 순위에는 영향이 없습니다. GPTBot·ClaudeBot은 OpenAI·Anthropic 전용 크롤러이고 Googlebot과 분리되어 있습니다. 다만 차단하는 순간 ChatGPT·Claude 기반 답변에서는 완전히 제외됩니다. 학습 용도만 거르고 검색 용도(ChatGPT-User, PerplexityBot)는 허용하는 분리 전략이 2026년 일반적입니다.
Q4. 네이버 AI 브리핑도 구글 AI Overview와 같은 기준으로 대응하면 되나요.
아닙니다. 네이버는 C-rank 기반 권위 신호를 자체 알고리즘으로 씁니다. 네이버 블로그·카페 생태계 내 언급과 인용 빈도가 핵심이기 때문에, 자사 닷컴 도메인만 최적화해서는 커버되지 않습니다. 구글용 자산과 네이버용 자산을 분리해 설계해야 합니다.
Q5. 우리가 B2B 서비스라 Reddit·커뮤니티 언급이 없는데 어떻게 시작하나요.
국내 B2B라면 Reddit보다 네이버 지식인, 관련 카페, 업계 슬랙·디스코드·링크드인 한국어 게시물, 업계 매체 기고가 현실적인 대체재입니다. 중요한 건 플랫폼이 아니라 "자사 도메인 밖에서 브랜드-카테고리 연관이 반복 노출되는가"입니다. 6개월~1년 단위 earned media 플랜으로 접근하는 게 맞습니다.
마무리: AI 답변은 가장 정제된 SEO 결과다
AI 답변 엔진이 하는 일은 결국 "수많은 페이지 중 가장 신뢰할 만한 답변을 고르는 것"입니다. 그 기준은 마법이 아니라 기술적 크롤 가능성, 식별 신호, 콘텐츠 구조, 제3자 신뢰, 신선도, 엔티티 커버리지라는 6개 층의 조합입니다.
경쟁사만 AI 답변에 나오는 상황은 운이 아니라, 이 6개 층에서 경쟁사가 한 발씩 먼저 정리했기 때문입니다. 반대로 말하면 순서대로 풀 수 있는 문제라는 뜻이기도 합니다.
- 이번 달: 진단 1(크롤 가능성)과 진단 2(식별 신호) 점검. 기술팀 협업으로 1~2주 안에 끝낼 수 있습니다.
- 다음 달: 진단 3(콘텐츠 구조) 상위 20개 페이지 리라이트. 새 글보다 기존 글 구조 개편이 ROI가 큽니다.
- 2~3개월: 진단 5(신선도) 분기별 업데이트 체계화, 진단 6(엔티티 커버리지) 주제 클러스터 설계.
- 6개월 이상: 진단 4(제3자 신호) earned media 루프 구축. 가장 오래 걸리지만 가장 방어력이 큽니다.
자사 사이트 한 곳만 들여다보면 이유가 안 보입니다. 경쟁사가 "우리와 다르게 한 것" 6가지를 구조로 보기 시작하면, AI 답변 미노출은 공포가 아니라 실행 가능한 문제로 바뀝니다.