GEO 기준
GEO(Generative Engine Optimization)는 AI 검색/답변 시스템에서 문서가 검색, 선택, 인용되는 확률을 높이는 최적화입니다.
아래 로직은 운영 가능한 객관 지표를 위해 일반화한 기준입니다. 내부 모델의 정확한 가중치/파라미터는 공개되지 않으며 모델별로 달라질 수 있습니다.
GEO 평가 모델 (100점)
| 카테고리 | 측정 지표 | 가중치 | 합격 기준 |
|---|---|---|---|
| 질문-답변 적합성 | 질문형 H2/H3 비율, 요약 답변 존재율 | 25% | 질문형 섹션 비율 30% 이상 |
| 근거/출처 신뢰성 | 근거 링크율, 출처 최신성, 저자/기관 명시 | 20% | 핵심 주장 80% 이상 출처 포함 |
| 구조화 데이터 | JSON-LD 타입/필드 완성도 | 15% | 필수 필드 누락 0건 |
| 엔터티 일관성 | 브랜드/제품/조직명 표기 일치율 | 15% | 핵심 엔터티 일치율 95% 이상 |
| 콘텐츠 명확성 | 첫 단락 결론 포함, 문장 길이, 중복률 | 15% | 첫 단락 핵심 답변 포함 |
| 최신성 | 최종 수정일, 최근 갱신 주기 | 10% | 핵심 문서 90일 이내 갱신 |
총점 = Σ(카테고리 점수 × 가중치). 카테고리 점수는 0~100으로 정규화 후 가중 평균.
모델 관점 조회 가능성 신호 (실무 적용판)
| 신호 | 모델 관점 해석 | 검사 방법 | 권장 기준 |
|---|---|---|---|
| Canonical | 중복 문서가 있을 때 대표 URL을 선택하는 우선 신호 | link[rel=canonical] 유무/절대URL | self-canonical 100%, 체인/충돌 0건 |
| Robots/noindex | 문서 접근/인덱싱 가능 여부를 결정하는 게이트 신호 | meta robots, X-Robots-Tag | 핵심 페이지 noindex 금지 |
| Title/Description | 문서 주제와 의도 분류의 1차 요약 신호 | 길이/중복/질의어 포함 | Title 30~60, Description 70~160 |
| Heading 구조 | 답변 생성 시 섹션 경계와 문맥 단위를 안정화 | H1 단일성, H2/H3 계층 | H1 1개, 레벨 점프 최소화 |
| Schema.org | 엔터티 타입/속성을 기계가 바로 이해하는 신호 | JSON-LD @type/필수필드 | Organization/Article/FAQ 완성 |
| 출처 링크 | 답변 근거 문장 선택 시 신뢰도 상승 신호 | 주장-출처 연결률 | 핵심 주장 80% 이상 출처 연결 |
| 최신성 | 동일 주제 후보 간 재정렬에서 우세 신호 | lastmod/수정일/콘텐츠 갱신 | 핵심 문서 90일 이내 갱신 |
AI 검색/인용 로직 (실무형 파이프라인)
1) 수집/파싱
크롤러가 본문, 메타, canonical, robots, JSON-LD를 수집하고 문서를 섹션 단위로 분해합니다.
2) 후보 검색 (retrieval)
질의와 문서 섹션의 의미 유사도, 키워드, 엔터티 일치를 계산해 상위 후보를 고릅니다.
3) 품질 재정렬 (rerank)
출처 신뢰성, 최신성, 구조화 데이터, 중복/정합성(canonical 포함)으로 후보 우선순위를 재조정합니다.
4) 답변 생성 + 인용 선택
근거 밀도가 높은 문장을 우선 사용하며, 출처 연결이 명확한 문서를 인용 대상으로 선택합니다.
간단 점수식 예시
retrieval_score = 0.45*의도일치 + 0.25*엔터티일치 + 0.20*신뢰도 + 0.10*최신성
citation_score = 0.50*근거명시율 + 0.20*문장명확성 + 0.20*구조화데이터 + 0.10*최신성
운영 기준 예: retrieval_score 70 이상 + citation_score 75 이상 문서를 우선 인용 후보로 간주
운영 체크리스트 (객관 지표 중심)
- 핵심 URL self-canonical 100%, canonical 충돌 0건
- 핵심 페이지 noindex/X-Robots 차단 0건
- 각 핵심 페이지 질문형 소제목(H2/H3) 3개 이상
- 핵심 주장 문장에 출처 링크 포함률 80% 이상
- JSON-LD 필수 필드 누락 0건
- 브랜드/제품명 표기 일치율 95% 이상
- 핵심 문서 최종 수정일 90일 이내 유지