Cluster · 04  ·  한국 entity 해자 · 정부 공시
미국 사기업은 Crunchbase에 의존한다. 한국 사기업에는 정부 공식 ground truth가 있다. DART와 K-Startup이다. AI는 Wikipedia·나무위키를 47.9% 인용하고, 그들은 한국 기업 정보의 1차 출처를 DART로 삼는다.

4GRIT 에디터   •   읽는 시간 9분   •   DART · K-Startup · Wikipedia · GEO

ig.1 — 한국 SaaS의 AI 인용 신뢰 체인. STAGE 1은 정부 공식 entity 발급(DART · K-Startup), STAGE 2는 백과의 인용(나무위키는 사기업 entity의 거의 100%를 DART에서 인용), STAGE 3은 AI 응답(ChatGPT는 응답 하단 sources에 Wikipedia · 나무위키 · DART를 표시). 미국 사기업은 STAGE 1이 SEC EDGAR 상장사 한정으로 약하지만, 한국 사기업은 외감대상법인까지 커버한다 — 한국 SaaS 고유의 비대칭 자산.

01 · The Scene

VC analyst의 답은 이러했다. “ChatGPT로 한국 SaaS 리스트를 만들었어요.” 추가 질문을 던졌다. 응답 하단 sources에 무엇이 있었나? 영문 Wikipedia 한 줄 + Crunchbase 페이지 한 줄 + 우리 한국어 홈페이지 한 줄. 회사 소개 카피의 출처는 영문 Wikipedia였다. 그리고 그 Wikipedia entry는 3년 전 우리가 영문 사이트에 처음 올렸던 회사 소개를 인용한 것이었다. 그 사이 제품도, 카테고리도, 메시지도 전부 바뀌었지만 AI는 3년 전 정보로 우리를 인식하고 있었다.

이것이 한국 SaaS의 구조적 문제다. 한국 사기업의 entity 정보는 신뢰할 수 있는 영문 ground truth가 거의 없다. Crunchbase는 한국 회사 정보가 부분적이고 갱신이 느리다. LinkedIn은 한국 사용 빈도가 글로벌 대비 낮아 회사 페이지 활성도가 떨어진다. 영문 Wikipedia entry는 만들기 어렵고, 만들어도 출처(citations) 부족으로 삭제 위험이 있다.

그런데 한국 SaaS는 미국 사기업이 절대 갖지 못하는 채널을 갖고 있다. 정부가 운영하는 공식 entity 데이터베이스다. 4GRIT이 정리한 AI 인용 엔티티 8선 체크리스트의 네 번째 항목이 이것이다. 미국에는 SEC EDGAR가 있지만 상장사 한정이고, 한국의 DART는 외감대상법인까지 커버한다. K-Startup은 정부 인증 스타트업 데이터베이스로 미국에는 등가물이 없다. 같이 풀어보자.

02 · 한국 사기업 entity의 신뢰성 갭

AI는 한국 회사를 어떻게 추정하는가

AI가 한국 SaaS의 정체성을 추정할 때 의지하는 source 계층은 영어권 SaaS와 본질적으로 다르다.

영어권 SaaS는 4계층 source가 거의 자동으로 채워진다. (1) Crunchbase 사기업 데이터베이스, (2) LinkedIn 회사 페이지, (3) 영문 Wikipedia entry, (4) 영문 미디어 보도. 이 네 계층이 모두 영어로, 자동 갱신되며, 표준화된 schema를 따른다. ChatGPT가 영어권 사기업을 인식할 때 충돌하는 정보가 거의 없다.

한국 SaaS는 이 네 계층 모두 약하다. Crunchbase는 한국 회사 데이터가 부분적이고 갱신 속도가 느리다. LinkedIn은 한국 시장 사용률이 낮아 회사 페이지 정보 풍부도가 떨어진다. 영문 Wikipedia 등재는 자체 notability 기준이 높아 한국 SaaS 대부분이 진입하지 못한다. 영문 미디어 보도는 글로벌 진출 회사에 한정된다.

그러나 이 갭을 메우는 단일 강력한 채널이 있다. 정부 운영 공식 entity 데이터베이스다. 한국 정부는 DART(전자공시시스템)로 외부감사대상 법인의 정보를 의무 공시 대상으로 운영한다. K-Startup으로 정부 인증 스타트업 데이터베이스도 운영한다. 두 시스템 모두 영문 정보 + Open API를 제공한다.

결정적인 점이 하나 있다. 한국어 백과사전 나무위키는 사기업 정보의 거의 100%를 DART에서 인용한다고 자체 명시한다. 영문 Wikipedia에 한국 회사 entry가 있다면, 그 출처(citations)도 대부분 DART의 사업보고서 또는 그것을 정리한 신뢰 매체다. ChatGPT의 top-10 source 중 Wikipedia가 47.9%를 차지하므로(Profound 30M citations 분석, 2025), DART의 정합성이 곧 한국 SaaS의 AI 인식 정확도를 결정한다.

요약하면 이렇다. 한국 SaaS의 AI entity 인식 경로는 “DART · K-Startup → Wikipedia · 나무위키 → ChatGPT”의 신뢰 체인을 따른다. 미국 사기업은 이 1차 ground truth 단계가 없거나 약하다. 한국 SaaS의 구조적 우위다.

Sources  ·  DART 공식 소개 · 금융감독원 · K-Startup 창업지원포털 · Profound · 30M citations 분석 2025

03 ·  DART · K-Startup이 뭔가

DART는 공시 시스템이 아니라 정부 entity 데이터베이스다

DART(전자공시시스템)는 1999년 4월 정식 서비스를 시작한 금융감독원 운영 시스템이다. 일반적으로 “상장사 공시”로 알려져 있지만, 실제 커버리지는 훨씬 넓다.

DART 공시 의무 대상은 네 가지다. (1) 주권상장법인: 코스피·코스닥. (2) 외부감사대상법인(외감): 자산총액 120억 이상이거나 종업원 300명 이상이면서 자산 70억 이상인 법인. (3) 주주 500명 이상 법인. (4) 모집·매출 발행인: 증권 공모를 한 적이 있는 법인. 한국에서 일정 규모 이상 자본을 운용하는 모든 법인은 DART 시스템 안에 entity가 만들어진다는 뜻이다.

이 시스템에서 만들어지는 entity 정보의 특성: 정부 인증 + 법적 책임 + API 접근 가능OPEN DART API를 통해 외부 시스템이 기업 개황·재무·임원·주요사항을 RESTful 형식으로 조회할 수 있다. 인증키 신청만 하면 누구나 사용 가능하다. 공공데이터포털에도 미러링되어 있다. AI 학습 데이터 수집 파이프라인이 한국 회사 정보를 가져갈 때 가장 신뢰할 수 있는 source가 된다.

K-Startup은 다른 layer를 채운다. K-Startup 창업지원포털은 중소벤처기업부 산하 창업진흥원이 운영하며, 창업기업확인시스템을 통해 정부 공식 인증을 발급한다. 「중소기업창업 지원법」 제14조 근거. 인증 보유 자체가 entity signal로 작동한다. “정부 인증 받은 한국 스타트업”이라는 신뢰 라벨이 생긴다.

결정적인 점이 하나 더 있다. 한국 entity의 영어권 노출 모멘텀이다. 금융위원회 2025.11 발표에 따르면 영문공시 의무화 2단계가 2026년 5월부터 시행된다. 자산 2조 이상 코스피 상장사 265개사가 55개 항목 영문공시를 국문공시 후 3영업일 내 제출해야 한다. 1단계(2024.01, 자산 10조+ 또는 외국인 30%+) 111개사에서 2.4× 확대다. 한국거래소 + 네이버 파파고 협업 AI 번역기까지 제공된다. 이 데이터가 영문 entity ground truth로 누적된다.

04 · 한국 SaaS의 진입 결정 매트릭스

“우리도 DART에 등록되나요?”의 답

한국 시장에 직접 적용되는 변수가 둘 있다.

한국 SaaS 마케팅팀에서 가장 많이 받는 질문이 있다. “우리 회사 DART 들어가 있어요?” 그 답은 회사 규모에 따라 달라지고, 진입 옵션도 다르다. 네 가지 케이스로 나뉜다.

케이스 A · 외감 의무 대상. 자산 120억 이상 또는 종업원 300명 이상이면서 자산 70억 이상이라면 외부감사대상법인이다. 자동으로 DART 시스템에 진입한다. 매년 감사보고서 + 사업보고서 등 정기공시 의무가 발생한다. 한국 SaaS 중 시리즈 B 이후 회사 다수가 여기 해당한다. 이 단계의 작업은 “이미 들어가 있는 entity 정보의 정합성 점검”이다.

케이스 B · 외감 비대상 + 발행 이력 있음. 외감 기준은 안 되지만 우선주·전환사채·신주인수권부사채 등을 발행한 적이 있으면 사업보고서 제출 대상이 될 수 있다. 시리즈 A 이후 회사들이 여기 자주 걸린다. 회사 사정에 따라 자발적 사업보고서 제출도 가능하다.

케이스 C · 외감 비대상 + 발행 이력 없음. 시드~프리A 단계 회사 대부분. DART 자동 진입은 안 되지만 K-Startup 창업기업 확인은 가능하다. 「중소기업창업 지원법」 기준 창업 7년 이내 기업이면 신청 가능. 이 단계의 작업은 K-Startup 등록을 정부 공식 entity 채널로 활용하는 것이다.

케이스 D · 비외감 + 비창업. 창업 7년 초과 + 외감 비대상. 가장 어려운 케이스다. 그러나 벤처기업확인 인증, 이노비즈 인증, 메인비즈 인증 등 다른 정부 인증 채널이 있다. 또 자발적 IR 자료를 회사 영문 사이트에 일관 게시함으로써 entity ground truth를 자체 생성할 수 있다.

※ 실무 결정 한 줄 : 회사 자산 규모와 창업 연차로 케이스를 판정하고, 그 케이스의 채널을 최대한 활용한다. 외감 대상이면 사업보고서 영문 정합성 점검, 외감 비대상이면 K-Startup 또는 기타 정부 인증 보유 + 자발 IR. 한국 SaaS의 entity 강화는 영어권 SaaS와 다르게 “무엇을 만들지”가 아니라 “이미 만들어져 있는 정부 데이터를 어떻게 가지런히 할지”의 문제에 가깝다.

05 · 실행 · 5단계

이미 만들어진 정부 entity를 영문 채널에 정렬하기

아래는 한국 SaaS의 entity 채널을 점검·정비하는 5단계다. 새 콘텐츠 작성 작업이 아니라 이미 있는 정부 데이터를 가지런히 정리하는 작업이다. Step 1~2는 마케터 단독 가능, Step 3은 IR/CFO 협업 필요, Step 4~5는 분기 단위 점검.


STEP 01
회사 케이스 판정 (A · B · C · D 분류)

최신 결산 기준으로 회사 자산총액과 종업원 수, 그리고 창업 연차 세 변수로 케이스를 분류한다.

  • 케이스 A: 자산 120억 이상 OR 종업원 300명 이상이면서 자산 70억 이상. 외감 의무 대상 → DART 자동 진입.
  • 케이스 B: 외감 비대상이지만 우선주·CB·BW 등 발행 이력 있음. 주요사항보고서 제출 가능.
  • 케이스 C: 외감 비대상 + 발행 이력 없음 + 창업 7년 이내. K-Startup 창업기업 확인 가능.
  • 케이스 D: 외감 비대상 + 창업 7년 초과. 벤처기업확인 / 이노비즈 / 메인비즈 인증 검토.


DART 등록 자동 여부는 dart.fss.or.kr에서 회사명으로 검색해보면 30초에 확인된다. 검색 결과 있으면 케이스 A 또는 B, 없으면 C 또는 D.

STEP 02
DART 조회: 우리 회사 entity가 어떻게 보이는지

DART에 등록되어 있다면 OPEN DART API 또는 웹에서 조회해 현재 외부에 노출된 entity 정보를 점검한다.

  • 웹 조회dart.fss.or.kr에서 회사명 검색 → 기업개황 클릭. 회사명·영문명·주소·대표자·주요사업·홈페이지·전화 등 11개 필드 표시.
  • API 조회opendart.fss.or.kr에서 인증키 신청 후, 기업개황 API 호출. JSON 구조로 응답.
  • 공공데이터포털data.go.kr에 미러링되어 있음. 동일 데이터를 정부 표준 API로 조회 가능.


이 단계의 목표는 분명하다. “우리 회사 정보가 한국 정부 데이터베이스에서 어떻게 보이는지”를 확인하는 것이다. 영문명이 비어 있거나 오기재되어 있을 가능성, 대표자 정보가 옛날 정보일 가능성, 홈페이지 URL이 잘못 등록되어 있을 가능성을 다음 Step에서 정비한다.

STEP 03
정합성 정비: DART · 홈페이지 · 영문 IR 페이지 일관성

DART에 등록된 entity 정보가 회사 영문 홈페이지·About 페이지와 일치하는지 점검하고 어긋난 부분을 정비한다. 이 단계는 IR/CFO 협업이 필요하다. DART 정보 변경은 공시 관련 절차가 따른다.

  • 회사 영문명: 사업자등록증·법인등기부등본의 영문 표기와 동일한지. Inc./Co., Ltd./Corp. 표기까지 일치.
  • HQ 영문 주소: 도시명 표기 통일(Seoul vs Soul, Seongnam vs Sungnam 같은 변형 제거).
  • 대표자 영문 이름: 여권 영문 표기 또는 일관된 로마자 표기.
  • 홈페이지 URL: DART 등록 URL이 현재 운영 중인 사이트와 일치하는지.
  • 주요 사업 한 줄 영문 설명: DART 한국어 기업개황의 영문 번역본을 회사 영문 사이트 About에 동일하게 게시.


회사 영문 사이트의 About 페이지에 Schema.org Organization JSON-LD 마크업을 head에 넣는다. name·foundingDate·address·identifier·sameAs(DART·LinkedIn·Crunchbase URL 포함) property를 모두 채운다. AI 크롤러가 이 페이지를 fetch했을 때 “검증된 entity record”라고 인식하는 신호다. C3 Step 2에서 다룬 작업과 같은 메커니즘이지만, 이번에는 DART 정보를 ground truth로 referencing한다는 점이 핵심이다케이스 D의 경우, 다른 정부 인증을 검토한다. 벤처기업확인(중기부, 기술/연구개발 기준), 이노비즈(혁신기업 인증), 메인비즈(경영혁신 인증), 여성기업확인(해당 시) 등. 각 인증은 별도 Wikipedia/나무위키 entry를 갖고 있어 회사 entity entry에 인용으로 연결된다.

STEP 04
K-Startup 등록 (케이스 C) 또는 정부 인증 (케이스 D)

케이스 C의 경우, K-Startup 창업기업 확인 시스템에 등록한다.

  • K-Startup 창업지원포털 접속 → 중소벤처24 통합회원 가입.
  • ▶ 창업기업 확인 신청. 「중소기업창업 지원법」 기준 창업 7년 이내 기업이면 신청 가능.
  • ▶ 회사 개요·제품·고객사·언론보도·수상이력 입력. 영문 회사명·tagline 필드도 함께 채운다.
  • ▶ 창업진흥원 검토 후 확인서 발급. 이 확인서가 정부 공식 인증 entity signal이 된다.

케이스 D의 경우, 다른 정부 인증을 검토한다. 벤처기업확인(중기부, 기술/연구개발 기준), 이노비즈(혁신기업 인증), 메인비즈(경영혁신 인증), 여성기업확인(해당 시) 등. 각 인증은 별도 Wikipedia/나무위키 entry를 갖고 있어 회사 entity entry에 인용으로 연결된다.


STEP 05
Wikipedia · 나무위키 entity 정합성 분기 모니터링

4개 채널이 정렬된 후, 그 정보가 Wikipedia·나무위키에 어떻게 반영되었는지 분기마다 점검한다. 

  • 나무위키 자체 검색namu.wiki에서 회사명 검색. entry가 있으면 출처가 DART인지 확인.
  • 한국어 Wikipedia 검색ko.wikipedia.org에서 회사명 검색. 등재 자체가 어렵지만 정부 인증 보유 시 가능성이 올라간다.
  • 영문 Wikipedia 검색en.wikipedia.org에서 영문 회사명 검색. 글로벌 진출 보도가 있으면 등재 가능성이 있다.
  • Wikidata 검색wikidata.org에서 회사명 검색. entry가 있으면 P17(country)·P571(inception)·P159(headquarters) 같은 핵심 property가 채워져 있는지 점검.

각 채널에서 발견된 entity 정보가 DART 정보와 일치하지 않으면 정정 작업을 시작한다. 우선순위는 (1) 회사 영문 사이트 갱신, (2) 영문 IR 페이지의 Schema.org 갱신, (3) Wikidata 직접 편집(가능 시), (4) 나무위키는 직접 편집보다 영문 사이트 정보를 갱신해서 자연스럽게 반영되도록 유도. 분기 1회, 1시간 작업이면 충분하다.

Sources  ·  금융위원회 2025.11.17 발표 · 정책브리핑 · 머니S 2026.01.28 · 금융위 정례회의 의결 · 김·장 법률사무소 · 영문공시 1단계 시행 분석

06 · 증거 · 네 갈래로 검증된다

Wikipedia 47.9% · 나무위키 100% · 영문공시 2.4× · 정부 인증 다층

“DART · K-Startup이 한국 SaaS의 AI entity 신뢰 체인의 1차 노드”라는 명제는 네 갈래의 검증된 데이터로 뒷받침된다.

① Wikipedia가 ChatGPT의 압도적 1위 인용 source · 47.9%. Profound가 2024년 8월~2025년 6월 30M citations를 분석한 결과, ChatGPT의 top-10 source 중 Wikipedia가 47.9%를 차지했다. 두 번째 Reddit(11.3%)의 4배 이상이다. 730,000건 대화의 후속 분석(2026.02)에선 약 1/6(16.7%) 대화가 Wikipedia를 인용했다. “ChatGPT가 baseline 사실을 찾는 첫 번째 출처”가 Wikipedia라는 평가다. ChatGPT만이 아니라 Gemini·Claude·Grok 등 다른 LLM도 동일한 인코더 구조를 사용해 Wikipedia 가중치가 비슷하게 작동한다. Wikipedia에 정확한 한국 회사 entry가 만들어지는 것이 AI 인식의 baseline이다.

② 나무위키 사기업 entry의 거의 100%가 DART 인용. 나무위키 자체 명시에 “공기업을 제외한 사기업 문서에 있는 재무 정보나 기업 개황 자료는 거의 100% 여기에서 가져온 것”이라고 직접 적혀 있다. 한국어 LLM 학습 데이터의 큰 부분을 나무위키가 차지하므로, DART에 정확한 한국어 정보가 있으면 → 나무위키 entry에 반영되고 → 한국어 AI 응답에서 정확한 entity가 추정된다. 영문 Wikipedia에 한국 회사 entry가 있다면 그 출처(citations)도 대부분 DART 사업보고서 또는 그것을 정리한 신뢰 매체다.

③ 영문공시 의무화 단계적 확대 · 1단계 111사 → 2단계 265사 → 3단계 코스피 전체. 금융위원회 2025.11.17 발표에 따르면 영문공시 의무화는 단계적으로 시행 중이다. 1단계(2024.01.01부터, 자산 10조+ 코스피 또는 자산 2조~10조 외국인 30%+)는 111개사. 2단계(2026.05.01부터, 자산 2조 이상 코스피 전체)는 265개사로 1단계 대비 2.4× 확대된다. 3단계(2027.03~2028)는 코스피 전체 + 코스닥 자산 2조+를 검토 중이다. 공시 항목도 26개에서 55개로 확대. 자산 10조+ 대형사는 국문공시 당일 영문 제출 원칙. 한국거래소 + 네이버 파파고 협업 AI 번역기까지 제공된다. 영문 entity 데이터가 정부 시스템에 누적되는 모멘텀이다.

④ K-Startup + 다층 정부 인증으로 외감 비대상도 entity signal 확보 가능. 외감 의무가 없는 시드~프리A 단계 회사도 K-Startup 창업기업 확인을 통해 정부 공식 entity 채널을 갖는다. 「중소기업창업 지원법」 제14조 근거. 그 외 벤처기업확인(중기부), 이노비즈(혁신기업), 메인비즈(경영혁신), 여성기업확인 등 회사 단계·특성에 맞는 정부 인증이 다층 존재한다. 한국 SaaS는 어느 단계에서든 적어도 하나의 정부 인증 entity 채널을 가질 수 있다. 미국 사기업이 갖지 못하는 구조적 우위다.

07 · 한국 SaaS 고유의 협공

identity + category + jurisdiction = AI 인용 가능 상태

이 글은 AI 인용 엔티티 8선 체크리스트의 네 번째 항목이다. geo-entity.beusable.net/checklist의 나머지 4개는 robots.txt 정책, GitHub Org + README, Naver 스마트플레이스, RSS feed 공개.

앞선 세 글이 다룬 Knowledge Panel(identity)G2·Capterra(category)IndexNow(indexing)는 미국 SaaS와 동일하게 갖출 수 있는 entity 신호다. DART · K-Startup은 다르다. 이것은 jurisdiction entity다. 한국이라는 관할권 자체가 발급한 공식 신호다. 미국 사기업이 동등한 채널을 가지려면 SEC S-1 등록이 필요하고, 그건 IPO 직전 단계다. 한국 SaaS는 자산 120억만 넘으면 자동으로 갖춘다. K-Startup은 창업 7년 이내라면 누구나 갖는다.

네 갈래 증거가 가리키는 방향은 일관적이다. DART 영문공시 + K-Startup 등록 + Wikipedia 기본 entity를 갖춘 한국 SaaS는 ChatGPT·Claude가 “이 회사가 진짜 한국에 존재하는가”라는 1차 신뢰성 검증 단계를 통과한다. 이 작업은 외감 의무 회사라면 0원, K-Startup 등록은 1주, Wikipedia 모니터링은 월 30분이다. 미국 SaaS가 갖지 못한 채널을 한국 SaaS만 무료로 갖고 있다는 사실. 이것이 이 시리즈의 모든 글 중 가장 비대칭적인 entity 자산이다.

수요일 오후 4시에 시작할 수 있는 건 Step 1 케이스 판정과 Step 2 DART 조회다. 한 세션 30분이면 회사가 A·B·C·D 어느 케이스인지, DART에 이미 어떤 entity가 등록돼 있는지가 나온다. Step 3 정합성 정비는 회사명 영문 표기·주소 영문 표기·홈페이지 URL 일치 여부 점검이다. Step 4 K-Startup 등록은 비외감 회사 한정 1주, Step 5 Wikipedia 모니터링은 월 1회 루틴이다. 외부 도움 0, 개발팀 0, 마케팅 예산 0. 한국 법인 등록 사실 자체가 자산이라는 것. 이 영역만의 진실이다.

NEXT STEP

내 회사가 DART · K-Startup 어디에 보이는지 측정부터

Step 1의 “케이스 판정”을 자동화. 사업자등록번호만 입력하면 DART 등록 여부, 외감 의무 해당 여부, K-Startup 등록 가능 케이스, Wikipedia 영문 entity 상태를 한 번에 확인한다.

Print Friendly, PDF & Email

Share This Post

Share on facebook
Share on linkedin
Share on twitter
Share on email

Related