사이냅소프트, 공공문서 RAG 활용 방안 제시

2025-07-25     한경석 기자
정진남 사이냅소프트 이사(오른쪽)이 공공정보화리더스포럼에서 발표하고 있다. 사진=사이냅소프트

문서 인공지능(Document AI) 전문기업 사이냅소프트(대표 전경헌)가 ‘2025 공공정보화 리더스 포럼’에서 한글(HWP) 문서를 효과적으로 생성형 AI에 활용하는 방안을 제시해 공공기관 관계자들의 주목을 받았다.

25일 사이냅소프트는 이번 포럼에서 ‘같은 LLM, 다른 결과: 공공문서(HWP) 효과적으로 RAG에 활용하는 방법’을 주제로 발표를 진행했다고 전했다.

포럼은 전자신문과 한국IT서비스산업협회가 공동 주최하고, 공공정보화협의회와 정부정보화협의회 등이 후원한 행사로, 정부부처·공공기관·지자체 정보화 담당자만을 대상으로 한 폐쇄형 세미나였다.

행사는 한국수목원정원관리원의 정보화 사업 소개를 시작으로, 모두싸인의 전자서명·AI 문서관리 발표에 이어 사이냅소프트의 발표 순으로 진행됐다. 이 중 사이냅소프트의 세션은 실제 공공 현장에서 빈번히 활용되는 한글 문서를 생성형 AI에 접목하는 데 있어 직면하는 구조 정보 손실 문제와 그 해결책을 구체적으로 다루며 참석자들의 높은 관심을 받았다.

사이냅소프트는 발표를 통해 “같은 대형언어모델(LLM·Large Language Model)을 사용하더라도 입력 데이터의 구조와 품질에 따라 결과가 극명하게 달라질 수 있다”며 “문서 구조 정보 손실은 검색 기반 생성(RAG·Retrieval-Augmented Generation) 시스템의 성능 저하를 초래하는 주요 원인”이라고 지적했다.

이를 해결하기 위해 사이냅소프트는 자사의 문서 이해 기술을 집약한 ‘사이냅 도큐애널라이저(Synap DocuAnalyzer)’를 소개했다. 이 기술은 한글(HWP/HWPX) 원본 문서를 직접 분석해 문서의 구조와 내용을 인공지능(AI)이 해석 가능한 형태로 변환한다. 단순한 광학문자인식(OCR)이나 텍스트 추출을 넘어, 제목·본문·표·목차 등 문서의 맥락과 구성요소를 그대로 반영해 LLM에 입력할 수 있도록 설계된 것이 특징이다.

사이냅소프트는 문서 전처리에서부터 검색 기반 생성(RAG) 설계, LLM 서비스까지를 아우르는 통합 패키지 ‘사이냅 어시스턴트(Synap Assistant)’도 함께 선보였다. 실제 활용 사례로는 베타 서비스 중인 ‘DartPoint AI’를 언급했다. 이 서비스는 전자공시 정보를 기반으로 기업분석, 재무분석, 공시 검색 기능 등을 제공하는 생성형 AI 기반 에이전트다.

이번 발표는 공공부문 내에서 생성형 인공지능(Generative AI) 도입이 빠르게 확산되는 흐름 속에서 이뤄졌다. 사이냅소프트에 따르면, 지난해 ‘생성형’이라는 키워드를 포함한 나라장터 입찰 공고는 87건이었지만, 2025년에는 상반기에만 71건이 등록되며 7월 21일 기준 총 93건에 달했다.

이러한 흐름은 정부의 ‘AI 전환(AX·AI Transformation)’ 정책 기조에 따른 것으로 풀이된다. 공공데이터 개방정책(2013~), 디지털플랫폼정부(2022~), 소버린 AI 전략(2025~) 등 일련의 국가 AI 정책 속에서, 2025년 정부 부처 합동 AI 예산만 4조 원 이상이 편성된 상태다.

사이냅소프트 관계자는 “공공기관이 보유한 방대한 한글 문서 자산을 구조화된 데이터로 전환해 생성형 AI에 효과적으로 활용할 수 있도록 돕는 것이 목표”라며 “국가 차원의 인공지능 전환 흐름에 기술로 기여하겠다”고 말했다.

파이낸셜투데이 한경석 기자