thebell

전체기사

[i-point]크라우드웍스, 카이스트 'AI 기술설명회'서 최신 기술 동향 소개데이터 전처리 솔루션 '알피 날리지 컴파일러', 국내 문서 특징 반영

이종현 기자공개 2025-05-16 13:23:56

이 기사는 2025년 05월 16일 13시23분 thebell에 표출된 기사입니다

크라우드웍스가 16일 오전 코엑스에서 열린 카이스트 김재철 인공지능(AI) 대학원 'AI 기술설명회'에서 최신 기술 트렌드를 공유하고 자사의 데이터 전처리 기술을 소개했다고 밝혔다.

이번 기술설명회는 카이스트가 연구 중인 핵심 원천 AI 기술을 산업계와 일반 대중에 소개하고 AI 기술 확산과 산학협력 활성화를 목표로 마련됐다. 크라우드웍스는 카이스트의 초청으로 강연에 참여했다.

강연자로 나선 양수열 크라우드웍스 최고기술책임자(CTO)는 '사장님이 잘 읽는 김대리의 보고서, AI는 왜 못 읽을까?'를 주제로 강연을 진행했다.

양 CTO는 "AI가 일반 문서 포맷을 읽는 것은 가능하지만, 문서에 담긴 '의미'를 이해하고 이를 메타데이터로 추출하는 일은 여전히 쉽지 않다"며 "차트나 다이어그램과 같은 시각 요소들은 단순한 설명을 넘어, 주변 문장과 단락의 문맥까지 고려해 의미 기반 메타데이터를 구성해야 AI가 관련 정보를 정확히 검색하고 응답 품질을 높일 수 있다"고 말했다.

알피 날리지 컴파일러

그는 우리나라 문서는 고유의 스타일과 구조를 가지고 있어 외산 파서(Parser)를 그대로 사용할 경우 오류가 많이 발생한다고 지적했다. 국내 문서의 특성을 반영해 표나 시각요소에 대한 정밀한 파싱과 처리가 필요하다는 설명이다.

양 CTO는 비정형 문서를 검색증강생성(RAG)에 적합한 형태로 전처리할 수 있는 크라우드웍스의 '알피 날리지 컴파일러'도 소개했다. 해당 솔루션은 문서 내 테이블, 차트, 이미지 등에 대해 대형언어모델(LLM) 기반 분석을 수행하고 의미 기반 메타데이터를 추가해 검색의 정밀도와 질의응답 품질을 개선하는 것이 특징이다.
< 저작권자 ⓒ 자본시장 미디어 'thebell', 무단 전재, 재배포 및 AI학습 이용 금지 >

더벨 서비스 문의

02-724-4102

유료 서비스 안내
주)더벨 주소서울시 종로구 청계천로 41 영풍빌딩 4층, 5층, 6층대표/발행인성화용 편집인김용관 등록번호서울아00483
등록년월일2007.12.27 / 제호 : 더벨(thebell) 발행년월일2007.12.30청소년보호관리책임자황철
문의TEL : 02-724-4100 / FAX : 02-724-4109서비스 문의 및 PC 초기화TEL : 02-724-4102기술 및 장애문의TEL : 02-724-4159

더벨의 모든 기사(콘텐트)는 저작권법의 보호를 받으며, 무단 전재 및 복사와 배포 등을 금지합니다.

copyright ⓒ thebell all rights reserved.