들어가며
생성형 AI 시대가 시작되면서 기업들이 앞다퉈 AI 도입에 나서고 있다. 하지만 실제로 성공하는 기업은 극소수에 그친다. MIT 보고서The GenAI Divide: State of AI in Business 2025에 의하면 AI를 도입한 기업 중 95%가 기대에 미치지 못한다. 이는 단순히 기술 적용의 실패가 아니라, 데이터 준비 상태(Data Readiness) 같은 핵심 성공 요소를 충분히 고려하지 않고 기술 자체에만 집중한 탓이다.
AI는 혁신적인 도구이긴 하지만, 무작정 도입하면 기업의 시간, 비용, 인력 자원을 낭비하는 지름길이 될 수 있다. 따라서 AI 도입 전에 ‘어떻게’ 적용할지를 철저히 고민하는 것이 필수적이다. 본 보고서는 실패의 핵심 원인을 살펴보고, ‘AI-Ready 데이터 플랫폼’을 통해 실질적인 성과를 달성할 수 있는 해법을 제시한다.
기업 AI 도입 프로젝트가 실패하는 이유
1. Private 데이터와 도메인 지식이 부족한 AI
Gartner 조사에서 AI 리더들은 AI 프로젝트가 실패하는 이유에 대해 공통적으로 “데이터 가용성 및 품질 문제2024 Gartner AI Mandates for the Enterprise Survey”를 꼽았다. AI가 활용할 수 있도록 준비된 데이터, AI-Ready 데이터가 부족하다는 것이다. 기업 측면에서 AI-Ready 데이터는 기업의 전반 활동에 필요한 기업 내 Private 데이터이다. 대부분은 이러한 기업 내부 데이터 또는 특정 산업의 전문 도메인 데이터와 AI의 연결이 부족한 상태이다. 따라서 기업 내 실무진들이 AI를 제대로 활용할 수 없다.
그렇다면 왜 기업의 Private 데이터가 부족할까? 대부분의 기업 내부 데이터는 정형 데이터로 이루어져 있다. 예를 들어 금융권의 경우, 계약서, 보고서, 이메일, 상담 기록과 같은 비정형 데이터(문서, 텍스트, 이미지, 오디오 등)은 20%만 차지하는 반면, 고객/상품정보, 거래내역, 경영 정보와 같은 정형 데이터(RDB, 테이블, CSV/Excel)는 80%를 차지한다. 그러나 지금까지는 이렇게 많은 부분을 차지하는 정형 데이터를 AI에 연결하는 것이 기술적으로 어려웠다. 정형 데이터는 정규화된 데이터로서 여러 테이블들의 복잡한 조인 관계로 구성되어 있다. 또한 LLM이 이해할 수 있는 맥락 정보나 데이터 관계 정보를 포함하고 있지 않아 데이터의 출처, 생성과정을 LLM이 이해할 수 없다는 특징이 있다. 이러한 데이터는 실무자들의 경험 데이터나 암묵적 지식에 의존하기 때문에 컬럼 명이나 코드 값을 AI Agent가 스스로 해석하는 것이 불가하다. 이러한 제약으로 정형 데이터 조회가 어려워 기업의 실무 환경에 필요한 분석에 한계가 있다.

2. 비즈니스 활용에 적절하지 않은 Public AI
Public LLM은 범용 AI 모델로, 학술 연구나 다방면의 범용 데이터 분석에는 유용하다. 그러나 도메인 지식이 부족하기 때문에 특정 산업 또는 기업 데이터 분석에는 한계가 있다. 무엇보다 외부로 기업의 민감 데이터가 유출될 수 있다는 우려가 크다. 이러한 이유로 기업이 AI의 분석 정확도를 높여 제대로 활용하기 위해서는 온프레미스 기반 LLM을 도입해야 한다. 외부와 분리된 안전한 환경이 갖추어져야 비로소 기업의 Private 데이터를 AI와 연결할 수 있고, 연결된 정확한 데이터를 기반으로 AI가 정확한 답변을 생성할 수 있기 때문이다.

3. 분산된 레거시 데이터의 AI 활용 한계
레거시 데이터는 AI가 요구하는 대용량 분석과 통합 처리가 어렵다. 대용량 데이터 분석 시 성능 병목 현상으로 처리 처리 속도가 매우 저하되기 때문이다. 또한 각 데이터들이 사일로화 되어 있고 일관성이 없는 형태이기 때문에 통합 분석 자체가 구조적으로 힘들다. 따라서 기업이 이러한 분산 레거시 데이터를 활용하려면 고성능 데이터 처리 인프라와 체계적인 통합 플랫폼이 필요하다.
S-Core의 솔루션: AI-Ready 데이터 플랫폼, ‘AI-DIVE’
AI-DIVE 솔루션 개요
AI-DIVE는 AI가 기업 데이터를 활용해 정확한 분석을 수행할 수 있도록 기업 데이터와 AI를 연결할 수 있는 일련의 환경을 제공한다. 먼저, 1) 기업 내부의 On-Premise 환경을 제공하여 완전한 데이터 통제권을 확보한다. 그리고 2) Enterprise Knowledge Base를 구축하여 기업의 Private 데이터를 AI가 활용 가능한 정제된 데이터셋을 확보하고, 이를 도메인 분석에 활용한다. 여기에 데이터의 일관성, 인증/접근 및 보안, 추적성 등 데이터 품질과 안전 관리를 위한 3) 거버넌스 기능을 함께 제공한다. 또한 정형·비정형 데이터를 적재하고 데이터 마트를 구축하여 AI가 필요한 데이터를 체계적·효율적으로 통합 및 활용할 수 있도록 4) Analytical Data Warehouse를 구축한다.
AI-DIVE 주요 기능

[1] Retrieval Agent – #정형·비정형 데이터 연결
Retrieval Agent는 AI와 Enterprise Knowledge Base를 연결하여 최적의 답변을 생성한다. 특히 AI가 Vector 검색만으로는 이해하기 어려운 정형 데이터를 Graph 검색까지 가능한 하이브리드 검색을 사용하여 AI가 활용할 수 있는 형태로 처리 및 연결한다. 이로써 기업 지식 자산의 많은 부분을 차지하는 고객정보, 거래내역, 경영정보 등 도메인 데이터까지 활용하여 다양한 비즈니스 시나리오를 실현할 수 있다.
[1-1] Enterprise Knowledge Base 구축 – #정확한 답변
지식 그래프와 벡터 검색을 기반으로 AI가 이해하지 못하는 데이터들의 관계 및 맥락 정보를 제공하여 Enterprise Knowledge Base를 구축한다. 이 지식 기반을 통해 AI Agent가 정형 데이터까지 분석하여 최적의 답변을 제공할 수 있다.

또한 AI-DIVE는 Enterprise Knowledge Base 구축을 위해 다음 세 단계의 과정을 거쳐 정형 데이터를 구조화한다.
[1-1-1] AI 데이터 마트 구축 – #정형 데이터 구조화 1단계
먼저 데이터 마트를 구축하여 다음과 같이 다차원으로 정형 데이터 정보를 증강한다. 네이밍, 스키마 구조, 시간 차원 등 RDB 데이터에는 존재하지 않지만 AI가 조회하기 위해서는 필수적인 추가 정보를 부여한다.

[1-1-2] 지식 그래프 기반 정보 증강 – #정형 데이터 구조화 2단계
데이터 마트 뿐 아니라 지식 그래프를 기반으로 데이터의 관계 및 문맥 정보를 증강한다. 의미 유사성 기반으로 데이터를 검색하는 Vector 검색만으로는 정확한 분석이 어렵다. 유사하지 않은 데이터 간 조회가 어렵기 때문이다. 이를 보완해주는 기술이 지식 그래프 검색이다. 이 검색을 함께 사용하면 명시되지 않은 데이터들 간의 숨겨진 관계까지 AI가 자동으로 분석하다. 그래프 검색은 그동안 어려웠던 기업 도메인 지식을 활용한 정확한 데이터 조회 및 분석을 가능하게 해주는 핵심 기술이다.

[1-1-3] 지능형 SQL 생성 – #정형 데이터 구조화 3단계
정형 데이터의 구조화만큼이나 중요한 것이 자연어 질의를 SQL로 변환하는 것이다. 사용자의 의도를 정확히 파악하여 데이터베이스의 스키마와 일치하는 쿼리로 변환하는 것은 매우 복잡하다. 따라서, 다양한 변환 전략을 유연하게 적용할 수 있는 체계적인 접근이 필요하다. AI-DIVE의 Retrieval Agent는 다음의 3가지 쿼리 변환 방법을 상황에 맞게 선택하여 지능적으로 최적의 쿼리를 생성한다.

① Static SQL – #미리 정의된 고정 쿼리
자주 사용하거나 예견할 수 있는 질의일 경우, MCP를 기반으로 미리 정의된 고정 쿼리를 생성한다. 미리 정의된 쿼리인 만큼 빠른 쿼리 생성 및 데이터 조회가 가능하다.
② Skeleton SQL – #템플릿 기반 쿼리
고정 쿼리에 비해 유동적인 처리가 필요한 질의일 경우, 템플릿 쿼리를 사용하되 슬롯을 생성하여 동적 SQL을 생성한다. 다양한 조건을 유연하게 처리하면서도 템플릿을 사용하여 안정적인 쿼리 생성이 가능하다.
③ Text2SQL – #완전 자연어 변환 쿼리
복잡한 자연어 질의일 경우, 자연어를 SQL 쿼리로 변환한다. Static SQL이나 Skeleton SQL보다는 다소 시간이 소요되나 복잡한 데이터 분석에 최적화된 방법이다.
[1-2] Data Governance

AI-DIVE는 데이터의 보안과 거버넌스를 위한 기능도 제공한다. 기업 자산의 안전한 활용을 위하여 기업 내부의 On-Premise 환경을 기반으로 암호화, 접근제어, 감사·추적 등 데이터 보안 기능을 제공한다. 데이터 카탈로그는 기업 데이터에 메타데이터를 부여하여 체계적으로 자산화 및 관리할 수 있다. 데이터 리니지는 데이터의 출처와 흐름을 명확히 추적해 투명성과 책임성을 확보하며 규정 준수 및 감사를 수행한다. 또한 데이터 변환 및 사용 이력을 관리함으로써 오류 탐지, 품질 관리, 보안 위험 완화를 수행한다. 이를 통해 데이터 거버넌스 정책의 이행을 체계적으로 보장하여 데이터 신뢰성을 높일 수 있다.
[2] Analytical Data Warehouse 구축
AI-DIVE는 분산된 레거시 데이터를 통합하고 빠른 종합 분석이 가능하도록 고성능 데이터 통합 도구인 Analytical Data Warehouse를 구축한다. 사일로화된 레거시 데이터는 AI가 이해하기 어려운 복잡한 구조를 가지고 있으며, 일관성이 부족하기 때문에 통합 분석에 어려움이 있다. 이를 해결하는 것이 ADW로, 플랫 테이블, 사전 집계, 차원 모델링 등을 통하여 AI가 선호하는 일관되고 단순한 구조의 데이터를 제공한다. 또한 대규모 병렬 처리(Massively Parallel Processing)로 대용량 데이터의 고성능 분석에 유리하다. 데이터 패브릭을 통해서는 On-Premise, 멀티 클라우드, 이기동 DB 등 여러 데이터 소스로부터 데이터의 이동이나 복제 없이도 접근할 수 있도록 쿼리 가상화 기반 단일 View를 제공하여 데이터 접근성 및 분석 효율을 크게 개선한다.

비즈니스 적용 예시
앞서 살펴본 기능을 갖춘 AI-DIVE를 도입하면 무궁무진한 비즈니스 활용 시나리오를 발굴할 수 있다. 그 동안 활용할 수 없었던 기업 Private 데이터를 자연어 질문만으로 분석 및 조회할 수 있다. 대표적인 비즈니스 적용 예시는 다음과 같다.
경영 의사결정 프로세스의 혁신
기존에는 경영 의사결정을 위한 데이터 분석을 위해서는 여러 담당 부서 및 IT 부서의 업무 협의 과정을 거쳐야만 결과를 알 수 있었다. 그러나 AI-DIVE를 도입하면 기업의 비정형 데이터 뿐 아니라 정형 데이터까지 온전한 기업 데이터 조회가 가능하므로, 자연어 질의만으로 경영 의사결정이 가능해진다.

AI 컨택센터
고객 및 기업의 통합 데이터를 기반으로 AI가 고객의 문의에 정확한 답변을 제공할 수 있는 AICC(AI 컨택센터)를 구축할 수 있다. 이로써 24/7 실시간 응답이 가능하며 일관된 고품질 상담 서비스를 제공할 수 있다.
금융권 초개인화 서비스 제공
기존에는 제한적인 금융 상품 상담만 가능했다면, 개인 데이터를 분석하여 예금·대출·투자 등 맞춤 금융 상품 추천을 제공할 수 있다. 또한 AI 기반 종합 자산관리 서비스나 개인별 최적의 금융솔루션 제공도 가능해진다.
금융권 업무 처리 지능화 및 판매 채널 자동화
그동안 계약서, 청구서류 등 수동으로 처리했던 비정형 문서 처리 업무를 AI가 자동으로 처리할 수 있다. 이로써 업무 처리 시간을 단축하고 휴먼 에러를 최소화하여 업무 처리의 정확성과 효율성을 혁신할 수 있다.
한편 이러한 예시들은 AI-DIVE가 창출할 수 있는 비즈니스 가치의 일부에 불과하다. 각 기업과 산업이 보유한 다양한 도메인 지식을 AI와 연하게 되면, 그동안 상상하지 못했던 새로운 비즈니스 시나리오들이 현실화될 수 있기 때문이다. 예를 들어, 제조업에서는 생산 데이터와 품질 데이터를 통합 분석하여 불량률을 예측할 수 있고, 유통업에서는 재고와 판매 데이터를 실시간으로 분석하여 최적의 수/발주 전략을 수립할 수 있다. 의료 분야에서는 환자 데이터와 임상 데이터를 연계하여 맞춤형 치료 방안을 제시하고, 공공 부문에서는 민원 데이터와 정책 데이터를 통합하여 데이터 기반 정책 수립이 가능해진다. 이 밖에도 각 산업과 기업의 고유한 데이터와 비즈니스 특성에 따라, AI-DIVE가 열어줄 혁신의 가능성은 무궁무진하다. 중요한 것은 기업이 자신만의 데이터 자산을 얼마나 잘 이해하고, 이를 AI와 어떻게 연결하는가에 달려 있다.
마치며
지금까지 살펴본 바와 같이, AI 도입 실패의 핵심은 기술 자체가 아닌 ‘데이터 준비 상태(Data Readiness)’에 있었다. 특히 기업 자산의 80% 이상을 차지하는 정형 데이터를 AI가 활용할 수 없다는 점은 그동안 기업 AI 도입의 가장 큰 걸림돌이었다.
S-Core의 AI-DIVE는 이러한 근본적 문제에 대한 실질적인 해답을 제시한다. Vector와 Graph 검색을 결합한 하이브리드 검색 기술로 정형·비정형 데이터를 모두 AI가 이해할 수 있는 형태로 연결하고, Enterprise Knowledge Base를 통해 기업의 도메인 지식을 AI에 주입한다. 또한 데이터 거버넌스와 온프레미스 환경으로 데이터 보안 우려를 해소하면서도, Analytical Data Warehouse로 분산된 레거시 시스템의 한계를 극복한다.
AI 시대의 진정한 승자는 가장 먼저 AI를 도입하는 기업이 아니라, 가장 ‘제대로’ AI를 활용하는 기업이 될 것이다. 그리고 그 시작은 AI-Ready 데이터 플랫폼 구축에서 시작할 수 있다. 지금이야말로 기업이 데이터 인프라를 재점검하고, AI와 데이터의 진정한 연결을 실현해야 할 때다.
# References
- 매사추세츠공과대(MIT) 산하 NANDA 이니셔티브 - 「생성형 AI의 격차: 2025년 기업 내 AI 현황(The GenAI Divide: State of AI in Business 2025)」
- Gartner, 2024 Gartner AI Mandates for the Enterprise Survey
- PR Newswire, New Study Reveals Major Gap Between Enterprise AI Adoption and Security Readiness
이지원 프로
소프트웨어사업부 솔루션사업팀
에스코어에서 UX/UI 최적화 및 기획 업무를 담당하고 있습니다.
Register for Download Contents
- 이메일 주소를 제출해 주시면 콘텐츠를 다운로드 받을 수 있으며, 자동으로 뉴스레터 신청 서비스에 가입됩니다.
개인정보 수닙 및 활용에 동의하지 않으실 경우 콘텐츠 다운로드 서비스가 제한될 수 있습니다.
파일 다운로드가 되지 않을 경우 s-core@samsung.com으로 문의 주십시오.



