들어가며
오늘날 우리는 AI가 비즈니스의 본질을 바꾸는 전환점에 서 있다. 데이터는 AI의 원료이며, 이 데이터를 얼마나 빠르고 정확하게 수집·분석·활용할 수 있는지가 기업의 경쟁력을 좌우한다. 특히 디지털 트랜스포메이션(DT)과 데이터 중심의 의사결정이 일상화된 환경에서는, 방대한 데이터를 실시간으로 탐색하고 인사이트를 도출할 수 있는 기술적 기반이 필수이다.
이러한 배경 속에서 오픈소스 소프트웨어(Open Source Software)는 데이터 플랫폼 구축의 효율성과 유연성을 동시에 확보할 수 있는 강력한 대안으로 많은 기업들이 도입을 고려하고 있다. 그 중에서도 Elastic(엘라스틱)은 로그 및 이벤트 데이터 분석, 검색, 모니터링, 보안 등 다양한 분야에서 실시간 데이터 처리와 분석에 특화된 오픈소스 솔루션으로, 전 세계 수많은 기업과 기관이 선택하고 있다.
본 리포트에서는 Elastic의 다양한 라이선스 특징과 그 차이를 소개하고 AI 시대에 데이터 경쟁력을 확보하기 위한 전략으로서 엘라스틱 엔터프라이즈 버전이 어떤 비즈니스적 가치를 제공하는지 알아보겠다.
Elastic 라이선스 정책의 주요 변화와 배경
Elasticsearch는 2010년 오픈소스 검색 엔진으로 처음 등장한 이후, 빠른 속도로 성장하며 다양한 산업 분야에서 핵심적인 데이터 분석 플랫폼으로 자리매김하였다. 초기에는 Apache 2.0 단일 라이선스를 채택하여 자유로운 사용과 배포를 보장했지만, 시간이 흐르면서 상업적인 기능 확장과 클라우드 사업자들의 무분별한 사용을 방지하기 위한 움직임으로 라이선스 정책에 중요한 변화를 겪게 되었다. 특히 Elastic은 자사의 Elasticsearch 제품을 서비스 형태로 제공하며 상업적 이익을 얻고 있는 AWS를 주요 타겟으로 라이선스 정책을 변경해 왔다. 이러한 변화는 Elastic의 사업 모델 발전과 함께, 오픈소스 생태계 내에서 자사의 혁신적인 기술과 상표권을 보호하려는 노력의 일환으로 해석될 수 있다.
Elastic은 Elasticsearch의 비즈니스 모델 변화에 따라 라이선스 정책을 지속적으로 조정해왔다. 7.10 버전까지는 소스 코드 레벨에서 Apache 2.0 단일 라이선스를 적용하여 오픈소스 생태계에 기여하였다. 하지만 이후, AWS가 Elasticsearch 제품을 서비스 형태로 제공하면서 Elastic과의 협력 없이 상업적인 이익을 취하는 상황이 발생하자, Elastic은 상표권을 보호하기 위해 7.11 버전부터 8.15 버전까지는 SSPL 1.0 또는 Elastic License 2.0의 듀얼 라이선스 체제로 변경했다. Elastic의 CEO인 Shay Banon은 이러한 라이선스 변경은 Elastic의 제품을 가져다 서비스 형태로 직접 제공하는 회사를 방지하기 위해서라고 명확히 밝혔다. 이는 Elastic이 자체 개발한 상업적 기능에 대한 통제력을 강화하고, AWS와 같은 클라우드 사업자들의 무분별한 사용을 방지하기 위한 조치였다. AWS는 이에 대응하여 Apache 2.0 라이선스 기반의 Elasticsearch와 Kibana 포크 버전인 Open Distro for Elasticsearch를 출시하며 오픈소스 생태계를 지지하는 입장을 표명했다.
이후, AWS가 자체 포크 제품에 투자를 본격화하면서 시장 혼란이 대부분 해소되었고, Elastic은 8.16 버전부터 OSI 승인 라이선스인 AGPL v3를 추가하여 현재까지 AGPL v3, SSPL v1.0, Elastic License 2.0의 트리플 라이선스 체제를 채택하고 있다. 이는 Elastic이 오픈소스 영역을 확장하고 사용자에게 폭넓은 유연성을 제공하고자 하는 의지를 보여주는 동시에, 여전히 상업적인 통제력을 유지하려는 전략으로 풀이된다.
한편, Elasticsearch 바이너리 배포판은 7.11 버전부터 Elastic License 2.0을 적용하고 있으며, Apache 2.0 기반의 OSS 바이너리 배포판은 7.10 버전을 마지막으로 제공이 중단되었다. 이처럼 과거의 OSS 바이너리 배포판은 현재 모두 End Of Support(EOS) 상태이며, 대표적으로 Log4j 취약점 사태에서 드러났듯이 심각한 보안 리스크를 내포할 수 있으므로 사용자들은 EOS 되지 않은 최신 버전을 사용하는 것이 안전하다.
Elastic 라이선스는 Apache 2.0, SSPL 1.0, AGPL 3.0, Elastic License 2.0로 구분되며, Elastic License 2.0 하위에는 Basic, Platinum, Enterprise 라이선스 티어가 존재한다.
Basic 라이선스는 기본적인 검색 및 분석 기능을 제공하지만, Elastic License 2.0 약관에 따라 상업적인 용도로의 사용은 제한되며, 주로 연구/개발 목적으로 활용하는 것이 적합하다. 상업적인 목적으로 Elasticsearch를 사용하는 경우에는 상용 라이선스인 Platinum 또는 Enterprise 라이선스를 구독하거나 SSPL 1.0 또는 AGPL 3.0을 적용 해야 한다. 다만, SSPL 1.0과 AGPL 3.0은 소스 코드 공개 의무가 있으며, x-pack 부분을 직접 제거하고 빌드해야 하므로 핵심 기능 사용에 제약이 따른다.
Elastic 상용 라이선스 비교
Elastic의 상용 라이선스는 Platinum 라이선스와 Enterprise 라이선스로 구분된다. 두 라이선스 모두 다양한 고급 기능을 제공하지만, Enterprise 라이선스는 Platinum 대비 더욱 폭넓고 심화된 기능을 제공하며, 비용 측면에서도 뚜렷한 차이를 보인다.
Platinum 라이선스는 Basic 라이선스의 모든 기능을 포함하며, 보안, 모니터링, 알림, 그래프, 기본적인 머신러닝 기능 등 엔터프라이즈 환경에서 요구되는 다양한 고급 기능을 제공한다. Enterprise 라이선스는 Platinum 라이선스의 모든 기능을 포함하며, 독점적으로 제공되는 LogsDB 인덱스 모드와 Searchable Snapshot 기능이 있다. LogsDB 인덱스 모드는 데이터 저장 비용을 획기적으로 절감할 수 있으며, Searchable Snapshot은 콜드 데이터를 효율적으로 관리할 수 있도록 지원한다. 또한, Enterprise 라이선스는 고급 AI 기능도 포함하고 있다. 예를 들어, 하이브리드 검색 결과의 정확도를 높이는 RRF(Reciprocal Rank Fusion), Cohere 및 OpenAI와 같은 외부 머신러닝 모델을 Elasticsearch 내에서 연계·관리할 수 있는 Inference API, 검색 순위를 최적화하는 LTR(Learning to Rank) 기능 등을 통해 AI 기반의 정교한 검색 환경을 구축할 수 있다.
구독 비용 측면에서는 Enterprise 라이선스가 Platinum 라이선스 대비 약 1.8배 높은 비용이 발생한다. 그러나 데이터 저장 비용 절감 및 장기적인 서버 유지 관리 비용 등을 포함한 총 소유 비용(TCO) 관점에서 분석할 경우, Enterprise 라이선스는 충분히 전략적인 선택지가 될 수 있다. 다만, 구독 비용은 라이선스 종류 별 비용 산정 방식에 다소 차이가 있어, 서비스 환경에 따라 달라질 수 있으므로, 위 내용은 참고용으로만 보기 바란다.
이러한 점을 종합적으로 고려할 때, Enterprise 라이선스는 Platinum 라이선스에 비해 구독 비용은 높지만, 로그 데이터의 양이 방대하고 저장 비용 절감이 중요한 환경, 또는 고급 AI 기능을 활용해 데이터 분석 역량 및 검색 품질을 극대화하고자 하는 조직에게 Platinum 라이선스보다 더 현명한 선택이 될 수 있다.
실제로, 로그 데이터 규모가 크고 보관 기간이 길며 AI 기술 도입에 적극적인 국내 금융권을 중심으로 Enterprise 라이선스 도입이 지속적으로 증가하는 추세이다.
Elastic Enterprise 라이선스 핵심 기능: 저장 비용 절감과 AI 기반 검색 고도화
Elastic Enterprise 라이선스는 단순한 부가 기능을 넘어, 대규모 로그 및 시계열 데이터를 효과적으로 저장하고 검색하는 데 필요한 구조적 기술들을 포함하고 있다. 그 중심에는 LogsDB 인덱스 모드와 Searchable Snapshot, 그리고 AI 기반 검색 기능들이 있다. 이 기능들은 단일 기능으로도 강력하지만, 함께 활용될 때 데이터 수명주기 전체를 포괄하는 통합 전략을 가능하게 한다.
LogsDB 인덱스 모드: 대규모 로그 환경에 최적화된 저장 효율성 (ver. 8.17+)
LogsDB 인덱스 모드는 시계열 형태의 로그 데이터를 보다 효율적으로 저장하기 위해 설계된 기능으로, 기존 Elasticsearch의 row 기반 인덱싱 구조와는 다른 컬럼 기반 저장 방식을 채택한다. 여기에 Elastic이 자체 개발한 Smart Codec 기술과 고효율 압축·중복 제거 기법이 결합되어, 저장 공간을 획기적으로 절감할 수 있다.
Elastic 공식 자료에 따르면, 기존 방식 대비 최대 65%의 저장 공간 절감, 50%의 총 소유 비용(TCO) 절감 효과를 기대할 수 있다고 한다. 이러한 특성 덕분에, 장기간 대용량 로그를 보관해야 하는 기업에서 매우 높은 비용 효율성을 제공한다.
하지만, _source 필드를 저장하지 않고도 문서를 재구성할 수 있는 synthetic _source를 활용하기 때문에 저장 공간을 줄이는 데 효과적이지만, 데이터 조회 시 재조립 과정을 거쳐야 하므로 검색 성능이 약간 저하되는 특성이 있고, 데이터 색인 시 CPU 사용량을 약간 더 사용하기 때문에, 도입 시 신중한 고려가 필요하다.
Searchable Snapshot: 장기 보존 데이터의 비용 효율적 관리 (ver. 7.11+)
Searchable Snapshot은 접근 빈도가 낮은 데이터를 경제적인 오브젝트 스토리지(예: Amazon S3)에 보관하면서도, 번거로운 복원 과정 없이 즉시 검색할 수 있도록 혁신적으로 설계된 기능이다. 기존 스냅샷 방식이 검색 전에 반드시 복원을 거쳐야 했던 것에 비해, Searchable Snapshot은 시간과 컴퓨팅 자원을 대폭 절약하여 데이터 관리 효율성을 극대화한다.
이러한 특징으로, Elastic 공식 자료에 따르면, 동일한 비용으로 최대 20배까지 더 많은 읽기 전용 데이터를 저장할 수 있어서, 규제 대응, 장기 보존, 감사를 위한 데이터 관리에 매우 효과적이다.
LogsDB 인덱스 모드와 Searchable Snapshot을 함께 활용하면 데이터의 생성부터 사용, 보관에 이르는 전체 수명주기를 매우 효율적으로 관리할 수 있다. 예를 들어, 활발히 사용되는 최신 데이터(Hot 티어)는 LogsDB 인덱스 모드로 저장하여 저장 공간 효율성을 극대화하고, 일정 기간 후 접근 빈도가 낮아진 데이터(Frozen 티어)는 Searchable Snapshot으로 전환하여 장기 보존하면서도 즉시 검색 가능한 상태를 유지할 수 있다.
또한, Elastic 공식자료에 따르면, Hot 티어와 Frozen 티어의 두 가지 티어로만 간결하게 아키텍처를 구성함으로써 기존의 복잡한 아키텍처 대비 TCO를 최대 77%까지 획기적으로 절감할 수 있었다. 다만, 이 TCO 절감 수치는 LogsDB 인덱스 모드가 활성화되지 않은 환경에서 측정된 결과이며, 라이선스 구독 비용은 제외된 수치이다. 따라서 실제 환경에서 TCO를 정확히 계산하려면 LogsDB 인덱스 모드 활성화와 라이선스 구독 비용을 모두 고려해야 한다.
결론적으로, 이 두 가지 강력한 기능을 함께 활용하는 것은 클러스터 운영의 복잡성을 줄여 안정성을 높이고, 자원 관리 효율성을 극대화하여 획기적인 데이터 저장 효율성을 가능하게 할 뿐만 아니라, 필요한 시점에는 언제든 데이터를 검색할 수 있는 유연한 구조를 제공할 수 있게 한다.
RRF (Ranked Results Fusion): 하이브리드 검색 정확도 향상 (ver. 8.16+)
RRF는 Vector 검색과 Lexical 검색의 결과를 결합하여 정확도를 높이는 알고리즘으로, 각각의 검색 결과 순위를 통합 순위로 변환함으로써, 개별 알고리즘에서는 놓치기 쉬운 관련성 높은 문서들을 상위에 노출시킬 수 있다. 이 방식은 특히 복합적인 검색 요구와 다양한 데이터 유형이 공존하는 엔터프라이즈 환경에서, 검색 품질을 획기적으로 향상시키는 데 기여한다.
Inference API: OpenAI, Cohere 등 외부 AI 모델 연동 (ver. 8.16+)
Inference API는 외부의 ML 모델을 Elasticsearch 클러스터 내에 배포하고, 저장 및 새로 수집되는 데이터에 해당 모델을 적용하는 기능으로, 별도 ML 플랫폼 없이도 이상 감지, 문서 분류, 감성 분석 등의 분석 작업을 실시간으로 처리할 수 있다. 이를 통해 로그 데이터에서 이상 징후 탐지, 리뷰 데이터의 감성 파악, 문서 자동 분류 등 다양한 응용이 가능하며, 이는 곧 운영 효율성과 비즈니스 민첩성을 크게 향상시킨다.
LTR (Learning to Rank): 검색 순위 최적화 (ver. 8.15+)
LTR(Learning to Rank)은 머신러닝 모델을 기반으로 사용자의 검색 행동 데이터(클릭, 구매 이력, 체류 시간 등)를 학습하여 검색 결과의 순위를 최적화하는 기능이다. 기존의 룰 기반 또는 통계 기반 순위 결정 방식과는 달리, LTR은 학습된 모델을 통해 검색어와 문서의 다양한 관련성 특징을 조합하여 각 문서의 최종 순위를 결정한다. 예를 들어, 같은 검색어라도 사용자마다 다른 검색 이력이나 선호도를 학습하여 개인화된 검색 경험을 제공함으로써, 검색 정확도와 사용자 만족도를 동시에 향상시킬 수 있다. LTR은 일반적으로 초기 검색 결과에 적용되는 2단계 재정렬 방식으로 작동한다.
마치며
Elasticsearch는 오픈소스로 시작했지만, 상업적 가치 확대와 클라우드 서비스 사업자들의 무분별한 사용을 방지하기 위한 전략적 판단에 따라 라이선스 정책을 지속적으로 변화시켜 왔다. 초기 Apache 2.0 단일 라이선스에서 듀얼, 나아가 트리플 라이선스 체제로의 전환은 Elastic의 사업 모델 발전과 함께, 오픈소스 생태계 내에서 자사의 혁신적인 기술과 상표권을 보호하려는 노력의 일환으로 해석될 수 있다.
이러한 변화는 상용 라이선스 중 최상위 등급인 Enterprise 라이선스의 고급 기능들로 구체화되고 있으며, [표-2]의 Elastic Platinum vs Enterprise 라이선스 비교에서도 확인할 수 있듯, 이는 단순한 기능 확장을 넘어 LogsDB 인덱스 모드와 Searchable Snapshot을 통한 저장 구조의 혁신, RRF, Inference API, LTR 등 첨단 AI 기술을 활용한 검색 성능 고도화 등을 포함하고 있다. 이는 운영 효율성과 데이터 활용 수준을 동시에 높이는 데 기여한다.
Enterprise 라이선스는 다른 상용 라이선스인 Platinum에 비해 구독 비용이 상대적으로 높은 편이지만, 그에 상응하는 고급 기능을 통한 장기적인 데이터 저장 비용 절감 효과, AI 기반 데이터 활용 가치의 극대화를 고려할 때 단순한 기능 업그레이드를 넘어서는 전략적 투자라 할 수 있다. 특히 대규모 데이터를 다루고 AI 기반 분석이나 검색 기능의 고도화를 추구하는 조직이라면, AI 시대의 데이터 경쟁력 높이기 위해 Enterprise 라이선스는 충분히 고려해볼 만한 선택지이다.
에스코어는 국내 최초의 Elastic MSP로서, 오픈소스 분야에서 최고의 전문성을 보유한 조직이다. Elastic Contributor를 포함한 숙련된 전담 인력이 1,500건 이상의 Elastic 컨설팅 및 기술 지원을 통해 깊이 있는 노하우를 축적하였고, Elastic 뿐 아니라 OS, DB, 미들웨어, k8s 이르기까지 전반적인 오픈소스 기술 스택을 아우르는 종합적인 지원 체계를 갖추고 있다. 이를 바탕으로, 고객 맞춤형 기술 조언과 차별화된 문제 해결, 정기 점검을 아우르는 원스톱 Carepack(케어팩) 서비스를 제공하고 있다.
# References
- https://www.elastic.co/pricing/faq/licensing
- https://www.elastic.co/support/eol
- https://www.elastic.co/subscriptions
- https://www.elastic.co/blog/why-license-change-aws
- https://www.elastic.co/blog/licensing-change
- https://www.elastic.co/blog/elasticsearch-is-open-source-again
- https://aws.amazon.com/ko/blogs/opensource/stepping-up-for-a-truly-open-source-elasticsearch/
- https://www.elastic.co/search-labs/blog/elasticsearch-logsdb-index-mode
- https://www.elastic.co/docs/reference/elasticsearch/mapping-reference/mapping-source-field#synthetic-source
- https://www.elastic.co/kr/blog/introducing-elasticsearch-searchable-snapshots
- https://www.elastic.co/kr/elasticsearch/elasticsearch-searchable-snapshots
- https://www.elastic.co/blog/elastic-data-tiering-strategy
- https://www.elastic.co/blog/whats-new-elastic-enterprise-search-8-9-0
- https://www.elastic.co/guide/en/elasticsearch/reference/8.18/rrf.html
- https://www.elastic.co/blog/whats-new-elastic-search-8-15-0
- https://www.elastic.co/docs/api/doc/elasticsearch/group/endpoint-inference
- https://www.elastic.co/search-labs/blog/elasticsearch-learning-to-rank-introduction

안상희 프로
오픈소스사업부 오픈소스서비스사업팀
삼성그룹 및 대외 고객들에게 Elastic Stack 기술지원 및 컨설팅 제공 전문가입니다. 삼성그룹의 오픈소스 기반 메일 검색, 금융권 Elastic 도입 등, 풍부한 Elastic 프로젝트 경험을 보유하고 있으며, 오픈소스 최적화, 컨설팅 분야에서 활동하고 있습니다.
-
다음 글다음 글이 없습니다.
Register for Download Contents
- 이메일 주소를 제출해 주시면 콘텐츠를 다운로드 받을 수 있으며, 자동으로 뉴스레터 신청 서비스에 가입됩니다.
- 뉴스레터 서비스 가입 거부 시 콘텐츠 다운로드 서비스가 제한될 수 있습니다.
- 파일 다운로드가 되지 않을 경우 s-core_mktg@samsung.com으로 문의해주십시오.