탐방 인터뷰

한국HP, 버티카 제품 소개 및 전략 발표


  • 김현동
    • 기사
    • 프린트하기
    • 크게
    • 작게

    입력 : 2011-06-17 09:53:13

     
    한국HP(대표 함기호, www.hp.co.kr)가 16일, 지난 2월 HP에 인수한 데이터웨어하우스 및 실시간 분석 플랫폼 업체인 버티카 시스템즈(Vertica Systems)의 플랫폼에 HP의 기술력을 더한 버티카 제품을 공개하고, 전략을 발표했다.

     

    Pure MPP 아키텍쳐와 컬럼(Column)방식의 DBMS를 결합시킨 데이터웨어하우스 어플라이언스인 버티카는 타사 제품과 다르게 동시 사용자가 증가할수록 성능을 발휘하며, 비정형(Ad Hoc) 쿼리의 효율적인 응답 속도를 제공하는 솔루션이다.

     

    버티카 제품에 대한 소개를 맡은 한국HP의 이창훈 부장은 동시 사용자 수가 증가하면 할수록 자원경합으로 인한 성능 저하가 발생하여 동시 사용자 수를 수 십 여명으로 제한하여 사용하던 기존의 폐쇄적 DW 환경이 비즈니스 인텔리전스(BI) 시장의 트렌드가 변화함에 따라 고객의 요구도 빠르게 개방형 DW 시장으로 변화하고 있다고 밝혔다. 그는 변화하는 IT 트렌드에 따라 대표적으로 대두된 요구사항을 아래와 같이 꼽았다.

     

    - 동시 사용자 수 증가에도 유지되는 강력한 성능
    - 비정형 쿼리(Ad Hoc)의 성능 보장
    - 증가하는 데이터 양을 수용할 수 있는 확장성 보장(고 압축률 지원)
    - 실시간 서비스(Real time service)를 위한 안정성 보장

     

    버티카 V2400 분석 시스템(Vertica V2400 Analytic System)의 대표적인 차별점은 아래와 같다.

     

    1. 용이한 사용 및 운용: 자체 최적화 및 사전 통합으로 구현 시간 단축. 산업 표준 하드웨어에 대한 코어 기준 라이센스 방식보다 우수한 운용 비용 절감 효과

     

    2. 컬럼 기반 저장 및 실행: 전통적인 Row based 저장 방식의 데이터베이스보다 최대 수십배까지 디스크 I/O를 줄여서쿼리 성능이 50~1,000배 향상 시키는 행 기반 저장 방식

     

    3. 용량 최적화: 유사한 데이터를 그룹화할 경우 응용되는 12가지 이상의 압축 방식. 데이터에 따라 HP 버티카 분석 시스템이 적합한 압축 방식의 적용으로 평균 90%에 이르는 압축률 구현. 인코딩된 형식에서 직접 쿼리 데이터의 처리를 통해 필요한 CPU 작업 최소화

     

    4. 클러스터링: 실시간 분석에서 비실용적인 로그 기반 복구 대신, 특정 노드에 오류가 발생한 경우 복제해둔 동일한 노드로 대체할 수 있도록 하는 행의 복제 가능. 새로운 하드웨어는 필요한 데이터를 확보하기 위해 나머지 클러스터에 쿼리를 전송하고 다른 노드에서 유실된 객체를 재건하고, 하드웨어를 손쉽게 추가함으로써 시스템을 무한한 확장 가능

     

    5. 지속적인 성능: 동시 로드 및 쿼리 처리로 실시간 확인이 가능 하고 업무 시간 이후에 별도로 데이터를 로드 할 필요 없음. 즉석 스키마 변경이 가능 하므로 다운타임 없이 행이나 프로젝션(projection)의 추가 가능. 노드가 시스템에 쿼리를 전송하여 자동으로 복구하므로 자동 데이터 복제, 장애 조치 및 복구와 같은 ’능동형’ 예비 기능을 통한 성능 개선

     

    이번에 공개된 HP버티카 제품은 1TB 이상의 데이터웨어하우스 프로젝트, 대량의 데이터를 지속적으로 처리해야 하는 기업, ‘실시간’이 필수 조건인 기업, ‘업무 시간 이후의 배치 로드’에 관심이 있는 기업(초고속 데이터 로드가 차별화 요소이며 동시 로드 및 쿼리 분석이 장점으로 작용)에 적합하다.

     

    이창훈 부장은 실제 운영환경과 유사한 환경을 만들어 성능 BMT를 수행, 경쟁사의 모든 경쟁 제품들을 뛰어넘는 성능을 보이며 수주한 해외 사례를 소개하며 타사 솔루션 대비 뛰어난 성능에 대한 자신감을 표출했다.

     

    또, 최근 계속해서 화두가 되고 있는 클라우드 컴퓨팅 환경 지원과 관련하여 현재 운영중인 Amazon EC2(Elastic Compute Cloud)와 같은 퍼블릭 클라우드 환경에서 Saas로 사용되는 BI확장을 대표적인 사례로 소개했다.

     

    이와 더불어 방대한 분산 데이터 환경에 존재하는 Un-Structured & Semi-Structured 데이터 처리를 위해 하둡(Hadoop)과 버티카를 결합시키고, 하둡의 MapReduce를 통해 비정형 데이터를 포함한 다차원 분석 데이터를 생성하며, 수백 노드(Node) 이상 확장성을 지원하기 위한 분산 데이터 처리는 완전한 궁합을 이루고 있다고 밝혔다. 이를 통해, 버티카 분석 시스템을 MPP Grid 환경에 최적화, 24x7 수준 가용성과 무한 확장 분석 환경 제공하는 Cloud ready BI solution을 제공할 수 있다고 설명했다.

     




    베타뉴스 김현동 (cinetique@naver.com)
    Copyrights ⓒ BetaNews.net