스노우 플레이크Snowflake의 데이터 클라우드란?

    데이터 클라우드 기업, Snowflake

     

     

    이번 달에 뉴욕 증권거래소에 IPO(상장)을 준비하고 있는 Snowflake는 최근 워런 버핏과 버크셔 헤서웨이, Salesforce의 투자를 받으며 상장 시 미국 증시에 '유니콘'이 될 것이라고 기대를 모으고 있다.

     

    IT 기업이라 애플이나 마이크로소프트처럼 기술주에 해당하겠지만, 구체적으로 데이터 클라우드가 무엇인지 감이 잡히지 않아 여러 가지 자료를 찾아보게 되었다.

    그중, Snowflake의 서비스에 대해 가장 명료하게 설명하고 있는 CEO의 영상을 발견해 내용을 공유해본다.

     

    (사진 클릭시 유튜브 영상으로 이동합니다.)

     

    신개념 데이터 클라우드 IT기업, Snowflake

    CEO: Frank Slootman

    설립일: 2012, 캘리포니아

    기업가치: $12.4B(원화로는 약 12조 이상)
    이용 기업 수: 4000개(계정 수 기준)
    이용 기업 종류: Software, Media, Healthcare, Public, Education 등등
    일일 처리 작업량: 450 million(4억 5천만 건)
    활성화된 이용자 계정: 월 100K(10만 이용자)

     

    데이터 클라우드(DATA CLOUDS)란?

    흔히 알고 있는 클라우드의 종류는 크게 두 가지로 나뉜다. 

    Infrastructure Clouds: 대표적으로 아마존, 구글, 마이크로소프트에 의해 운영되는 데이터 센터 클라우드
    Application Clouds: 애플리케이션과 스크립션 모델 등의 소프트웨어를 제공하는 클라우드. SAP나 Salesforce가 제공하는 형태가 애플리케이션 클라우드.

    위의 인프라스트럭쳐나 애플리케이션 클라우드 같은 전통적인 클라우드 기업들은 수직적인 데이터 베이스를 제공하기 때문에, 기존에 있는 자료를 다른 이용자가 사용하기가 어려웠다. 그 외에도 한계점이 있는데, 가장 큰 문제점은 데이터들이 한 장소가 아닌 제각각 다른 저장소에 보관된다는 것이다. 이로 인한 문제 점은 다음과 같다.

    - 지리적으로 떨어진 지점이 있을 경우, 즉각적인 연결이 안 됨
    - 다른 저장소에 보관된 데이터는 보안에 취약 
    - 데이터를 여러 저장소에 보관하면서 필요하지 않은 부분까지 비용을 부담하게 됨
    - 과도한 비용을 줄이기 위해 가공되지 않은 데이터가 저장되는 곳을 이용(Data Lake)하게 되는데, 이 경우 데이터를 수집하는데 추가 비용과 시간이 소요됨

     

    요약하자면, 고전적인 클라우드 방식은 이용자마다 데이터를 별개의 저장소(Silos)에 보관하여, 데이터 이용의 효율성을 저하시키고 시간과 비용 부담을 가중시켰다.

     

    이런 문제점을 해결하고자 Snowflake가 신개념의 데이터 클라우드(Data Clouds) 플랫폼을 제공하고 있다.

     

     

    그럼 Snowflake가 제공하는 Data Clouds란 무엇일까?

    Snowflake는 데이터 클라우드 그 자체의 플랫폼으로, 데이터 클라우드를 구성하는 것은 데이터 그 자체이지 별도의 저장소가 존재하지 않는다.(기업명이 플랫폼 이름이자 데이터 이름인 것)

     

    영상에서는 Snowflake 플랫폼에 저장된 데이터 자체를 Snowflake라고 표현하는데, 이 데이터들은 말 그대로 눈송이처럼 공간에 자유롭게 떠다닐 수 있고 특정 공간(저장소, Silos)에 국한되지 않는다.
    따라서 서로 다른 이용자들끼리 Snowflake(데이터)를 자유롭게 주고받을 수 있다. 자신의 데이터 접근 권한을 부여함으로써 상대방이 나의 데이터에 새로운 데이터를 추가할 수도, 가져갈 수도 있는 것이다.
    한마디로 '폴더' 같은 저장소 개념이 아닌, 데이터 그 자체의 자유로운 공유가 가능해지는 것이다.

     

     

    이게 왜 특별할까?

    다수의 이용자끼리 데이터 자체를 공유할 수 있게 된다는 게 어떤 의미일까. 폴더 접근 권한이 아닌 데이터 자체에 접근이 가능해지면, 이용자들 간에 불필요한 동일 데이터를 복제할 필요가 없다. 쉽게 말해, 사내 공유폴더에 있는 파일을 이용하기 위해 개개인의 컴퓨터에 똑같은 파일을 다운로드할 필요가 없는 것이다.
    데이터의 오리지널 이용자가 허용하는 권한만큼만 이용할 수 있고, 이 덕분에 이터는 항상 up-to-date로 유지될 수 있다. 또한, 데이터 이용자의 소재와 권한이 분명해지므로, 데이터 제공자와 수신자 사이에 생길 생길 수 있는 갈등을 미연에 방지할 수 있다.

    그리고 별도의 저장소(Silos)가 아닌 데이터 자체를 가상의 공간에서 이용할 수 있다는 건, 국적이나 장소에 상관없이 누구나 동일한 데이터를 이용할 수 있다는 뜻이다. 글로벌 기업이라면, 인터넷이 빠른 한국에서 운영하는 지사와 캐나다 시골 마을에서 운영하는 지사가 각각 갖게 되는 정보의 한계를 없앨 수 있다는 것이다. 데이터 접근 권한만 있다면, 어디에 있는 누구든 이용할 수 있다. 

     

    이렇게 Snowflake 이용자들의 데이터 교환이 이뤄지면, 그 네트워크를 이용해 비즈니스 데이터 활용 수준을 높일 수 있다. 비즈니스 운영자의 입장에서 보면, 세계 어느 곳의 sales 자료가 보고 싶어도 up to date로 확인할 수 있다. 별도로 자료를 요청하고, 승인한 뒤 자료를 다운로드하거나 복제할 필요가 없어진다. 최신 정보를 그대로 이용할 수 있기 때문이다.

    뿐만 아니라 Snowflake 플랫폼 데이터 마켓 플레이스에서는 WEATHER SOURCE와 같은 다양한 데이터 서비스를 제공하는 기업들이 있다.

    * WEATHER SOURC란?
    Snowflake와 제휴하고 있는 기후분석 데이터를 제공하는 기업. 날씨와 Covid19 사건의 연관성에 대한 데이터를 분석해 바이러스와 날씨의 상관관계를 분석해, 미래의 바이러스를 예방하고 대처할 수 있도록 데이터 서비스를 제공한다.

     

    Snowflake 이용자들은 이런 서비스를 각 계정의 internal 데이터와 결합하여 이용할 수 있다. 
    단순히 Raw Data를 쌓아두거나 저장만 하는 클라우드가 아니라, 정말 가상공간에서 자유롭게 결합하며 새로운 데이터를 생성해 Operation, Sales, Supply chain에 도움이 되는 서비스를 제공하는 것. 이 것이 Snowflake이 가진 사업 모델이라고 볼 수 있다.

     


     

    CEO Frank Slootman은 데이터 클라우드 플랫폼을 더욱 공격적으로 개발하여 이용자들이 데이터 클라우드를 더 쉽게 이용할 수 있도록 하는 것이 Snowflake 역할이라고 말한다. 워런 버핏의 이례적인 투자로 주목을 받고 있는 IT 기업이기에 관심을 가지고 찾아보았다.

     

    처음엔 나의 이해를 돕기 위해 정리하기 시작한 기업분석이었는데, 어느새 Snowflake를 찬양하는 듯한 뉘앙스의 포스팅이 되었다. 사실 그만큼 클라우드 기업에 관심이 많아졌기 때문이기도 하다. 주식을 공부할수록 시대가 변해감을 피부로 느끼고 있다. 모든 분야에서 전통적인 방식의 기업들은 자연스럽게 퇴출되고, 미래 4차 산업을 이끌어갈 기업들이 급부상하고 있다.

    그중 하나인 IT기업 Snowflake가 상장 후 얼마나 빨리 성장할지 기대가 된다.

     

    -


    LET IT SNOW!


     

    2020/09/10 - [주식, ETF 투자 정보/주식, ETF & 기업분석] - 워렌버핏이 투자한 기업, Snowflake는 어떤 회사인가?

     

    댓글

    Designed by JB FACTORY