솔루션

빅데이터

최고의 제품을 위하여, 최선을 다하여 만들고, 점검을 거듭합니다.

고객의 보안을 책임지며 성장해 나갈 것입니다.
개요
지금까지 분석하지 못 했던 데이터를 공개 기술을 통해(OpenSource) 실시간으로(Realtime) 낮은 비용을 들여(Low cost) 누구나 쉽게 분석 할 수 있게 하는 것(Easy)
배경
기존 소셜 네트워크 서비스로 대표되는 소셜 미디어의 성장과 최근 스마트 폰으로 대변되는 모바일 장치의 확산이 결합되어 일상 속에서 다양한 종류의 대규모 데이터가 급속히 생성, 유통, 저장되고
있다. 또한 RFID와 같이 정보를 감지하는 센서 장비의 이용 확대와 이러한 정보를 수집하는 클라우드 컴퓨팅 기술의 확산은 물류의 이동 및 재고의 변화뿐만이 아닌 개별 소비자들의 개인정보 및
소비행태와 같은 모든 일상에 대한 디지털 기록을 가능케 하고 있다. 기업 및 사회는 이러한 수집된 데이터를 기반으로 예측 분석을 하기 위하여 다양한 종류의 대규모 데이터 처리,
분석 및 활용 기술을 필요로 하고 있다. 대량의 다양한 데이터 생산 기술의 진보와 이에 필요한 터 저장, 관리, 분석 기술의 발전 속에서 빅데이터가 출현하게 된다.
빅데이터(big data)란
기존 데이터베이스 관리도구로 데이터를 수집, 저장, 관리, 분석할 수 있는 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을
의미한다. 다양한 종류의 대규모 데이터에 대한 생성, 수집, 분석, 표현을 그 특징으로 하는 빅데이터 기술의 발전은 다변화된 현대 사회를 더욱 정확하게 예측하여 효율적으로 작동케 하고 개인화된
현대 사회 구성원 마다 맞춤형 정보를 제공, 관리, 분석 가능케 하며 과거에는 불가능했던 기술을 실현시키기도 한다.
기존 빅데이터의 개념은 단순히 데이터의 양이 많은 것을 의미했다면 최근의 일반적인 빅데이터의 개념은 기존 데이터에 비해 너무 방대해 일반적으로 사용하는 방법이나 도구로 수집, 저장, 검색,
분석, 시각화 등을 하기 어려운 정형 또는 비정형 데이터 집합을 의미한다. 빅데이터의 정의에 합의된 바는 없지만 맥 킨지와 IDC는 데이터베이스의 규모와 업무수행에 초점을 맞춰 빅데이터를
다음과 같이 정의하였다.
  • 1데이터베이스의 규모에 초점을 맞춘 정의 (McKinsey, 2011)
  • 일반적인 데이터베이스 SW가 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터
  • 2데이터베이스가 아닌 업무수행에 초점을 맞춘 정의 (IDC, 2011)
  • 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 (데이터의) 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처
  • 3지원기술(Hadoop)
  • HDFS, MapReduce, Sqoop, Hive, Pig, ZooKeeper
  • 4지원기술(NoSQL)
  • Hbase, MongoDB, Cassandra, CouchDB, Redis