CS

[CS / TOPCIT] 빅데이터, NoSQL

따봉치치 2023. 5. 8. 18:31
728x90

빅데이터

일반적으로 기존 데이터베이스 관리도구인 데이터 수집, 저장, 분석하는 역량을 넘어서는 데이터, 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고, 데이터의 빠른 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처

 

  • 크기 (Volume)
  • 속도 (Velocity)
  • 다양성 (Variety)

1. 정형 데이터 : 고정된 필드에 저장되는 데이터

2. 반정형 데이터 : 고정된 필드에 저장되지는 않지만, XML이나 HTML처럼 메타데이터나 스키마 등을 포함하는 데이터

3. 비정형 데이터 : 고정된 필드에 저장되어 있지 않은 데이터

 

빅데이터의 저장/처리 기술

1. 분산파일시스템(DFS) : 대용량, 비정형 데이터를 분산 환경에 저장/처리하기 위한 파일시스템 아키텍처

2. MapReduce : 저렴한 머신을 이용하여 빅데이터를 병렬로 분산 처리하기 위한 프로그래밍 모델

 

NoSQL

기존의 관계형 데이터베이스의 한계를 벗어나 비정형, 초고용량 데이터 처리를 위해 쓰기속도에 중점을 둔 다수 서버에 데이터 복제 및 분산 저장 등 수평적 확장이 가능한 비-관계형 분산 데이터 저장소

 

NoSQL의 BASE 속성

  • Basically Available : 가용성을 중시
  • Soff - State : 노드의 상태는 외부에서 전송된 정보를 통해 결정
  • Eventually Consistent : 최적으로는 일관성이 있는 상태가 되는 성질
728x90