728x90
빅데이터
일반적으로 기존 데이터베이스 관리도구인 데이터 수집, 저장, 분석하는 역량을 넘어서는 데이터, 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고, 데이터의 빠른 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처
- 크기 (Volume)
- 속도 (Velocity)
- 다양성 (Variety)
1. 정형 데이터 : 고정된 필드에 저장되는 데이터
2. 반정형 데이터 : 고정된 필드에 저장되지는 않지만, XML이나 HTML처럼 메타데이터나 스키마 등을 포함하는 데이터
3. 비정형 데이터 : 고정된 필드에 저장되어 있지 않은 데이터
빅데이터의 저장/처리 기술
1. 분산파일시스템(DFS) : 대용량, 비정형 데이터를 분산 환경에 저장/처리하기 위한 파일시스템 아키텍처
2. MapReduce : 저렴한 머신을 이용하여 빅데이터를 병렬로 분산 처리하기 위한 프로그래밍 모델
NoSQL
기존의 관계형 데이터베이스의 한계를 벗어나 비정형, 초고용량 데이터 처리를 위해 쓰기속도에 중점을 둔 다수 서버에 데이터 복제 및 분산 저장 등 수평적 확장이 가능한 비-관계형 분산 데이터 저장소
NoSQL의 BASE 속성
- Basically Available : 가용성을 중시
- Soff - State : 노드의 상태는 외부에서 전송된 정보를 통해 결정
- Eventually Consistent : 최적으로는 일관성이 있는 상태가 되는 성질
728x90
'CS' 카테고리의 다른 글
[CS / TOPCIT] 시스템아키텍처와 네트워크 (0) | 2023.05.09 |
---|---|
[CS / TOPCIT] 인공지능 (0) | 2023.05.08 |
[CS / TOPCIT] 데이터베이스 분석 이해 (0) | 2023.05.08 |
[CS / TOPCIT] 데이터베이스 복구 (0) | 2023.05.08 |
[CS / TOPCIT] 동시성 제어 (0) | 2023.05.08 |