일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 코딩테스트
- 클라우드컴퓨팅
- 파이썬
- CLF-01
- Identity and access management
- AWSCloudPractitioner
- programmers
- EC2
- Multi Factor Authentication
- AWS자격증
- 쉘스크립트
- 리눅스
- CCA131
- 빅데이터실무자격증
- RDBMS
- hadoop
- 빅데이터
- hive
- SQLD
- 프로그래머스
- mysql
- SQL
- CCAAdministrator
- IAM
- 하둡
- 데이터베이스
- 클라우드자격증
- MFA
- sql자격증
- 클라우데라자격증
- Today
- Total
Sherry IT Blog
[빅데이터분석기사]빅데이터의 이해 본문
*빅데이터(Big Data)의 개념
- 빅데이터는 믹대한 양(수십 테라바이트 이상)의 정형 및 비정형 데이터이다.
- 데이터로부터 가치를 추출하고 결과를 분석하는 기술의 의미
- 데이터에서부터 가치를 추출하는 것은 통찰, 지혜를 얻는 과정으로 DIKW피라미드로 표현할 수 있다
*DIKW 피라미드
지혜(wisdom) - 근본원리에 대한 깊은 이해를 바탕으로 도출되는 창의적인 아이디어
ex) A사이트의 다른 상품들도 B사이트보다 저렴할 것으로 판단
지식(Knowledge) - 유의미한 정보로 분류하고 일반화시킨 결과물, 정보에 기반해 찾아진 규칙
ex) A사이트가 더 싸게 팔기 떄문에 X책을 구입할 계획
정보(Information) - 가공처리해서 데이터간의 연관관계와 함께 의미가 도출된 데이터
ex) X책을 A사이트에서 더 싸게 판매중이다
데이터(Data) - 가공하기 전의 순수한 데이터
ex) X책을 A사이트에서 3,000원, B사이트에서 3,500원에 판매
*빅데이터 특징
7V
규모(Volume)
다양성(Variety)
속도(Velocity)
신뢰성(Veracity)
가치(Value)
정확성(Validity)
휘발성(Volatility)
*빅데이터의 유형(데이터 구조적 관점)
- 정형 데이터 : 정형화된 스키마구조,DBMS에 내용이 저장될 수 있는 구조, 고정된 필드(속성)에 저장된 데이터
ex) 관계형 데이터베이스(Oracle, MS-SQL등)
-반정형 데이터 : 데이터 내부의 데이터 구조에 대한 메타 정보가 포함된 구조
ex) XML, HTML, JSON 등
- 비정형 데이터 : 수집 데이터 각각이 데이터 객체로 구분
ex) 텍스트 문서,이진파일 이미지, 동영상
'BIgData' 카테고리의 다른 글
hive sql add_months, last_day, date_format 함수를 이용한 전월말일자 구하기 (0) | 2021.10.08 |
---|---|
hadoop Impala 메타테이블 갱신 오류 (0) | 2021.04.23 |
하둡의 질의표준 hive 하이브 정의 및 역할정리 (0) | 2021.02.08 |
hive insert문 셋팅값 & insert into 와 insert overwrite 차이 (0) | 2021.02.05 |
알아두면 유용한 Hive alter문 (0) | 2021.02.02 |