일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 프로그래머스
- AWS자격증
- 쉘스크립트
- EC2
- IAM
- 클라우드컴퓨팅
- 파이썬
- programmers
- 리눅스
- MFA
- 하둡
- 코딩테스트
- 클라우드자격증
- SQL
- Identity and access management
- CCAAdministrator
- CCA131
- 클라우데라자격증
- hadoop
- RDBMS
- sql자격증
- 데이터베이스
- CLF-01
- AWSCloudPractitioner
- mysql
- SQLD
- hive
- Multi Factor Authentication
- 빅데이터
- 빅데이터실무자격증
- Today
- Total
Sherry IT Blog
하둡의 질의표준 hive 하이브 정의 및 역할정리 본문
- 하이브는 하둡(오픈소스 프로젝트 중 하나였던)의 페타바이트 데이터를 다루는 SQL 질의의 표준
- 하둡을 웨어하우스 구조와 비슷하게 사용할 수 있도록 하둡분산파일 시스템인 HDFS(Hadoop Distributed File System) 의 데이터를 SQL로 접근할 수 있도록한 질의
-하이브의 질의언어는 HQL(Hive Query Language)라고 한다. 관계형 데이터 베이스의 표준 SQL과 문법이 비슷하다
- HQL은 더 좋은 성능을 얻기위해 맵리듀스,스파크,테즈 등 여러 컴퓨팅 프레임워크에서 동작할 수 있다
- 하이브의 데이터구조 : 테이블(table),파티션(partition),버킷(bucket)
-하이브 데이터포맷 : timestamp, string, float, boolean, decimal, double, int, smallint, bigint 등 원시데이터 포맷 대부분 지원
- 하이브 데이터타입 : union , struct, map, array 지원
-하이브는 HDFS 데이터에 애드혹 질의(동적 질의)할 수 있다
-하이브는 메타데이터 관리,인증,질의 최적화에 대해 정의된 아키텍처를 소유한다
*인증 : 커버로스 (kerberos),LDAP방식 이용
-하이브는 SerDes와 I/O포맷을 사용해 임의의 포맷데이터를 읽을 수 있다
*SerDes란 : Serializer Deserializer의 약자로 직렬을 병렬로 전송하는 방식
-하이브는 많은 데이터 집합에서 동일한 타입의 질의응답시간이 다른 타입의 질의응답 시간보다 훨씬 빠르다
**원문출처:하이브핵심정리 기반으로 정리한 요약임
'BIgData' 카테고리의 다른 글
hadoop Impala 메타테이블 갱신 오류 (0) | 2021.04.23 |
---|---|
[빅데이터분석기사]빅데이터의 이해 (0) | 2021.04.13 |
hive insert문 셋팅값 & insert into 와 insert overwrite 차이 (0) | 2021.02.05 |
알아두면 유용한 Hive alter문 (0) | 2021.02.02 |
HDFS 데이터 이관 후 hive에서 테이블 조회 안될경우 해결 명령어 (0) | 2021.02.02 |