Classic 환경에서 이용 가능합니다.
Iceberg는 방대한 분석 데이터 세트를 위한 개방형 테이블 형식으로서, SQL 테이블처럼 작동하는 고성능 형식을 사용하는 테이블을 Presto 및 Spark에 추가하는 시스템입니다.
Iceberg 구성 요소
Iceberg를 구성하는 컴포넌트는 크게 세 가지로 iceberg catalog, metadata layer, data layer로 계층적인 구조로 이루어져 있습니다.
- Iceberg Catalog Layer
지정된 테이블에 대한 데이터를 읽거나 쓸 위치를 식별하는데 사용합니다. Iceberg Catalog는 현재 시점의 테이블 메타데이터를 찾을 수 있게 해줍니다. 또한 쿼리가 실행되면 해당 쿼리가 찾는 메타데이터 파일을 찾기 위해도 사용됩니다. - Metadata Layer
메타데이터 파일, 매니페스트 목록 및 매니페스트 파일로 세가지 구성 요소로 구성됩니다, 메타데이터 파일에는 테이블의 스키마, 파티션 정보, 스냅샷, 스냅샷에 대한 정보가 포함되어 쿼리에서 필요한 데이터를 빠르게 찾을 수 있도록 합니다. - Data Layer
실제 데이터 파일을 저장하는 곳으로 매니페스트 파일의 메타 정보를 이용하여 필요한 데이터 파일에 접근할 수 있게 합니다.
Iceberg 사용
Iceberg를 사용하는 방법은 다음과 같습니다.
주의
아래 예시는 1.2.1 버전을 기반으로 설명되었습니다.
Hive shell을 통한 테스트
- hive에 접속하십시오.
- database를 생성하십시오.
- database 선택하십시오.
- 테이블을 생성하십시오.
- add jar를 이용하여 iceberg 라이브러리를 사용하십시오.
- add jar를 이용하여 libfb 라이브러리를 사용하십시오.
- insert를 통해 데이터를 삽입하십시오.
- select 로 데이터를 확인하십시오.
- 테이블 스키마를 확인하십시오.