VPC 환경에서 이용 가능합니다.
네이버 클라우드 플랫폼 Cloud Hadoop과 Cloud Data Streaming Service (CDSS)를 연동하는 방법을 소개합니다.
이 가이드는 Presto 공식 가이드에서 제공하는 Kafka Connector Tutorial 가이드를 기반으로 작성되었습니다.
사전작업
- Cloud Hadoop 클러스터를 생성해 주십시오.
- Cloud Hadoop 클러스터 생성에 관한 자세한 내용은 Cloud Hadoop 시작 가이드를 참조해 주십시오.
- Cloud Data Streaming Service를 생성해 주십시오.
- Cloud Data Streaming Service 생성에 관한 자세한 내용은 Cloud Data Streaming Service 사용 가이드를 참조해 주십시오.
- Cloud Data Streaming Service 사용하기 위해 VM 생성 및 세팅을 해주십시오.
- VM 생성과 세팅에 관한 자세한 내용은 Cloud Data Streaming Service 사용 가이드를 참조해 주십시오.
- ACG를 설정해 주십시오.
- Cloud Hadoop에서 Cloud Data Streaming Service Broker 노드에 접속하기 위해서 9092 포트를 허용해줘야 합니다.
- Cloud Data Streaming Service의 Broker 노드 ACG 접근 소스에 Cloud Hadoop의 Subnet 대역을 추가해 주십시오.
참고
Cloud Hadoop과 Cloud Data Streaming Service는 같은 VPC 내 통신이 가능한 동일 Subnet으로 생성하는 것을 권장합니다.
CDSS(Kafka)에 데이터 업로드
Cloud Data Streaming Service VM에서 Kafka를 실행해 주십시오.
Kafka에 데이터를 다운로드해 주십시오.
Kafka에 데이터를 업로드해 주십시오.
Presto에 connector 추가
Ambari UI에서 Presto > [CONFIGS] > Advanced connectors.properties에 connectors.to.add 값을 아래와 같이 추가한 후, [SAVE] 버튼을 클릭해 주십시오.
변경된 구성을 적용하기 위해 재시작이 필요합니다. 우측 상단의 [ACTIONS] > Restart All을 클릭한 후, 팝업창의 [CONFIRM RESTART ALL] 버튼을 클릭해 주십시오.
Presto에서 테이블 조회
Cloud Hadoop 엣지 노드로 접속하여 Presto를 실행해 주십시오.
- catalog는 kafka, schema는 tpch로 설정해 주십시오.
간단한 쿼리를 통해서 내용을 확인합니다.
참고
Presto와 Kafka 활용에 대한 더 자세한 내용은 Kafka Connector 튜토리얼을 참고해 주십시오.