- 인쇄
- PDF
Tableau 연동
- 인쇄
- PDF
VPC 환경에서 이용 가능합니다.
Tableau는 빠르고 쉬운 데이터 시각화를 지원하여 현재 많이 사용되는 BI 솔루션 중 하나입니다.
이 가이드는 네이버 클라우드 플랫폼 Cloud Hadoop과 Tableau를 연동하는 방법을 소개합니다.
Tableau에 대한 자세한 내용은 Tableau 공식 홈페이지를 참조해 주십시오.
사전 작업
Cloud Hadoop 클러스터를 생성해 주십시오.
- Cloud Hadoop 클러스터 생성에 관한 자세한 내용은 Cloud Hadoop 시작 가이드를 참고해 주십시오.
Object Storage를 생성해 주십시오.
- Object Storage 생성에 관한 자세한 내용은 Object Storage 개요 가이드를 참고해 주십시오.
Windows 서버를 생성해 주십시오.
- Windows 서버 생성에 관한 자세한 내용은 Server 시작 가이드를 참고해 주십시오.
참고Cloud Hadoop과 Windows 서버는 같은 VPC 내에 생성하는 것을 권장합니다.
ACG를 설정해 주십시오.
- Cloud Hadoop ACG에 8286 포트를 추가해 주십시오.
- Cloud Hadoop ACG에 8286 포트를 추가해 주십시오.
Hive에서 Table 생성
Object Storage에 샘플 데이터 파일을 업로드해 주십시오.
- [여기]에서 샘플 데이터를 다운로드한 후 압축을 해제하고 Object Storage > Bucket Management 에 파일을 업로드해 주십시오.
- [여기]에서 샘플 데이터를 다운로드한 후 압축을 해제하고 Object Storage > Bucket Management 에 파일을 업로드해 주십시오.
Hue Hive 편집기에서 Table을 생성해 주십시오.
CREATE external TABLE if not EXISTS `player` ( `playerName` VARCHAR(20), `playerAge` INT ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' location 's3a://exam2/input/player';
간단한 쿼리를 이용해서 테이블이 제대로 생성되었는지 확인해 주십시오.
SELECT * FROM player;
Presto Connector 추가
Presto > [CONFIGS] > Advanced connectors.properties 에서 connector를 추가해 주십시오.
- Hive Connector를 추가해야 하므로 connectors.to.add에 다음과 같이 입력해 주십시오.
{"hive":["connector.name=hive-hadoop2", "hive.metastore.uri=thrift://<METASTORE-HOST-IP>:9083", "hive.config.resources=/etc/hadoop/conf/core-site.xml,/etc/hadoop/conf/hdfs-site.xml", "hive.s3.use-instance-credentials=false", "hive.s3.aws-access-key=<API-ACCESS-KEY>", "hive.s3.aws-secret-key=<API-SECRET-KEY>", "hive.s3.endpoint=https://kr.object.private.gov-ncloudstorage.com"] }
참고<METASTORE-HOST-IP>
는 마스터 노드(m-001)의 Private IP 주소입니다. Ambari UI > Hosts 메뉴에서 확인할 수 있습니다.변경된 구성을 적용하기 위해 재시작이 필요합니다. 우측 상단의 [ACTIONS] > Restart All 을 클릭한 후, 팝업창의 [CONFIRM RESTART ALL] 버튼을 클릭해 주십시오.
Presto에서 Hive Data warehouse에 저장한 데이터를 분석하는 자세한 방법은 Presto로 Hive warehouse 데이터 분석 가이드를 참고해 주십시오.
Tableau 설치
아래 과정들은 모두 Windows 서버에서 진행됩니다.
- Tableau 홈페이지에서 Tableau Desktop을 다운로드해 주십시오.
- Presto 홈페이지에서 Presto JDBC 드라이버(presto-jdbc-0.268.jar)를 다운로드해 주십시오.
- Tableau가 설치된 경로의 Drivers 디렉터리에 Presto JDBC 드라이버를 이동해 주십시오.
Tableau는 Presto뿐만 아니라 스프레드시트부터 데이터베이스 등 다양한 데이터를 탐색할 수 있습니다. 지원되는 커넥터는 Tableau Desktop 및 웹 작성 도움말에서 확인할 수 있습니다.
nginx-ssl.crt 인증서 설치
Cloud Hadoop 엣지 노드에서 /etc/nginx/ssl/nginx-ssl.crt 인증서를 Windows 서버로 가져와 주십시오.
- 엣지 노드에 접속하는 방법은 SSH로 클러스터 노드 접속 가이드를 참고해 주십시오.
- 엣지 노드에 접속하는 방법은 SSH로 클러스터 노드 접속 가이드를 참고해 주십시오.
nginx-ssl.crt 인증서를 더블 클릭한 뒤, [인증서 설치] 버튼을 클릭해 주십시오.
로컬 컴퓨터를 선택한 뒤, [다음] 버튼을 클릭해 주십시오.
모든 인증서를 다음 저장소에 저장을 선택 후 인증서 저장소를 선택해 주십시오.
- 인증서 저장소는 신뢰할 수 있는 루트 인증 기관 으로 설정합니다.
- 인증서 저장소는 신뢰할 수 있는 루트 인증 기관 으로 설정합니다.
[마침] 버튼을 클릭하여 인증서 설치를 완료해 주십시오.
Tableau Desktop에서 Presto 접속
Tableau Desktop 을 실행한 후 서버에 연결 > 자세히 > Presto를 선택해 주십시오.
접속 정보를 입력한 후 [로그인] 버튼을 클릭해 주십시오.
<접속 정보>
- 서버 : Presto 클러스터의 도메인
- 포트 : Presto Coordinator의 포트(8286)
- 카탈로그 : 사용할 카탈로그의 이름
- 스키마 : 사용할 스키마의 이름
- 사용자 이름 : 사용할 유저의 이름
- SSL 필요 : 체크
테이블 및 레코드 확인
포함을 클릭하고 검색하여 해당 스키마의 테이블을 확인해 주십시오.
[지금 업데이트] 버튼을 클릭하여 테이블 안의 데이터들을 불러와 주십시오.
새 시트를 만들어서 드래그 앤 드롭만으로 간단히 시각화할 수 있습니다.
Tableau 사용에 대한 더 자세한 내용은 Tableau 공식 홈페이지에서 참고해 주십시오.