728x90
반응형
Zeppelin
은 웹 기반으로 다양한 인터프리터를 이용해서 데이터 분석을 도와주는 도구이다.
설치를 위해서 다음과 같이 하면 된다.
$ sudo yum install -y java-1.8.0-openjdk.x86_64
$ wget http://mirror.apache-kr.org/zeppelin/zeppelin-0.8.2/zeppelin-0.8.2-bin-all.tgz
$ tar xf zeppelin-0.8.2-bin-all.tgz && cd zeppelin-0.8.2-bin-all
다음과 같이 실행하면 Zeppelin
이 구동된다.
$ bin/zeppelin-daemon.sh start
서버에 설치한 경우엔 직접 아이피로 접근해야 하는데 기본 설정으로는 접근할 수 없다.
Zeppelin
최신 버전(0.8.2
)의 경우 기본 호스트가 0.0.0.0
에서 127.0.0.1
로 변경됐다.
Upgrading from Zeppelin 0.8.1 (and before) to 0.8.2 (and later)
From 0.8.2, Zeppelin server bind 127.0.0.1 by default instead of 0.0.0.0. Configure zeppelin.server.addr property or ZEPPELIN_ADDR env variable to change.
그래서 zeppelin-env.sh
에서 ZEPPELIN_ADDR
를 0.0.0.0
으로 변경하고 재시작하면 웹에서 접근할 수 있다.
Spark
와 연동하기 위해서 Zeppelin
이 설치된 서버에 Spark
를 설치한다.
원격 서버에 설치된 Spark
버전이 2.4.5
라면 똑같은 버전을 설치해야 동작한다.
그리고 zeppelin-env.sh
에 다음과 같이 설정한다.
export SPARK_HOME=~/spark
이제 마지막으로 웹페이지에서 Interpreter
에 Spark
를 찾아 설정을 추가한다.
master
에 spark://remote_addr:7077
와 같이 입력하면 된다.
Notebook
에서 테스트해보면 잘 동작하는 것을 확인할 수 있다.
참고 문헌
반응형
'Log' 카테고리의 다른 글
[Log] Logstash 403 에러 해결 (0) | 2020.03.19 |
---|---|
[Log] Airflow 설치 (0) | 2020.03.12 |
[Log] NoNodesAvailable 에러 해결 (0) | 2020.02.27 |
[Log] Spark ElasticSearch Parquet (0) | 2020.01.25 |
[Log] Logstash Kafka 연동 에러 해결 (0) | 2020.01.25 |