본문 바로가기

Data Analysis4

[Zeppelin] 노트북 생성 및 튜토리얼 진행 지난번에 포스팅한 Apache Zeppelin 설치 내용 이후, 노트북 생성 방법에 대해 알아보겠습니다. 제 환경은 아래와 같습니다. Mac Catalina Docker 19.03.5 apache zeppelin 0.8.2 노트북 생성 zeppelin을 실행시킨 다음에 http://localhost:8080/ 으로 접속하면 아래와 같은 화면을 확인할 수 있습니다. 좌측 상단의 Notebook 을 클릭한 다음, "Create new note" 버튼을 클릭하여 새로운 노트북을 만들어 주면 됩니다. 노트의 이름은 원하시는 이름으로 작성하시면 됩니다. (저는 tutorial 으로 생성했습니다.) 인터프리터는 기본인 Spark를 사용하면 됩니다. 튜토리얼 Apache Zeppelin 공식 사이트의 Tutorial.. 2020. 5. 16.
[Zeppelin] Apache Zeppelin 설치 Apache Zeppelin 란? Apache Spark를 사용하여 데이터를 분석할 때, 웹 기반의 노트북(Notebook)인 Apache Zeppelin을 이용하면 보다 더 편리하게 데이터 분석이 가능합니다. Apache Zeppelin 설치 Zeppelin을 설치하는 방법에는 크게 2가지가 존재합니다. Docker 설치 로컬 머신 설치 제 환경은 아래와 같습니다. Mac Catalina OpenJDK 1.8 Docker 19.03.5 (도커로 설치할 경우 필요) 의존성 Apache Zeppelin 을 설치하기 위해서는 JDK 1.7 버전 이상이 설치되어 있어야 합니다. 1. Docker 설치 과정 Docker Hub 에는 다양한 도커 이미지들을 업로드, 다운로드 할 수 있습니다. Apache Zepp.. 2020. 5. 10.
pip를 이용한 Pandas 설치(python3+) Pandas는 자료 구조와 데이터 분석을 위한 파이썬 라이브러리 입니다. pip를 이용하면 손쉽게 pandas를 설치할 수 있습니다. 제 설치 환경은 아래와 같습니다. macOS Sierra 10.12.5 Python 3.6.0 pip 9.0.1 파이썬, pip의 버전을 확인하는 방법은 -V(대문자) 옵션을 주면 됩니다. #### Python version check #### $ python3 -V Python 3.6.0 #### Pip version check #### $ pip3 -V pip 9.0.1 from /Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages (python 3.6) #### Python3+ ##.. 2017. 6. 5.
pip를 이용한 Numpy 설치(python3+) 머신러닝, 데이터 분석을 위해선 Numpy 라이브러리를 흔히 사용하고 있습니다. Numpy는 pip를 이용하면 쉽게 설치할 수 있습니다. 제 환경은 아래와 같습니다. macOS Sierra 10.12.5 Python 3.6.0 pip 9.0.1 파이썬, pip의 버전을 확인 하는 방법은 -V(대문자) 옵션을 주면 됩니다. #### python version check #### $ python3 -V Python 3.6.0 #### pip version check #### $ pip3 -V pip 9.0.1 from /Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages (python 3.6) #### python3+ ##.. 2017. 6. 5.