파이썬 KoNLPy 패키지 사용 방법

KoNLPy는 형태소 분석기를 하나로 모은 패키지입니다. 패키지 안에는 Kkma, Twitter, Mecab 등과 같은 클래스가 들어가 있습니다. 이 게시글에서 클래스 간의 성능 비교 결과치 및 사용 방법에 대해서 설명드리겠습니다. Konlpy 패키지 설치 : 파이썬 형태소 분석 KoNLPy 및 Word2Vec Gensim 설치 konlpy 문서에 따르면 클래스 간의 성능은 아래와 같습니다. 출처 : http://konlpy.org/ko/v0.4.3/morph/ 사전 로딩시간 Kkma: 5.6988 secs Komoran: 5.4866 secs […]

파이썬 형태소 분석 KoNLPy 및 Word2Vec Gensim 설치

지금까지 데이터 처리 및 학습을 위한 인스턴스를 생성했고, 인스턴스에 Anaconda 및 TensorFlow 설치를 마쳤습니다. 이제부터는 준비된 환경에서 Konlpy API를 이용하여 텍스트를 형태소 분석한 후에 Gensim 라이브러리를 이용하여 태깅된 것들을 Word2Vec 한 다음 가장 유사한 단어 찾기 등을 하기 위한 준비물들을 설치하겠습니다. KoNLPy API 설치 KoNLPy API를 설치하기 전에 Jpype 라이브러리를 설치해줘야 KoNLPy를 설치할 수 있습니다. […]

리눅스 인스턴스 TensorFlow 설치

저번 게시글에서는 인스턴스에 Anaconda를 설치했으므로 TensorFlow를 conda 가상 환경에 설치하는 방법을 소개하겠습니다.

인스턴스에서 python을 입력하면 아래와 같은 내용이 출력됩니다. 빨간 네모 박스에 들어가 있는 파이썬 버전 3.6.5 (설치하신 분들마다 다를 수 있습니다.)을 아래 명령어 입력시 버전을 확인하고 넣어주세요

명령어 입력을 마치게 되면 위 화면과 같이 아나콘다 가상 환경에 TensorFlow를 설치할 것인지를 묻습니다. ‘y’를 […]

구글 클라우드 리눅스 인스턴스 가상환경 아나콘다 설치

구글 클라우드 인스턴스를 생성한 후 머신러닝을 도와주는 라이브러리 중 하나인 TensorFlow를 설치해야 합니다. 하지만 일반 환경에서 TnesorFlow를 설치하는 것은 복잡하고 추가적인 것들이 많으므로 이를 해결해주는 아나콘다 가상환경에서 TnesorFlow를 설치하겠습니다. (필자는 Ubuntu에서 설치를 진행했습니다.)   가상환경 Anaconda 다운로드 아나콘다 아카이브에서 자신의 Python 버전과 OS에 맞는 Anaconda를 다운합니다.

위의 명령어 중에서 자신의 인스턴스 환경 및 사양에 […]

구글 클라우드를 이용한 머신러닝 인스턴스 생성

머신러닝을 진행하기 위해선 Word2Vec이나 Training 등의 과정이 필요합니다. Training같은 경우 TensorFlow GPU 버전을 이용할 수도 있지만 CPU 버전으로 돌리게 되면 많은 프로세스와 메모리를 차지할 수 밖에 없습니다. 그래서 GPU 대신 CPU 버전으로 돌리는 경우 이러한 활동을 진행할 수 있도록 도와주는 구글 클라우드를 이용해 무료(300 $한정)로 머신러닝을 할 수 있는 방법을 소개해드리겠습니다. ( TensorFlow GPU 버전을 […]