Data Science/Text Mining, 자연어처리

[Python/NLP] Windows 에서 Mecab 사용하기, Mecab 설치

愛林 2023. 1. 6. 17:51
반응형

Mecab 을 사용하고 싶은데 사용하고 있는 환경에서 사용이 되지 않았다.

그래서 이리저리 찾아보았다.

 

 

설치방법


1. mecab-ko-msvc 설치


 https://github.com/Pusnow/mecab-ko-msvc/releases/tag/release-0.9.2-msvc-3 

 

Release release-0.9.2-msvc-3 · Pusnow/mecab-ko-msvc

Fix: -r 옵션을 지정해 주지 않았을 때 레지스트리에서 이상한 값을 가져와 오류가 나는 문제 해결

github.com

위 링크에서 본인의 윈도우 버전에 맞게 설치를 해준 뒤,

본인의 C Drive 에 mecab 폴더를 만들어준다.

이후 그 폴더 내에 다운로드한 zip 파일의 압축을 풀어준다.

 

 

2. mecab-ko-dic-msvc.zip 설치

 

https://github.com/Pusnow/mecab-ko-dic-msvc/releases/tag/mecab-ko-dic-2.1.1-20180720-msvc

 

Release mecab-ko-dic-2.1.1-20180720-msvc · Pusnow/mecab-ko-dic-msvc

mecab-ko-dic-2.1.1-20180720 반영 오류 수정 NNG/장소의 출현 비용이 비정상적으로 높았던 문제(학습 데이터) 수정 후 재학습 사전 오피스/NNG/장소 추가

github.com

위와 마찬가지로 링크에 들어가서 zip 파일을 다운로드 해준 후, 

mecab 폴더에 압축해제한다.

 

폴더는 생기지 않고 파일들만 들어가도록 해준다.

 

 

3. Python wheel 설치하기

 

https://github.com/Pusnow/mecab-python-msvc/releases/tag/mecab_python-0.996_ko_0.9.2_msvc-2

 

Release mecab_python-0.996_ko_0.9.2_msvc-2 · Pusnow/mecab-python-msvc

Add Python 3.7 support

github.com

위 링크에 들어가서 파이썬 버전에 맞는 whl 을 다운로드해준다.

 

윈도우 64bit, 파이썬 3.7버전 >> mecab_python-0.996_ko_0.9.2_msvc-cp37-cp37m-win_amd64.whl

 

본인은 파이썬 3.9.12 버전을 사용하고 있었으나,

이 과정을 위해 3.7.0 버전으로 다운그레이드 시켜주었다.

나랑 같은  과정을 걸쳐야 한다면 여기로.

 

https://wndofla123.tistory.com/99

 

[Python] 파이썬 다운그레이드 (Python downgrade), 버전 변경(Python change version), Error. Solving environment: fail

파이썬을 다운그레이드 시켜야 할 일이 생겼다. mecab 을 python 에서 사용하고 싶은데, 3.9 로는 진행할 수 없었다. Python version 이 높으면 안 돌아가는 것들이 생기기 마련이다. 그래서 나는 버전을 3

wndofla123.tistory.com

 

꽤나 오랜 시간을 소요해서 3.7.0 으로 버전을 낮추었다.

 

다운로드 받은 파일을 Anaconda3 / Lib / site-packages 폴더에 옮겨준다.

C:\Users\user\anaconda3\Lib\site-packages

(대부분 이런 경로일 것이다.)

 

이후 anaconda prompt 를 킨 후 site-package 폴더로 이동 후  pip 로 whl 을 설치해준다.

 

cd C:\Users\user\anaconda3\Lib\site-packages

pip install mecab_python-0.996_ko_0.9.2_msvc-cp37-cp37m-win_amd64.whl

 

whl 파일 자리엔 본인이 다운로드한 whl 버전을 넣어주어야 한다.

 

이제 anaconda prompt 를 종료 후 재실행 한 후 jupyter 를 켜주면 된다.

 

이젠 또 jpype 가 문제이다.

Mecab 을 슬슬 쓰고싶지 않다는 생각이 들기 시작한다.

jpype 를 버전에 맞게 깔아주니,

실행이 잘 되었다.

 

python에서 mecab 을 사용할 때는 경로를 설정해주어야 한다.

 

from konlpy.tag import Mecab
mecab = Mecab(dicpath=r"C:\mecab\mecab-ko-dic")
mecab.morphs("개빡치는메캅")
['개', '빡', '치', '는', '메', '캅']

 

드디어 Mecab 이 돌아가는 감동적인 순간이다.

 

 

 

 

 

https://hong-yp-ml-records.tistory.com/91

 

[파이썬 NLP] Window에서 Mecab 사용하기 / Konlpy 토크나이저 비교

이번 포스팅은 Konlpy 라이브러리의 여러 토크나이저들과 그 성능을 비교해보는 시간을 가져보겠습니다! 또한 Konlpy와 별개로 추가 설치를 해야하는 Mecab 토크나이저의 설치 방법도 다뤄보도록 하

hong-yp-ml-records.tistory.com

https://p-ido.tistory.com/8

 

[python] 한국어 자연어처리 KoNLPy 실행 시 오류

키워드 추출 작업 중 KoNLPy 패키지를 사용하는데 다양한 오류가 발생했다. 실행 전 여러가지 작업을 해줘야 하는데 다음 작업을 위해 기록해둔다. * KoNLPy 홈페이지 참고 konlpy-ko.readthedocs.io/ko/v0.4.3

p-ido.tistory.com