개발자의시작

Python 한국어 맞춤법 검사기 py-hanspell 라이브러리 사용법 본문

자연어처리

Python 한국어 맞춤법 검사기 py-hanspell 라이브러리 사용법

LNLP 2020. 4. 7. 18:40

 

이 글은 한국어 맞춤법 및 띄어쓰기 검사기 py-hanspell 사용법에 대한 정리입니다.

 

라이브러리 설치는 아래의 링크에서 다운받을 수 있습니다.

 

1. 링크 주소 :

 

https://github.com/ssut/py-hanspell

 

ssut/py-hanspell

파이썬 한글 맞춤법 검사 라이브러리. (네이버 맞춤법 검사기 사용). Contribute to ssut/py-hanspell development by creating an account on GitHub.

github.com

 

2. 수정사항

 

링크를 클릭하여 github로 접속하면 소스코드와 함께 사용법이 있습니다. 다만 그대로 사용하면 오류가 발생하기 때문에 코드에서 일부 수정이 필요합니다. 오류 내용을 네이버 맞춤법 검사기 주소가 변경되어 발생하는 오류입니다. 변경사항은 아래와 같습니다.

 

contants.py 파일 - url 주소 변경

 

변경 전 : base_url = 'http://csearch.naver.com/dcontent/spellchecker.nhn'

 

변경 후 : base_url = 'https://m.search.naver.com/p/csearch/ocontent/spellchecker.nhn'

 

spell_checker.py 파일 - 'referer' 부분 추가

 

변경 전 :  headers = { 'user-gent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36                                      (KHTML, like Gecko)     Chrome/57.0.2987.133 Safari/537.36'}

 

변경 후 :  headers = { 'user-gent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36                                         (KHTML, like Gecko)     Chrome/57.0.2987.133 Safari/537.36',

                                'referer': 'https://search.naver.com/' }

 

위 와 같이 변경해주면 바로 사용이 가능합니다. 

 

3. 테스트 결과 

테스트 소스

1
2
3
4
5
6
7
8
9
from hanspell import spell_checker
 
sent = "한글 맞춤법검사기 재대로작동돼는지테스트"
spelled_sent = spell_checker.check(sent)
checked_sent = spelled_sent.checked
 
print(checked_sent)
 
 
 

 

실행화면

 

주요 메서드나 출력 결과에 대한 설명은 위의 링크를 따라 들어가면 확인할 수 있습니다.

 

오류 또는 수정사항 있으시다면 댓글 남겨주세요.

 

감사합니다.

Comments