일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- Hypothesis
- AI
- 자연어처리
- Natural Language Processing with PyTorch
- 강의정리
- 강의자료
- 홍콩과기대김성훈교수
- 파이토치
- loss
- DynamicProgramming
- Python
- DP
- tensorflow
- Deep learning
- classifier
- Cross entropy
- 스택
- rnn
- MSE
- 머신러닝
- 파이썬
- pytorch
- Softmax
- machine learning
- 알고리즘
- 백준
- 정렬
- 머신러닝 기초
- BAEKJOON
- 딥러닝
- Today
- Total
개발자의시작
Python 한국어 맞춤법 검사기 py-hanspell 라이브러리 사용법 본문
이 글은 한국어 맞춤법 및 띄어쓰기 검사기 py-hanspell 사용법에 대한 정리입니다.
라이브러리 설치는 아래의 링크에서 다운받을 수 있습니다.
1. 링크 주소 :
https://github.com/ssut/py-hanspell
2. 수정사항
링크를 클릭하여 github로 접속하면 소스코드와 함께 사용법이 있습니다. 다만 그대로 사용하면 오류가 발생하기 때문에 코드에서 일부 수정이 필요합니다. 오류 내용을 네이버 맞춤법 검사기 주소가 변경되어 발생하는 오류입니다. 변경사항은 아래와 같습니다.
contants.py 파일 - url 주소 변경
변경 전 : base_url = 'http://csearch.naver.com/dcontent/spellchecker.nhn'
변경 후 : base_url = 'https://m.search.naver.com/p/csearch/ocontent/spellchecker.nhn'
spell_checker.py 파일 - 'referer' 부분 추가
변경 전 : headers = { 'user-gent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36'}
변경 후 : headers = { 'user-gent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36',
'referer': 'https://search.naver.com/' }
위 와 같이 변경해주면 바로 사용이 가능합니다.
3. 테스트 결과
테스트 소스
1
2
3
4
5
6
7
8
9
|
from hanspell import spell_checker
sent = "한글 맞춤법검사기 재대로작동돼는지테스트"
spelled_sent = spell_checker.check(sent)
checked_sent = spelled_sent.checked
print(checked_sent)
|
실행화면
주요 메서드나 출력 결과에 대한 설명은 위의 링크를 따라 들어가면 확인할 수 있습니다.
오류 또는 수정사항 있으시다면 댓글 남겨주세요.
감사합니다.
'자연어처리' 카테고리의 다른 글
Natural Language Processing with PyTorch 정리 3-4 (0) | 2020.06.17 |
---|---|
Natural Language Processing with PyTorch 정리 3-3 (0) | 2020.06.10 |
Natural Language Processing with PyTorch 정리 3-2 (0) | 2020.05.13 |
Natural Language Processing with PyTorch 정리 3-1 (0) | 2020.05.12 |
[정보검색] 역색인파일(inverted index file) 정리 (0) | 2020.04.14 |