이 글은 새로운 블로그로 옮겼습니다. 5초후 자동으로 이동합니다.
▶ 새로운 블로그 주소: https://prodskill.com/
▶ 새로운 글 주소: https://prodskill.com/word-extractor-toc/
단어 추출 도구에 대한 설명글을 6개로 나누어 작성하고 모두 블로그에 포스팅했다. 전체 목차를 별도의 글로 작성하여 올려둔다.
- 5.1. OLE Automation을 사용하는 이유
- 5.2. Text 파일 인코딩 관련 (UTF-8만 지원함)
- 5.3. multi processing 사용 이유
- 5.4. 복합어 추출 관련 참고사항
- 5.5. 형태소 분석기 품사 종류
단어 추출 도구는 아래 github repository에서 다운로드할 수 있다.
https://github.com/DAToolset/ToolsForDataStandard/tree/main/WordExtractor
실행에 필요한 소스코드, 글꼴, table/column 목록 예시 파일, 출력 예시 파일을 배포용 압축파일로 묶어 두었으니, 이 파일을 다운로드 받으면 된다.
https://github.com/DAToolset/ToolsForDataStandard/raw/main/WordExtractor/word_extractor.7z
데이터 표준화 작업에 조금이나마 도움이 되길 바란다.
'DA(Data Architecture) 도구 > 단어 추출 도구' 카테고리의 다른 글
단어 추출 도구(6): 단어 추출 도구 부가 설명 (0) | 2021.11.14 |
---|---|
단어 추출 도구(5): 단어 추출 도구 소스코드 설명(2) (0) | 2021.11.13 |
단어 추출 도구(4): 단어 추출 도구 소스코드 설명(1) (0) | 2021.11.13 |
단어 추출 도구(3): 단어 추출 도구 실행, 결과 확인 방법 (6) | 2021.10.24 |
단어 추출 도구(2): 단어 추출 도구 실행환경 구성 (2) | 2021.09.26 |
단어 추출 도구(1): 단어 추출 도구 개요 (4) | 2021.08.29 |
댓글