[Python] TF-IDF 유사도 측정을 통한 문서 요약 프로그램
문서 요약 필요한가? 하루에 몇 백장의 사건 서류를 읽어야하는 판사님들, 밤새가며 공부하는 학생들 뿐 아니라 항상 글을 읽으며 살아가는 사람들이 있습니다. 하지만 만약 서류나 글을 조금이라도 줄일 수 있다면 어떨까요.만약 1000 줄 중 가장 중요한 1,2 줄만 바로 볼 수 있다면? 업무시간을 줄이는 데 보다 도움을 줄 수 있지 않을까요? 문서 요약 프로그램 자연어 처리 기술과 유사도 측정, 구글의 Page-Rank 검색 알고리즘을 사용하여 만든 문서 요약 프로그램 입니다. 수능 2018 년도 과학 지문을 예로 들어 한 단계씩 볼까요? 가장 먼저 문서에서 필요한 부분만 추출해내는 전처리 과정을 진행합니다. 일단 문서를 문장 단위로 끊어 볼까요. 일반적으로 문장의 핵심은 어미나 조사가 아닌 명사와 동사 입..
Python
2019. 1. 31. 20:54
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- 로스쿨
- 파이썬
- 시흥
- dict
- 리눅스
- 지도학습
- Oracle
- 광명
- PPT
- KNN
- MLP
- ALIAS
- 알고리즘
- 리트
- 일반산업단지
- python
- 머신러닝
- 신입 공채
- 첨단산업단지
- 블라인드
- 의사결정트리
- sql
- 백준
- 블라인드 코딩
- 산업단지
- 코딩테스트
- 딥러닝
- ML
- 넘파이
- 카카오
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
글 보관함