1 |
강의개요 및 권장 학습순서와 NLTK 설치하기 |
|
|
2 |
corpus(말뭉치)란 무엇인가 |
|
|
3 |
nltk gutenberg corpus 다운로드 및 텍스트 내용 출력하기 |
|
|
4 |
nltk gutenberg corpus 여러가지 값 출력 |
|
|
5 |
nltk tokenization - sent_tokenize |
|
|
6 |
word_tokeniz() 함수를 사용한 토큰화 vs gutenberg.words() 함수를 사용한 토큰화 비교 |
|
|
7 |
각 토큰당 평균 문자 수 |
|
|
8 |
브라운 코퍼스를 활용한 여러가지 메서드(1) |
|
|
9 |
브라운 코퍼스를 활용한 여러가지 메서드(2) 및 FreqDist 함수 사용법 |
|
|
10 |
FreqDist() 함수로 단어 빈도 수 체크시 대소문자 문제 |
|
|
11 |
특정 단어의 빈도 수 체크 |
|
|
12 |
특정 단어의 빈도 수 체크 - list comprehension 사용 |
|
|
13 |
세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 기초학습 |
|
|
14 |
전부 소문자로 바꾼 후 중복되는 것 없이 단어 수 체크 |
|
|
15 |
세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 최종 통계 구하기 |
|
|
16 |
브라운 코퍼스 장르별 원하는 단어 수 세기 - ConditionalFreqDist() 사용법 |
|
|
17 |
cfd 출력시 pair로 구성해서 출력하기 |
|
|
18 |
브라운 코퍼스 카테고리별 단어 수 체크시 배열 변수 만들어서 이중 for문으로 구성하기 |
|
|
19 |
n-gram이란 무엇이고 bigram, trigram 등이 검색 예측에 어떻게 활용되어지는가 |
|
|
20 |
nltk 패키지내 ngrams를 활용하여 bigram, trigram 구하기 실습 |
|
|