要从文本文档中提取
关键词,可以使用
Python中的自然语言处理
工具NLTK以及
关键词提取库pytextrank。以下是
一个示例代码:
```
python
im
port nltk
im
port pke
# 加载文件并读取文本内容
with open(
'example.txt
') as f:
text = f.read()
# 使用nltk库中的分词函数对文本进行分词
tokens = nltk.word_tokenize(text)
# 初始化
关键词提取器
extractor = pke.unsupervised.TextRank()
# 使用pytextrank库提取
关键词
extractor.load_docu
ment(text)
extractor.candidate_selection()
extractor.candidate_weighting()
keyphrases = extractor.get_n_best(n=10)
# 输出
关键词
for
keyphrase in
keyphrases:
print(
keyphrase[0])