Skip to content

Latest commit

 

History

History
9 lines (6 loc) · 262 Bytes

README.md

File metadata and controls

9 lines (6 loc) · 262 Bytes

使用

依赖最新的jieba分词。

算法局限

算法短语生成树仅仅考虑bigram,后续可能会考虑引入trigram。 算法仅一次迭代 算法所用idf词表复用的jieba的关键词词表,且词表中未引入bigram等高阶组合