Skip to content

摘要、关键字、关键词组、文本相似度、分词分句(自然语言处理工具包)

Notifications You must be signed in to change notification settings

duyongan/text_process

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

摘要、关键字、关键词组、文本相似度、分词分句(自然语言处理工具包)

环境:python3

安装:pip install text_process

使用示例:

from text_process import text_utils text=""

中文分句:

text_utils.text2sencents_zh(text)

英文分句:

text_utils.text2sencents_eh(text)

英文分词(词组、单词、且已去停用词)

text_utils.text2sencents_eh(text)

中文分词(已去停用词)

text_utils.text_process_zh_single(text)

中文分词(词组 已去停用词)

text_utils.text_process_zh_not_single(text)

中文关键字(不包括词组)

text_utils.getKeywords_zh_single(text)

中文关键字(包括词组)

text_utils.getKeywords_zh_not_single(text)

英文关键字(包括词组)

text_utils.getKeywords_en(text)

文本相似度比较

compare_botor=text_utils.compare_bot()
text2=""
compare_bot.compare_two_txt_accuracy(text,text2)

或者(适合少量数据)

text_utils.compare_two_txt_accuracy(text,text2)

中文摘要

text_utils.getAbstract_zh(title,text)

英文摘要

text_utils.getAbstract_en(title,text)

About

摘要、关键字、关键词组、文本相似度、分词分句(自然语言处理工具包)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages