Skip to content

weiambt/tiny-search-engine

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

tiny-search-engine

课题名称

微型搜索引擎(基于关键词的文本排序检索系统)

课题介绍

对于给定文本库,用户提交检索关键词,在文本库中查询与检索关键词最相关的 k 个文本(例如 k=5),并根据文本与检索关键词的相关度,对这 k 个文本进行排序,将排序后的结果返回给用户。

课题要求

(1)利用 TF-IDF 模型,为文本库中的文本创建索引(如倒排索引)

(2)用户输入的关键词可以是一个或多个

(3)对于返回的结果文本,需同时显示各检索关键词在结果文本中的出现 频度信息

(4)系统内支持返回结果文本的查看

主要算法

TF-IDF

开发语言

python

学习此项目

https://blog.csdn.net/Supreme7/article/details/106795878?spm=1001.2014.3001.5502

扩展功能

此项目有可扩展的功能,后续将抽空进行补充,

  • 制作一个前端展示页面

    类似于百度搜索的主页(大搜索框),比如使用VUE

  • 制作一个后端API程序

    推荐使用Flask或者django,实现API接口

  • 补充数据集

    本项目没有使用开源数据集,如您有找到适合本项目的数据集欢迎添加。

如果您有较高的技术水平并且愿意花费您宝贵的时间来支持本项目,您可以提交Pull Request,感谢您的支持

About

This is an nlp project, based on TF-IDF, to produce a text sorting system based on keywords.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages