微型搜索引擎(基于关键词的文本排序检索系统)
对于给定文本库,用户提交检索关键词,在文本库中查询与检索关键词最相关的 k 个文本(例如 k=5),并根据文本与检索关键词的相关度,对这 k 个文本进行排序,将排序后的结果返回给用户。
(1)利用 TF-IDF 模型,为文本库中的文本创建索引(如倒排索引)
(2)用户输入的关键词可以是一个或多个
(3)对于返回的结果文本,需同时显示各检索关键词在结果文本中的出现 频度信息
(4)系统内支持返回结果文本的查看
TF-IDF
python
https://blog.csdn.net/Supreme7/article/details/106795878?spm=1001.2014.3001.5502
此项目有可扩展的功能,后续将抽空进行补充,
-
制作一个前端展示页面
类似于百度搜索的主页(大搜索框),比如使用VUE
-
制作一个后端API程序
推荐使用Flask或者django,实现API接口
-
补充数据集
本项目没有使用开源数据集,如您有找到适合本项目的数据集欢迎添加。
如果您有较高的技术水平并且愿意花费您宝贵的时间来支持本项目,您可以提交Pull Request,感谢您的支持