easy-rag

一个简单的RAG项目，核心代码在app文件夹中

各个模块介绍

retriever.py

Retriever这个类的核心功能可以抽象为一个模型：一个字符串列表corpus，一个字符串query，返回corpus中与query最相关的k个元素。

检索方式

bm25

实现方式：

    def bm25_retrieval(self, query, n=10):

        # 此处中文使用jieba分词
        query = jieba.lcut(query)  # 分词
        res = self.bm25.get_top_n(query, self.corpus, n=n)
        return res

原理

TODO

emb_retrieval

    def emb_retrieval(self, query, k=10):

        search_docs = self.db.similarity_search(query, k=k)
        res = [doc.page_content for doc in search_docs]
        return res

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
app		app
bm25		bm25
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
rager.py		rager.py
requirements.txt		requirements.txt
run.py		run.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

easy-rag

各个模块介绍

retriever.py

检索方式

bm25

emb_retrieval

About

Releases

Packages

Languages

morandave/easy-rag

Folders and files

Latest commit

History

Repository files navigation

easy-rag

各个模块介绍

retriever.py

检索方式

bm25

emb_retrieval

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages