Support extra documentation(类似于 cursor 的 @docs) #26
MissNanLan
started this conversation in
Ideas
Replies: 2 comments 1 reply
-
差不多这个思路,但细活很多。 html to markdown 有现成方案,不用手动解析。RAG 应该也有现成库可以做。 |
Beta Was this translation helpful? Give feedback.
1 reply
-
数据准备 应该优先查找 llms-full.txt https://llmstxt.org/ |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
我看了下 cursor 的@docs 功能,添加一个 线上 url 地址之后,可以自定义 @name

这里有两个问题
1、我们也要支持 @name 的功能吧,如果支持这部分数据存放在哪里呢?应该是本地吧
2、另外一个问题,我们只支持线上 url 地址么?
问了下 AI,实现本地 RAG 的主要流程
步骤一:数据准备
步骤二:调用大模型将 chunk 进行向量化
是不是所有的大模型都支持Emedding?如果不是,错误处理?
将每个 chunk 向量化,存入本地向量数据库(如 FAISS、Chroma、Milvus)。我们应该用哪种?还是说存 json
步骤三:向量数据库检索
用户输入问题后,将问题向量化,在向量库中检索相关的 chunk。
步骤四:调用大模型生成答案
将检索到的 chunk 作为上下文,拼接用户问题,输入到 askQuery
Beta Was this translation helpful? Give feedback.
All reactions