关于文本切分的技术问题 #1420
Answered
by
c121914yu
maquannene
asked this question in
Q&A
关于文本切分的技术问题
#1420
-
看了 FastGPT 关于文本切分部分的代码,目前最新版本使用的是自己实现的 splitText2Chunks 这个方法进行切分,想请教一下为什么这里选择自己实现 split 而不是使用 langchain 提供的 split? |
Beta Was this translation helpful? Give feedback.
Answered by
c121914yu
May 9, 2024
Replies: 2 comments 2 replies
-
为什么要用 langchain 的呢?他有什么特点么?有什么优势么? |
Beta Was this translation helpful? Give feedback.
0 replies
-
当然,对我而已,最核心的是因为我觉得 langchain 的split没啥特色,而且不方便定制,不如自己写一份可以任意适配。 尤其是,有时候 read file 时候加入一些特殊符号时候,可以进行一些特殊的分割操作。 |
Beta Was this translation helpful? Give feedback.
2 replies
Answer selected by
maquannene
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
当然,对我而已,最核心的是因为我觉得 langchain 的split没啥特色,而且不方便定制,不如自己写一份可以任意适配。 尤其是,有时候 read file 时候加入一些特殊符号时候,可以进行一些特殊的分割操作。