直接导入数据，问答无法读取 #430

jerryHo123 · 2025-03-20T07:30:25Z

现在有业务场景，只想用kag智能问答功能，将外部结构化数据用KGWriter导入neo4j，随后进行问答测试，发现走图谱检索都是返回空，chunk检索也为空(没有chunk数据，这是正常)，最后回答都是文档没有提供有关信息。想请问这是什么原因，必须要走build过程才能问答吗？？

thundax-lyp · 2025-03-20T08:36:06Z

现在有业务场景，只想用kag智能问答功能，将外部结构化数据用KGWriter导入neo4j，随后进行问答测试，发现走图谱检索都是返回空，chunk检索也为空(没有chunk数据，这是正常)，最后回答都是文档没有提供有关信息。想请问这是什么原因，必须要走build过程才能问答吗？？

镜像中的KAG没有更新。看这个Issue 429。可以尝试自己更新Container里的KAG

jerryHo123 · 2025-03-20T08:47:44Z

现在有业务场景，只想用kag智能问答功能，将外部结构化数据用KGWriter导入neo4j，随后进行问答测试，发现走图谱检索都是返回空，chunk检索也为空(没有chunk数据，这是正常)，最后回答都是文档没有提供有关信息。想请问这是什么原因，必须要走build过程才能问答吗？？

镜像中的KAG没有更新。看这个Issue 429。可以尝试自己更新Container里的KAG

我用的是开发者模式哦

jerryHo123 · 2025-03-20T08:49:04Z

现在有业务场景，只想用kag智能问答功能，将外部结构化数据用KGWriter导入neo4j，随后进行问答测试，发现走图谱检索都是返回空，chunk检索也为空(没有chunk数据，这是正常)，最后回答都是文档没有提供有关信息。想请问这是什么原因，必须要走build过程才能问答吗？？

镜像中的KAG没有更新。看这个Issue 429。可以尝试自己更新Container里的KAG

thundax-lyp · 2025-03-20T08:59:50Z

现在有业务场景，只想用kag智能问答功能，将外部结构化数据用KGWriter导入neo4j，随后进行问答测试，发现走图谱检索都是返回空，chunk检索也为空(没有chunk数据，这是正常)，最后回答都是文档没有提供有关信息。想请问这是什么原因，必须要走build过程才能问答吗？？

镜像中的KAG没有更新。看这个Issue 429。可以尝试自己更新Container里的KAG

提交代码和数据，来调试下

jerryHo123 · 2025-03-20T09:22:34Z

现在有业务场景，只想用kag智能问答功能，将外部结构化数据用KGWriter导入neo4j，随后进行问答测试，发现走图谱检索都是返回空，chunk检索也为空(没有chunk数据，这是正常)，最后回答都是文档没有提供有关信息。想请问这是什么原因，必须要走build过程才能问答吗？？

镜像中的KAG没有更新。看这个Issue 429。可以尝试自己更新Container里的KAG

提交代码和数据，来调试下

就比如我只在图里导入 A-拜访->B，这样一个关系，然后问 A拜访过B吗，我看日志get_spo(s=s1:人物[A],p=p1:拜访,o=o1:人物[B],p.edge_type=拜访)的返回结果是空的。如果我将“A拜访过B”这样一个描述文本用kag build进图谱，再提同样一个问题，get_spo就有返回了，难道必须要有chunk吗

thundax-lyp · 2025-03-20T10:07:40Z

试试把SPO绑定到一个虚拟文本，注意Node的类型用LLM获取一下。

def buildKB(file_path):
    from kag.common.conf import KAG_CONFIG

    project_id = KAG_CONFIG.all_config["project"]["id"]
    writer = KGWriter(project_id=project_id)

    chunk_id = '6b3c0b184bde4292725e1b260bb54f802276dad5e18962a646d7e9facaa733a9'
    nodes: List[Node] = [
        Node('周杰伦', '周杰伦', 'TestOnly.Others', {}),
        Node('周星驰', '周星驰', 'TestOnly.Others', {}),
        Node(chunk_id, '虚拟文本', 'TestOnly.Chunk', {
            'name': '虚拟文本',
            'content': '周杰伦拜访周星驰'
        }),
    ]

    edges: List[Edge] = [
        Edge('', nodes[0], nodes[1], '拜访', {}),
        Edge('', nodes[0], nodes[2], 'source', {}),
        Edge('', nodes[1], nodes[2], 'source', {}),
    ]

    sub_graph = SubGraph(nodes, edges)
    writer.invoke(sub_graph)

jerryHo123 · 2025-03-21T04:46:36Z

试试把SPO绑定到一个虚拟文本，注意Node的类型用LLM获取一下。

def buildKB(file_path):
from kag.common.conf import KAG_CONFIG

project_id = KAG_CONFIG.all_config["project"]["id"]
writer = KGWriter(project_id=project_id)

chunk_id = '6b3c0b184bde4292725e1b260bb54f802276dad5e18962a646d7e9facaa733a9'
nodes: List[Node] = [
    Node('周杰伦', '周杰伦', 'TestOnly.Others', {}),
    Node('周星驰', '周星驰', 'TestOnly.Others', {}),
    Node(chunk_id, '虚拟文本', 'TestOnly.Chunk', {
        'name': '虚拟文本',
        'content': '周杰伦拜访周星驰'
    }),
]

edges: List[Edge] = [
    Edge('', nodes[0], nodes[1], '拜访', {}),
    Edge('', nodes[0], nodes[2], 'source', {}),
    Edge('', nodes[1], nodes[2], 'source', {}),
]

sub_graph = SubGraph(nodes, edges)
writer.invoke(sub_graph)

我做了很多次测试
1.如果节点关系类似上述用对象直接writer创建的，问答中get_spo都没有返回(哪怕关联了虚拟chunk)
2.如果节点关系类似上述用对象直接writer创建的, 并且经过batch_vectorizer向量化，再用writer创建，get_spo就会有返回，智能问答匹配命中前提是需要将节点向量化
3.接着步骤2继续问答，周杰伦拜访过周星驰吗？get_spo返回 “周杰伦拜访周星驰”，图谱中已经明确包含了两者之间的拜访关系，但是返回却没有任何的输出，最终的answer只输出“周杰伦；周星驰”，没有任何参考价值,对于此该如何解决呢

thundax-lyp · 2025-03-21T07:23:17Z

试试把SPO绑定到一个虚拟文本，注意Node的类型用LLM获取一下。
def buildKB(file_path):
from kag.common.conf import KAG_CONFIG
project_id = KAG_CONFIG.all_config["project"]["id"]
writer = KGWriter(project_id=project_id)

chunk_id = '6b3c0b184bde4292725e1b260bb54f802276dad5e18962a646d7e9facaa733a9'
nodes: List[Node] = [
    Node('周杰伦', '周杰伦', 'TestOnly.Others', {}),
    Node('周星驰', '周星驰', 'TestOnly.Others', {}),
    Node(chunk_id, '虚拟文本', 'TestOnly.Chunk', {
        'name': '虚拟文本',
        'content': '周杰伦拜访周星驰'
    }),
]

edges: List[Edge] = [
    Edge('', nodes[0], nodes[1], '拜访', {}),
    Edge('', nodes[0], nodes[2], 'source', {}),
    Edge('', nodes[1], nodes[2], 'source', {}),
]

sub_graph = SubGraph(nodes, edges)
writer.invoke(sub_graph)
我做了很多次测试 1.如果节点关系类似上述用对象直接writer创建的，问答中get_spo都没有返回(哪怕关联了虚拟chunk) 2.如果节点关系类似上述用对象直接writer创建的, 并且经过batch_vectorizer向量化，再用writer创建，get_spo就会有返回，智能问答匹配命中前提是需要将节点向量化 3.接着步骤2继续问答，周杰伦拜访过周星驰吗？get_spo返回 “周杰伦拜访周星驰”，图谱中已经明确包含了两者之间的拜访关系，但是返回却没有任何的输出，最终的answer只输出“周杰伦；周星驰”，没有任何参考价值,对于此该如何解决呢

试试把数据导成domain_kg的形式

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

直接导入数据，问答无法读取 #430

直接导入数据，问答无法读取 #430

jerryHo123 commented Mar 20, 2025

thundax-lyp commented Mar 20, 2025

jerryHo123 commented Mar 20, 2025

jerryHo123 commented Mar 20, 2025

thundax-lyp commented Mar 20, 2025

jerryHo123 commented Mar 20, 2025

thundax-lyp commented Mar 20, 2025

jerryHo123 commented Mar 21, 2025

thundax-lyp commented Mar 21, 2025

直接导入数据，问答无法读取 #430

直接导入数据，问答无法读取 #430

Comments

jerryHo123 commented Mar 20, 2025

thundax-lyp commented Mar 20, 2025

jerryHo123 commented Mar 20, 2025

jerryHo123 commented Mar 20, 2025

thundax-lyp commented Mar 20, 2025

jerryHo123 commented Mar 20, 2025

thundax-lyp commented Mar 20, 2025

jerryHo123 commented Mar 21, 2025

thundax-lyp commented Mar 21, 2025