该仓库目的是收集、整理基于知识图谱的中文问答系统的相关研究工作,实现一个基于知识图谱的中文问答系统
- code文件夹下存放问答模型,每一个模型是一个文件夹,用模型的名称命名
- data文件夹下存放问答数据集
- kg文件夹下存放知识图谱
- png文件夹下存放所需要的图片
- result文件夹下记录code文件夹下的每一个模型在data文件夹下的每一个数据集上的实验结果
- notebook文件夹下存放问答模型,每一个模型是一个文件夹,用模型的名称命名。与code文件夹不同的是notebook文件夹下的代码以notebook展示,尽可能的展示问答模型的细节
- kgclue文件夹存放KgCLUE评测榜的代码和实验记录
KgCLUE是一个大规模中文开源知识图谱问答项目,提供了评测榜。
该文件夹下的子文件夹以实验模型的名称命名,对应的README文件介绍了每一个实验模型以及评测分数
该文件夹下的子文件夹都是以模型名称命名,目前包括:
该文件夹下的子文件夹都是以QA数据集名称命名,目前包括:
- WebQSP
- nlpcc2018(官网:http://tcci.ccf.org.cn/conference/2018/taskdata.php,选择task7,Open Domain Question Answering,即可下载数据集。数据集包含知识图谱和问答数据)
该文件夹下的子文件是以知识图谱的名称命名,目前包括:
- fbwq_full(来源https://drive.google.com/file/d/1uWaavrpKKllVSQ73TTuLWPc4aqVvrkpx/view?usp=sharing,也就是[Embed-KGQA](https://github.com/malllabiisc/EmbedKGQA)给出的整理好的知识图谱)
- nlpcc2018(来源就是官网http://tcci.ccf.org.cn/conference/2018/taskdata.php中下载的知识图谱)
- PKU(北大的中文百科知识图谱。链接:https://pan.baidu.com/s/1Br8eU60t2fV4crtC2HOlSg 提取码:tvv1)
链接 | 说明 | 备注 |
---|---|---|
https://github.com/uma-pi1/kge/ | 专门用于KGE的仓库,实现了诸多KGE模型 | 代码看的有点懵 |
https://github.com/Sujit-O/pykg2vec | 另一个专门用于KGE的仓库,实现了诸多KGE模型 | 目前还不清楚和上个kge仓库哪个好用 |
https://github.com/facebookresearch/PyTorch-BigGraph | 专门针对超大规模知识图谱嵌入、存储以及应用的仓库 | |
https://github.com/facebookresearch/kbc | BigGraph中的一个子模块,专门实现了ComplEx模型 | 代码量简洁,很方便的实现ComplEx模型在FB15k和其他数据集的实验 |
链接 | 说明 | 备注 |
---|---|---|
https://github.com/malllabiisc/EmbedKGQA/ | ACL2020论文EmbedKGQA的源码 | |
https://github.com/shijx12/TransferNet | EMNLP2021论文TransferNet的源码 |
链接 | 说明 | 备注 |
---|---|---|
https://github.com/BDBC-KG-NLP/QA-Survey | 北航某个团队的项目,对问答系统的总结,包括各种任务问答(文本、图谱等)。 | 总结的相当全面,包括学术界和工业界 |
https://github.com/liuhuanyong/QAonMilitaryKG | 360某个NLP专家的代码,军事领域知识图谱问答系统。 | 这个专家的GitHub仓库很多都是关于知识图谱的 |
https://github.com/BshoterJ/awesome-kgqa | 该仓库主要记录了关于KGQA的一些资源,包括论文、比赛等 |
- Knowledge Graph Embedding: A Survey of Approaches and Applications
- A survey of embedding models of entities and relationships for knowledge graph completion
- Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings
- TransferNet: An Effective and Transparent Framework for Multi-hop Question Answering over Relation Graph
- PKU(北大的中文百科知识图谱。链接:https://pan.baidu.com/s/1Br8eU60t2fV4crtC2HOlSg 提取码:tvv1)
- nlpcc2018(官网:http://tcci.ccf.org.cn/conference/2018/taskdata.php 选择task7 Open Domain Question Answering,即可下载数据集。数据集包含知识图谱和问答数据)
- 思知知识图谱(地址:https://www.ownthink.com/docs/kg/)
- KgCLUE(地址:https://github.com/CLUEbenchmark/KgCLUE)
这四个是比较大的开放域知识图谱,此外还有一些垂类领域如军事、医学、法律等领域的知识图谱,这里不再介绍。
- ccks(https://github.com/pkumod/CKBQA/tree/master/data)
- nlpcc2018 (官网:http://tcci.ccf.org.cn/conference/2018/taskdata.php 选择task7 Open Domain Question Answering,即可下载数据集。数据集包含知识图谱和问答数据)
- KgCLUE(地址:https://github.com/CLUEbenchmark/KgCLUE)
尽量按照所列顺序阅读