Skip to content

AXERA-TECH/rag.axera

Repository files navigation

RAG.AXERA DEMO

rag_demo

项目说明

(hf) ➜  rag.axera git:(master) ✗ tree -L 2
.
├── assets
│   └── demo.png
├── config.py     # 配置 axmodel, tokenizer 文件路径
├── data
├── gui.py        # RAG 交互式程序 
├── index         # 文档编码向量索引保存位置
│   ├── docs.index
│   └── docs.pkl
├── llm_api.py    # llm 主程序 
├── models        # 下载地址: https://pan.baidu.com/s/1EbKKYO9nNUMwoSJtapuo6A?pwd=cthj
│   ├── Qwen2.5-1.5B-Instruct_axmodel
│   └── Qwen3-Embedding-0.6B_axmodel
├── pdf_sample    # 示例 pdf 文件
│   └── introduction.pdf
├── rag_engine.py # 文档向量编码程序 
├── README.md
├── requirements.txt
├── tokenizer
│   ├── Qwen2.5-1.5B-Instruct
│   └── Qwen3-Embedding-0.6B
└── utils
    └── infer_func.py

11 directories, 11 files

运行

AXCL 机器或 AX650 开发板上启动两个终端界面, 分别运行下面的命令:

python3 llm_api.py # 在 AX650 或 AXCL 开发板启动 llm 服务
python3 gui.py # 启动交互式界面

About

RAG demo based on AXera's AI chips

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages