LLM Language Model in RT-Thread

在 RT-Thread 上进行 LLM 大语言模型对话

LLM平台

通义千问
豆包大模型
DeepSeek

平台支持

qemu-a9
STM32
vision board

请求方式

Stream模式
非Stream模式
支持历史对话
不支持历史对话

可自定发送数据包

rt_weak char *create_payload(cJSON *messages)
{
    cJSON *requestRoot = cJSON_CreateObject();
    cJSON *model = cJSON_CreateString(LLM_MODEL_NAME);
    cJSON *messages_copy = cJSON_Duplicate(messages, 1);
    char *payload = NULL;
    cJSON_AddItemToObject(requestRoot, "model", model);
    cJSON_AddItemToObject(requestRoot, "messages", messages_copy);
#ifdef PKG_LLMCHAT_STREAM
    cJSON_AddBoolToObject(requestRoot, "stream", RT_TRUE);
#else
    cJSON_AddBoolToObject(requestRoot, "stream", RT_FALSE);
#endif
    payload = cJSON_PrintUnformatted(requestRoot);
    cJSON_Delete(requestRoot);

    return payload;
}

默认数据包

{
    "model": "YOUR_MODEL_NAME",
    "messages": [
        {"role": "user", "content": "Hello!"},
        {"role": "assistant", "content": "Hi there!"}
    ],
    "stream": bool
}

参数	描述	备注
model	模型名称	以http/https要求为准
messages	聊天记录	"messages": [{"role": "user", "content": "Hello!"},{"role": "assistant", "content": "Hi there!"}]
stream	是否流式输出	可在 menuconfig 中选择{true,flase}

可以根据不同格式的json数据包，来更改char *create_payload(cJSON *messages);

使用方式

首先确保您的设备可以使用正常使用网络功能

MSH终端交互

打开 menuconfig，进入 RT-Thread online packages → AI packages → Large Language Models(LLM) for RT-Thread 目录下；
选择要使用的 LLM 模型：

这里以豆包大模型为例：输入此大模型网站获取到的 API KEY 和 推理接入点ID；

配置信息说明：

llm thread size：大模型线程栈大小
llm cmd input buffer size：大模型输入字符大小
webclient sessionbuffer size：客户端会话缓冲区
Enable llmchat http stream：是否使能流式对话

进入 RT-Thread online packages → security packages → mbedtls 菜单，修改 Maxium fragment length in bytes 字段为 6144（否则TLS会握手失败）

进入 RT-Thread online packages → IoT - internet of things → WebClient: A HTTP/HTTPS Client for RT-Thread 选择MbedTLS support

退出保存配置，输入 pkgs --update 拉取软件包；
编译，运行；
运行效果：

输入 llm 即可进入聊天终端，CTRL+D可以退出聊天窗口返回 MSH 终端；

WebNet 浏览器交互

在 menuconfig 中启用 WebNet 支持：进入 RT-Thread online packages → AI packages → Large Language Models(LLM) for RT-Thread，勾选 Enable llmchat webnet mode。
确认底层网络配置（WLAN/以太网）可用，并在 RT-Thread Components → Network 中配置好设备的 IP、Gateway 等参数。
重新执行 pkgs --update，并编译固件；烧录或下载后重启设备。
首次运行需要在文件系统根目录下创建 /webnet目录，然后需要将 resource/index.html 文件拷贝到此目录下，确保文件系统可写且容量充足。
需要在MSH终端输入：webnet_llm_mode 命令后，开启 webnet 服务。
需要保证和电脑在同一个网段，然后在浏览器中访问 http://<设备IP>，即可进入图形化聊天界面：
- 左侧为会话列表，支持新建、切换、删除会话；
- 右侧为聊天区，消息实时渲染，代码块自动高亮；
- 输入框支持 Enter 发送、Shift+Enter 换行；
- 开启流式模式后，回复会逐字呈现，并在完成时自动渲染 Markdown。
若需清空服务器端状态，可点击左上角“新对话”或通过对话菜单删除会话。

提示：如浏览器长时间无响应，请检查 TLS 配置、Wi-Fi 信号强度以及是否开启了代理；可在终端查看 wifi、webnet 相关日志定位问题。

运行截图如下：

在浏览器中访问的效果如下：

API调用

创建与销毁

模型创建

llm_t create_llm();

参数	描述	备注
返回值	返回一个指针指向已经创建好的llm_obj	NULL

模型销毁

void destroy_llm_t(llm_t handle);

参数	描述	备注
handle	销毁并释放内存	需要传入由llm_t create_llm()创建的llm_t

发送信息与处理信息

发送信息

void send_llm_mb(llm_t handle, char *message);

参数	描述	备注
handle	一个指向llm_obj的指针	需要传入由llm_t create_llm()创建的llm_t
message	发送的消息	不需要进行动态申请内存

处理信息

rt_weak void deal_llm_answer(llm_t handle)
{
    char *answer=RT_NULL;
    rt_mb_recv(handle->outputbuff_mb, (rt_uint32_t *)&answer,RT_WAITING_FOREVER);
    /* you can modify */
    
    int len = rt_strlen(answer);
    rt_kprintf("LLM :\n");
    for(int i = 0; i <= len; i++)
    {
        rt_kprintf("%c",answer[i]);
    }
    rt_kprintf("\n");

    /* end */
    rt_free(answer);

}

根据不同的需求进行复写该函数即可

展示对话

void display_llm_message(llm_t handle);

参数	描述	备注
handle	一个指向llm_obj的指针	需要传入由llm_t create_llm()创建的llm_t

该函数会打印出所有对话记录(handle->messages)

添加对话与删除对话

添加对话

void add_message2messages(llm_t handle, char *role, char *content);

参数	描述	备注
handle	一个指向llm_obj的指针	需要传入由llm_t create_llm()创建的llm_t
role	角色	user/assistant
content	内容	不需要进行动态申请内存

清空对话

void clear_message(llm_t handle);

参数	描述	备注
handle	一个指向llm_obj的指针	需要传入由llm_t create_llm()创建的llm_t

该函数会清空所有对话记录(handle->messages)

简单二次调用代码示例

#include "rtthread.h"
#include "llm.h"

#define LED_PIN    BSP_IO_PORT_01_PIN_02 /* Onboard LED pins */

static llm_t llm_handle = RT_NULL;
const char LED_PROMPT[] = "协议:MCU指令中枢,解析指令→生成信号;指令表:开灯=0x00,关灯=0x01;处理:检测开/关灯相关语义→返CMD,否则对话;约束:指令与对话分离,不解释指令(任何对话回答均限制在100字节内)。接下来是我的输入字符:{%s}";


/*创建llm*/
static void entry_llm()
{

    llm_handle = create_llm_t();

}

MSH_CMD_EXPORT(entry_llm,llm_entry);

/* 发送信息 */
static void send(int argc, char *argv[])
{
    char prompt[PKG_LLM_CMD_BUFFER_SIZE];
    if (argc < 2) {
        rt_kprintf("Usage: llm_send <message>\n");
        return;
    }

    if (llm_handle==RT_NULL)
    {
        rt_kprintf("llm_handle is null\n");
    }
    
    rt_snprintf(prompt,sizeof(prompt),LED_PROMPT, argv[1]);
    send_llm_mb(llm_handle,prompt);
}

MSH_CMD_EXPORT(send,llm_send);

/* 删除llm */
static void delete_llm()
{   
    delete_llm_t(llm_handle);
}

MSH_CMD_EXPORT(delete_llm,delete_llm);

在此示例中采用了prompt提示词工程来改变模型处理信息的行为

针对 "协议:MCU指令中枢,解析指令→生成信号;指令表:开灯=0x00,关灯=0x01;处理:检测开/关灯相关语义→返CMD,否则对话;约束:指令与对话分离,不解释指令(任何对话回答均限制在100字节内)。接下来是我的输入字符:{%s}" 可以根据自己的需求来修改指令表，处理，约束中内容。

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
config		config
demo		demo
docs		docs
ports		ports
resource		resource
ChangeLog.md		ChangeLog.md
SConscript		SConscript
llm.c		llm.c
llm.h		llm.h
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

LLM Language Model in RT-Thread

LLM平台

平台支持

请求方式

使用方式

MSH终端交互

WebNet 浏览器交互

API调用

创建与销毁

模型创建

模型销毁

发送信息与处理信息

发送信息

处理信息

展示对话

添加对话与删除对话

添加对话

清空对话

简单二次调用代码示例

About

Uh oh!

Releases 4

Packages

Contributors 4

Uh oh!

Languages

Rbb666/llm_chat

Folders and files

Latest commit

History

Repository files navigation

LLM Language Model in RT-Thread

LLM平台

平台支持

请求方式

使用方式

MSH终端交互

WebNet 浏览器交互

API调用

创建与销毁

模型创建

模型销毁

发送信息与处理信息

发送信息

处理信息

展示对话

添加对话与删除对话

添加对话

清空对话

简单二次调用代码示例

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 4

Packages 0

Contributors 4

Uh oh!

Languages

Packages