xlog-Archivist 是xLog-ArticleURLCrawler的改进版本,它不仅可以爬取URL,还能爬取内容、创作日期等信息并以json格式分别将每篇文章保存到对应的文件中,所有文章URL都会保存到url.txt。
制作这个程序的目的是为了更方便地将xlog博客上的文章添加到知识库中。由于Fast GPT不支持json文件,故使用txt文件后缀。由于国内网络原因,建议挂梯子使用。
本程序使用ChatGPT协助编写
-
克隆库到本地
git clone https://github.com/endercatone/xlog-Archivist.git
-
安装依赖
pip install requests
-
运行程序
python main.py
示例:
请输入博客的 URL:https://endercat.xlog.app 文章保存成功:在xLog上与ChatGPT对话文章保存成功:在博客上嵌入可以读取文章的ChatGPT 文章保存成功:免费给Telegram机器人接入GPT-4 文章保存成功:通过CSS修改文字文章保存成功:Chirper - AI的社区,禁止人类进入文章保存成功:在博客上使用黑条字文章保存成功:使用Python脚本检测OpenAi额度和模型文章保存成功:分享一些OpenAi API KEY 文章保存成功:更简单地为Arch linux或其衍生系统更换更快的镜像源文章保存成功:免费领取二级域名,使用ClouDNS! 所有文章保存完毕!
-
在
articles
目录找到文章的json文件
该项目使用 MIT 许可证。详细信息请参阅 LICENSE 文件。