Skip to content
This repository has been archived by the owner on May 25, 2024. It is now read-only.
/ xlog-Archivist Public archive

Xlog-Archivist是一个用于从基于xlog的博客中爬取文章的工具

License

Notifications You must be signed in to change notification settings

endercatone/xlog-Archivist

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

xlog-Archivist

xlog-Archivist 是xLog-ArticleURLCrawler的改进版本,它不仅可以爬取URL,还能爬取内容、创作日期等信息并以json格式分别将每篇文章保存到对应的文件中,所有文章URL都会保存到url.txt。

image-20230521021418044

制作这个程序的目的是为了更方便地将xlog博客上的文章添加到知识库中。由于Fast GPT不支持json文件,故使用txt文件后缀。由于国内网络原因,建议挂梯子使用。

在博客上嵌入可以读取文章的ChatGPT

本程序使用ChatGPT协助编写

使用方法

  1. 克隆库到本地

    git clone https://github.com/endercatone/xlog-Archivist.git
  2. 安装依赖

    pip install requests
  3. 运行程序

    python main.py

    示例:

    请输入博客的 URL:https://endercat.xlog.app
    文章保存成功:在xLog上与ChatGPT对话文章保存成功:在博客上嵌入可以读取文章的ChatGPT
    文章保存成功:免费给Telegram机器人接入GPT-4
    文章保存成功:通过CSS修改文字文章保存成功:Chirper - AI的社区,禁止人类进入文章保存成功:在博客上使用黑条字文章保存成功:使用Python脚本检测OpenAi额度和模型文章保存成功:分享一些OpenAi API KEY
    文章保存成功:更简单地为Arch linux或其衍生系统更换更快的镜像源文章保存成功:免费领取二级域名,使用ClouDNS!
    所有文章保存完毕!
    
  4. articles目录找到文章的json文件

许可证

该项目使用 MIT 许可证。详细信息请参阅 LICENSE 文件。

About

Xlog-Archivist是一个用于从基于xlog的博客中爬取文章的工具

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages