Skip to content

Latest commit

 

History

History
63 lines (39 loc) · 1.89 KB

README.md

File metadata and controls

63 lines (39 loc) · 1.89 KB

目录

  1. csdn文章抓取
  2. cnblog文章抓取
  3. csdn文章链接抓取
  4. 使用jar包执行

csdn 文章抓取

CSDN2mdService.java

convertAllBlogByUserName("ricohzhanglong"); // 作者名

基础版已完成,根据作者抓取所有文章
目前存在的问题

1、本地文件夹 TARGET_DIR 必须存在,未判空
2、文章标题特殊字符,会跳过,未做处理
3、对一些异常的处理,一次使用暂时凑合用吧

cnblog 文章抓取

CNBlog2mdService.java

convertAllBlogByUserName("lossingdawn"); // 作者名

基础版已完成,根据作者抓取所有文章
目前存在的问题

1、本地文件夹 TARGET_DIR 必须存在,未判空
2、文章标题特殊字符,会跳过,未做处理
3、对一些异常的处理,一次使用暂时凑合用吧

csdn 文章链接抓取

http://localhost:8002/tools/csdn4url
http://localhost:8002/tools/csdn4author

使用jar包执行

jar包地址 -> html2md-0.0.1-SNAPSHOT.jar
在jar包所在位置,执行命令
java -jar html2md-0.0.1-SNAPSHOT.jar
访问地址 http://localhost:8002/tools/csdn4author

导出页面.png

运行日志.png

导出日志.png

特殊字符.png

参考地址:
https://github.com/vector4wang/blog-export-quick