Skip to content

Latest commit

 

History

History

html2md

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 

目录

  1. csdn文章抓取
  2. cnblog文章抓取
  3. csdn文章链接抓取
  4. 使用jar包执行

csdn 文章抓取

CSDN2mdService.java

convertAllBlogByUserName("ricohzhanglong"); // 作者名

基础版已完成,根据作者抓取所有文章
目前存在的问题

1、本地文件夹 TARGET_DIR 必须存在,未判空
2、文章标题特殊字符,会跳过,未做处理
3、对一些异常的处理,一次使用暂时凑合用吧

cnblog 文章抓取

CNBlog2mdService.java

convertAllBlogByUserName("lossingdawn"); // 作者名

基础版已完成,根据作者抓取所有文章
目前存在的问题

1、本地文件夹 TARGET_DIR 必须存在,未判空
2、文章标题特殊字符,会跳过,未做处理
3、对一些异常的处理,一次使用暂时凑合用吧

csdn 文章链接抓取

http://localhost:8002/tools/csdn4url
http://localhost:8002/tools/csdn4author

使用jar包执行

jar包地址 -> html2md-0.0.1-SNAPSHOT.jar
在jar包所在位置,执行命令
java -jar html2md-0.0.1-SNAPSHOT.jar
访问地址 http://localhost:8002/tools/csdn4author

导出页面.png

运行日志.png

导出日志.png

特殊字符.png

参考地址:
https://github.com/vector4wang/blog-export-quick