Skip to content

本仓库是一个自动化Nintendo Switch游戏爬虫,每天自动抓取最新Switch相关新闻并生成结构化数据报告。

License

Notifications You must be signed in to change notification settings

wooluo/Crawl_Switch

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Nintendo Switch 新闻自动爬虫 🎮

GitHub Actions GitHub last commit GitHub License

项目简介

本仓库是一个自动化Nintendo Switch新闻爬虫,每天自动抓取最新Switch相关新闻并生成结构化数据报告。

查看工作流运行状态

✨ 功能特性

  • 定时自动运行:每天UTC时间9:00自动执行
  • 多格式输出
    • results_*.json - 结构化数据
    • switch_news_*.md - 格式化新闻报告
  • 浏览器自动化:使用Playwright处理动态内容
  • 自动提交更新:结果自动推送至仓库

🛠 技术栈

技术 用途
Python 3.10 主程序语言
Playwright 浏览器自动化
BeautifulSoup4 HTML解析
GitHub Actions 自动化调度

⚙️ 工作流程

  1. 定时触发:每天UTC 9:00自动运行
  2. 环境准备
    • 安装Python 3.10
    • 配置Playwright浏览器环境
  3. 数据采集
    • 执行crawler.py脚本
  4. 结果处理
    • 生成JSON和Markdown文件
  5. 自动提交
    • 检测变更并提交更新

📂 文件结构

Crawl_Switch/
├── .github/
│   └── workflows/
│       └── switch-crawler.yml  # GitHub Actions配置
├── crawler.py                  # 主爬虫脚本
├── results_YYYY-MM-DD.json     # JSON格式数据
├── switch_news_YYYY-MM-DD.md   # Markdown格式报告
└── requirements.txt            # 依赖列表

🚀 使用方式

自动使用

手动运行

git clone https://github.com/wooluo/Crawl_Switch.git
cd Crawl_Switch
pip install -r requirements.txt
python -m playwright install
python crawler.py

🤝 参与贡献

欢迎通过Issue或PR提交改进建议

📜 许可证

MIT License © 2024 wooluo

About

本仓库是一个自动化Nintendo Switch游戏爬虫,每天自动抓取最新Switch相关新闻并生成结构化数据报告。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  

Languages