JSREP
diff --git a/‎.github/workflows/deploy-github-pages.yml
+38 b/‎.github/workflows/deploy-github-pages.yml
+38
diff --git a/‎README.md
+55-70 b/‎README.md
+55-70
diff --git a/‎docs/challenges/360网站卫士.yml
+61 b/‎docs/challenges/360网站卫士.yml
+61
diff --git a/‎docs/challenges/AWS WAF Bot Control.yml
+61 b/‎docs/challenges/AWS WAF Bot Control.yml
+61
diff --git a/‎docs/challenges/AkamaiBot管理器.yml
+61 b/‎docs/challenges/AkamaiBot管理器.yml
+61
@@ -0,0 +1,38 @@
+name: 部署GitHub Pages
+
+on:
+  push:
+    branches:
+      - main  # 或者是master，取决于你的主分支名称
+
+jobs:
+  build-and-deploy:
+    runs-on: ubuntu-latest
+    steps:
+      - name: 检出代码
+        uses: actions/checkout@v3
+        with:
+          persist-credentials: false # token将用于部署，因此我们不持久化凭证
+
+      - name: 设置Node.js环境
+        uses: actions/setup-node@v3
+        with:
+          node-version: '18' # 使用更新的Node.js版本
+          cache: 'npm'
+
+      - name: 安装依赖
+        run: npm ci
+
+      - name: 构建网站
+        run: npm run build # 在package.json中定义为tsc && vite build
+
+      - name: 部署到GitHub Pages
+        uses: JamesIves/github-pages-deploy-action@v4
+        with:
+          branch: gh-pages  # 部署到的分支
+          folder: dist      # Vite构建输出目录
+          clean: true       # 清理gh-pages分支上的旧文件
+          token: ${{ secrets.GITHUB_TOKEN }}  # GitHub自动提供的访问令牌
+
+      - name: 部署完成通知
+        run: echo "✅ 网站已成功部署到GitHub Pages！访问地址: https://jsrep.github.io/crawler-leetcode/" 
@@ -1,100 +1,85 @@
-# 爬虫技术挑战合集
+# LeetCode 爬虫挑战
 
-![GitHub stars](https://img.shields.io/github/stars/JSREP/crawler-leetcode?style=social)
-![GitHub forks](https://img.shields.io/github/forks/JSREP/crawler-leetcode?style=social)
-![GitHub issues](https://img.shields.io/github/issues/JSREP/crawler-leetcode)
-![GitHub license](https://img.shields.io/github/license/JSREP/crawler-leetcode)
+[![部署GitHub Pages](https://github.com/JSREP/crawler-leetcode/actions/workflows/deploy-github-pages.yml/badge.svg)](https://github.com/JSREP/crawler-leetcode/actions/workflows/deploy-github-pages.yml)
 
-## 📖 项目简介
+这个仓库收集了各种网站的爬虫挑战案例，展示了不同类型的反爬虫技术和解决方案。项目使用React+TypeScript开发，通过GitHub Pages进行部署。
 
-爬虫挑战平台是一个致力于帮助开发者掌握网络爬虫技术的开源项目。通过提供各类实际爬虫挑战，从基础数据提取到复杂反爬机制突破，帮助开发者提升数据采集能力。
+**在线访问**: [https://jsrep.github.io/crawler-leetcode/](https://jsrep.github.io/crawler-leetcode/)
 
-**🔗 访问在线网站: [https://jsrep.github.io/crawler-leetcode/](https://jsrep.github.io/crawler-leetcode/)**
+## 项目结构
 
-## ✨ 主要功能
-
-- 🔍 **多样化爬虫挑战**: 从初级到高级的各类爬虫技术难题
-- 🏷️ **技术分类**: 按照爬虫技术、目标网站和难度等多维度分类
-- 📝 **详细解决方案**: 提供爬虫实现思路、代码示例和反爬绕过技巧
-- 🌐 **中英文支持**: 完整的双语界面
-- 🤝 **社区贡献**: 支持用户提交新的爬虫挑战
-- 📊 **挑战统计**: 直观展示各类挑战的难度分布
-
-## 🚀 快速开始
-
-### 在线使用
+```
+crawler-leetcode/
+├── .github/             # GitHub相关配置
+│   └── workflows/       # GitHub Actions工作流配置
+├── docs/                # 文档和挑战定义
+│   └── challenges/      # 爬虫挑战YAML定义文件
+├── public/              # 静态资源
+├── src/                 # 源代码
+│   ├── components/      # React组件
+│   ├── pages/           # 页面组件
+│   ├── plugins/         # 项目插件
+│   ├── utils/           # 工具函数
+│   └── App.tsx          # 应用入口
+├── package.json         # 项目依赖
+└── vite.config.ts       # Vite配置
+```
 
-直接访问我们的官方网站：[https://jsrep.github.io/crawler-leetcode/](https://jsrep.github.io/crawler-leetcode/)
+## 爬虫挑战
 
-### 本地开发
+所有爬虫挑战都定义在 `docs/challenges/` 目录中，使用YAML格式描述挑战的特点、难度和解决方案。详细的贡献指南请参考 [挑战贡献指南](docs/challenges/README.md)。
 
-#### 前置条件
+目前包含的挑战类型：
 
-- Node.js 18+
-- npm 或 yarn
+- 验证码挑战（如reCAPTCHA、hCaptcha）
+- 浏览器指纹识别
+- JavaScript混淆与加密
+- API限流与保护
+- WebAssembly保护
+- 设备指纹和行为分析
 
-#### 安装步骤
+## 本地开发
 
-1. 克隆仓库
 ```bash
+# 克隆项目
 git clone https://github.com/JSREP/crawler-leetcode.git
 cd crawler-leetcode
-```
 
-2. 安装依赖
-```bash
+# 安装依赖
 npm install
-# 或
-yarn install
-```
 
-3. 启动开发服务器
-```bash
+# 启动开发服务器
 npm run dev
-# 或
-yarn dev
-```
 
-4. 构建生产版本
-```bash
+# 构建项目
 npm run build
-# 或
-yarn build
-```
-
-## 📋 项目使命
 
-我们的使命是提供结构化的网络爬虫技术和反爬机制突破学习资源，帮助开发者提高数据采集能力。通过实际挑战，让开发者能够:
-
-- 学习并掌握各种爬虫技术
-- 理解常见的反爬机制及其突破方法
-- 提升解决复杂网络数据采集问题的能力
-
-## 🛠 技术栈
-
-- **前端框架**: React + TypeScript
-- **UI组件库**: Ant Design
-- **状态管理**: React Hooks
-- **数据获取**: REST API + Axios
+# 预览构建结果
+npm run preview
+```
 
-## 📋 贡献指南
+## 自动部署
 
-我们欢迎社区成员为项目做出贡献！您可以通过以下方式参与：
+本项目配置了GitHub Actions自动部署流程，当代码推送到主分支时，会自动构建并部署到GitHub Pages：
 
-1. **提交爬虫挑战**: 通过平台的贡献功能，提交新的爬虫技术挑战
-2. **报告Bug**: 在GitHub Issues中提交问题报告
-3. **功能建议**: 提出新功能或改进意见
-4. **代码贡献**: Fork仓库，提交Pull Request
+1. 检出代码
+2. 设置Node.js环境
+3. 安装依赖
+4. 构建项目
+5. 部署到gh-pages分支
 
-## 📄 许可证
+你可以在 `.github/workflows/deploy-github-pages.yml` 文件中查看完整的工作流配置。
 
-本项目采用 [MIT 许可证](./LICENSE)
+## 贡献指南
 
-## 📧 联系我们
+1. Fork本仓库
+2. 创建新分支 (`git checkout -b feature/new-challenge`)
+3. 提交更改 (`git commit -m 'Add new challenge: XXX'`)
+4. 推送到分支 (`git push origin feature/new-challenge`)
+5. 创建Pull Request
 
-- **邮箱**: [email protected]
-- **GitHub**: [JSREP/crawler-leetcode](https://github.com/JSREP/crawler-leetcode)
+欢迎贡献新的爬虫挑战案例、改进文档或代码！
 
----
+## 许可证
 
-如有任何问题或建议，欢迎通过 [GitHub Issues](https://github.com/JSREP/crawler-leetcode/issues) 联系我们。
+MIT
@@ -0,0 +1,61 @@
+# 爬虫挑战合集元数据配置文件
+# 用于在数据结构变更时进行版本兼容性校验，必须为整数
+# 当数据结构发生不兼容变更时需递增版本号
+version: 1
+
+# 爬虫挑战合集定义
+challenges:
+  # 单个爬虫挑战定义，每个挑战都有一个唯一的id标识，id是必须的，ID必须是一个整数，并且全局唯一
+  - id: 12
+    # 可以给ID设置一个别名，用于在列表中显示，ID别名也可以用于访问详情页
+    id-alias: waf-360
+    # 挑战标签系统（数组格式，选填）
+    # 用于分类和筛选，支持多个标签
+    tags:
+      - waf
+      - signature-detection
+
+    # 挑战目标网站类型（枚举值，必填）
+    # 允许值: Web / Android / iOS
+    platform: Web
+
+    # 挑战名称（必填）
+    # 作为列表和详情页的标题，建议控制在30个字符以内
+    name: 360网站卫士
+    
+    # 挑战英文名称（选填）
+    # 当用户选择英文语言时显示，不提供时将使用中文名称
+    name_en: 360 Website Guard
+
+    # 挑战难度评级（整数类型，必填）
+    # 取值范围: 1-5，1表示最简单，5表示最难
+    # 前端展示时会转换为星级显示
+    difficulty-level: 3
+
+    # Markdown格式详细描述（必选）
+    # 当需要复杂排版时使用
+    # 与description-markdown-path字段二选一使用，必须选其中一种方式提供描述
+    description-markdown: |
+      360推出的Web应用防火墙，包含爬虫防护模块。
+      
+      特点：基于特征签名的爬虫检测，防护DDoS与CC攻击。
+      
+      破解难点：需要绕过请求特征检测，模拟正常用户访问模式。
+    
+    # 挑战目标网站URL的base64编码
+    base64-url: aHR0cHM6Ly9mdWx1LmMzNjAuY24v
+
+    # 链接有效性状态（布尔值）
+    # 标记挑战链接是否失效，true表示已失效
+    # 失效挑战会在前端显示警告标志
+    is-expired: false
+
+    # 创建时间（ISO 8601格式）
+    # 记录挑战首次添加时间，格式: YYYY-MM-DD HH:mm:ss
+    # 时区默认为UTC+8
+    create-time: 2025-03-01 00:00:11
+
+    # 最后更新时间（ISO 8601格式）
+    # 记录挑战最后修改时间，格式与create-time相同
+    # 当任何字段变更时需同步更新此时间
+    update-time: 2025-03-01 00:00:11 
@@ -0,0 +1,61 @@
+# 爬虫挑战合集元数据配置文件
+# 用于在数据结构变更时进行版本兼容性校验，必须为整数
+# 当数据结构发生不兼容变更时需递增版本号
+version: 1
+
+# 爬虫挑战合集定义
+challenges:
+  # 单个爬虫挑战定义，每个挑战都有一个唯一的id标识，id是必须的，ID必须是一个整数，并且全局唯一
+  - id: 19
+    # 可以给ID设置一个别名，用于在列表中显示，ID别名也可以用于访问详情页
+    id-alias: aws-bot
+    # 挑战标签系统（数组格式，选填）
+    # 用于分类和筛选，支持多个标签
+    tags:
+      - managed-rules
+      - rate-based-rules
+
+    # 挑战目标网站类型（枚举值，必填）
+    # 允许值: Web / Android / iOS
+    platform: Web
+
+    # 挑战名称（必填）
+    # 作为列表和详情页的标题，建议控制在30个字符以内
+    name: AWS WAF Bot Control
+    
+    # 挑战英文名称（选填）
+    # 当用户选择英文语言时显示，不提供时将使用中文名称
+    name_en: AWS WAF Bot Control
+
+    # 挑战难度评级（整数类型，必填）
+    # 取值范围: 1-5，1表示最简单，5表示最难
+    # 前端展示时会转换为星级显示
+    difficulty-level: 3
+
+    # Markdown格式详细描述（必选）
+    # 当需要复杂排版时使用
+    # 与description-markdown-path字段二选一使用，必须选其中一种方式提供描述
+    description-markdown: |
+      AWS托管的爬虫控制规则集，支持基于请求特征的检测。
+      
+      特点：利用预配置的托管规则和基于速率的规则，灵活配置爬虫防护策略。
+      
+      破解难点：需要绕过复杂的规则组合，处理基于速率的限制。
+    
+    # 挑战目标网站URL的base64编码
+    base64-url: aHR0cHM6Ly9hd3MuYW1hem9uLmNvbS8=
+
+    # 链接有效性状态（布尔值）
+    # 标记挑战链接是否失效，true表示已失效
+    # 失效挑战会在前端显示警告标志
+    is-expired: false
+
+    # 创建时间（ISO 8601格式）
+    # 记录挑战首次添加时间，格式: YYYY-MM-DD HH:mm:ss
+    # 时区默认为UTC+8
+    create-time: 2025-03-01 00:00:18
+
+    # 最后更新时间（ISO 8601格式）
+    # 记录挑战最后修改时间，格式与create-time相同
+    # 当任何字段变更时需同步更新此时间
+    update-time: 2025-03-01 00:00:18 
@@ -0,0 +1,61 @@
+# 爬虫挑战合集元数据配置文件
+# 用于在数据结构变更时进行版本兼容性校验，必须为整数
+# 当数据结构发生不兼容变更时需递增版本号
+version: 1
+
+# 爬虫挑战合集定义
+challenges:
+  # 单个爬虫挑战定义，每个挑战都有一个唯一的id标识，id是必须的，ID必须是一个整数，并且全局唯一
+  - id: 5
+    # 可以给ID设置一个别名，用于在列表中显示，ID别名也可以用于访问详情页
+    id-alias: akamai-bot
+    # 挑战标签系统（数组格式，选填）
+    # 用于分类和筛选，支持多个标签
+    tags:
+      - ai-detection
+      - behavior-analysis
+
+    # 挑战目标网站类型（枚举值，必填）
+    # 允许值: Web / Android / iOS
+    platform: Web
+
+    # 挑战名称（必填）
+    # 作为列表和详情页的标题，建议控制在30个字符以内
+    name: Akamai Bot Manager
+    
+    # 挑战英文名称（选填）
+    # 当用户选择英文语言时显示，不提供时将使用中文名称
+    name_en: Akamai Bot Manager
+
+    # 挑战难度评级（整数类型，必填）
+    # 取值范围: 1-5，1表示最简单，5表示最难
+    # 前端展示时会转换为星级显示
+    difficulty-level: 4
+
+    # Markdown格式详细描述（必选）
+    # 当需要复杂排版时使用
+    # 与description-markdown-path字段二选一使用，必须选其中一种方式提供描述
+    description-markdown: |
+      Akamai的AI驱动爬虫检测系统，可识别自动化工具的行为模式。
+      
+      特点：利用机器学习分析用户行为，识别异常访问模式。
+      
+      破解难点：需要模拟真实用户的浏览行为和交互方式，突破AI行为分析。
+    
+    # 挑战目标网站URL的base64编码
+    base64-url: aHR0cHM6Ly93d3cuYWthbWFpLmNvbS8=
+
+    # 链接有效性状态（布尔值）
+    # 标记挑战链接是否失效，true表示已失效
+    # 失效挑战会在前端显示警告标志
+    is-expired: false
+
+    # 创建时间（ISO 8601格式）
+    # 记录挑战首次添加时间，格式: YYYY-MM-DD HH:mm:ss
+    # 时区默认为UTC+8
+    create-time: 2025-03-01 00:00:04
+
+    # 最后更新时间（ISO 8601格式）
+    # 记录挑战最后修改时间，格式与create-time相同
+    # 当任何字段变更时需同步更新此时间
+    update-time: 2025-03-01 00:00:04