📢 重要提示:本项目为七牛云 2025 年 1024 Hackathon 作品,详情请查看 HACKATHON.md
本项目旨在自动根据小说内容生成动漫,通过AI技术实现从文本到视觉和音频的转换。
This project aims to automatically generate anime from novel content through AI technology, converting text to visual and audio formats.
- 角色一致性 / Character Consistency: 同一小说中的角色在整个动漫中保持视觉一致性
- 图文结合 / Image + Text: 生成静态场景图配合文字说明
- 语音合成 / Voice Synthesis: 为角色对话生成语音
- 自动化流程 / Automated Pipeline: 从小说解析到最终动漫生成的完整自动化流程
本系统是一个简单的CLI工具,采用六阶段顺序处理流程:
小说文本 → Stage 1 → Stage 2 → Stage 3 → Stage 4 → Stage 5 → Stage 6 → 完整视频
- 语义理解与故事结构化 ✅ - 从小说文本中提取结构化信息(JSON)
- 世界观与基调确立 ✅ - 建立视觉风格和世界观设定(JSON)
- 角色与视觉资产生成 ✅ - 生成一致性角色和场景资产(PNG/图像文件)
- 分镜化与镜头生成 ✅ - 创建分镜和视频片段(MP4文件)
- 指导图生成 ✅ - 生成镜头指导图(PNG图像文件)
- 视频生成与合成 ✅ - 基于指导图生成视频并合成完整视频(MP4文件)
所有阶段的数据通过文件系统传递,无需数据库或中间件。
详细文档请参阅:
- Go 1.21+
- AI服务API密钥(OpenAI / Anthropic Claude / Stable Diffusion等)
- FFmpeg(用于视频处理)
git clone https://github.com/mingmingtsao/q-hackathon.git
cd q-hackathon
cp config.example.yaml config.yaml
export OPENAI_API_KEY="your-api-key"详细配置说明请参阅 配置文档
# 准备工作目录并放置小说文件
mkdir my-project
cp your-novel.txt my-project/novel.txt
# 执行完整处理流程(所有六个阶段)
anime-gen process -w my-project
# 或指定配置文件
anime-gen process -w my-project -c config.yaml# 执行阶段1:语义理解与故事结构化
# 需要在工作目录下有 novel.txt 文件
anime-gen stage1 -w my-project
# 执行阶段2:世界观与基调确立
# 需要阶段1的输出(my-project/01_story/)
anime-gen stage2 -w my-project
# 执行阶段3-6:后续阶段
anime-gen stage3 -w my-project
anime-gen stage4 -w my-project
anime-gen stage5 -w my-project
anime-gen stage6 -w my-project执行过程中会在工作目录下生成以下结构:
my-project/
├── novel.txt # 输入:原始小说文件
├── 01_story/ # 阶段1输出:故事结构
├── 02_world_style/ # 阶段2输出:世界观设定
├── 03_assets/ # 阶段3输出:角色和场景资产
├── 04_shot_plan/ # 阶段4输出:分镜计划
├── 05_guidance/ # 阶段5输出:指导图
└── 06_video/ # 阶段6输出:最终视频
MIT License
Project Link: https://github.com/mingmingtsao/q-hackathon