extract_video_ppt_to_markdown

Token上下文限制：大型语言模型如Qwen2-7B-Instruct在处理长文本时会受到token上下文限制，导致无法处理过长的视频字幕片段。这需要通过分段处理、上下文拼接等技术手段来解决。
显存容量限制：处理大型模型时，显存容量可能成为瓶颈，特别是在多任务并发处理时。需要通过模型压缩、量化、分布式计算等技术来优化显存使用。
推理延迟：当前推理延迟较高，不适合在线实时处理。需要通过模型优化、硬件加速、并行计算等手段来降低延迟。
模型泛化能力：模型需要适应不同类型和质量的视频内容，这要求模型具有较强的泛化能力和鲁棒性。
网络延迟：网络延迟较高，稳定性查，在测试过程中没有本地测试更便捷

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
imgs		imgs
.gitattributes		.gitattributes
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
ROADMAP.md		ROADMAP.md
app.py		app.py
video_extract.py		video_extract.py

Provide feedback