一个简单的 Whisper Python 脚本,可以将媒体文件的音频通过 whisper
识别成文字,并通过 pysrt
保存为字幕。
需要安装 Python (在 Python 3.10.12 经过测试)
如果想要将字幕和媒体文件封装成
.mkv
,还需要安装ffmpeg
。
git clone https://github.com/SIXiaolong1117/WhisperPythonScript.git
cd WhisperPythonScript
pip install -r requirements.txt
- 文件
v2s.py
识别媒体文件的音频部分,输出.srt
字幕文件。python ./v2s.py <媒体文件路径> <语言代码(可选)>
- 文件
v2mkv_s.py
识别媒体文件的音频部分,输出.srt
字幕文件,并将输出的字幕文件和媒体文件封装成.mkv
。python ./v2mkv_s.py <媒体文件路径> <语言代码(可选)>
- 文件
s2mkv_s.py
将输出的字幕文件和媒体文件封装成.mkv
。python ./v2s.py <媒体文件路径>