推荐一个日文语音识别的工具，ReazonSpeech #99

fanglangxinghai · 2024-04-02T14:13:30Z

可以用Whisper 的tiny模型的参数量，达到比Whisper的Large v2模型还准确。

PingZi-Wing · 2024-04-04T08:12:00Z

看了下介绍好像很牛，不过我用colab试了下没成功，崩溃了

PingZi-Wing · 2024-04-06T06:52:01Z

今天折腾了下，总算在colab上试用成功。结论不如fast whisper large v2。这玩意太耗内存了，25分钟的音频就把免费的12G内存爆了，20分钟的音频才成功，这时峰值占了10G内存。速度没有很快，20分钟转录了4分钟，而且好像有不识别前10s的毛病，准确度感觉不如large v2。

Provide feedback