dont resample, since input is now 16 kHz

uberduck-ai · Feb 22, 2024 · f5658ce · f5658ce
1 parent dd10292
commit f5658ce
Showing 1 changed file with 3 additions and 8 deletions.
diff --git a/openduck-py/openduck_py/routers/voice.py b/openduck-py/openduck_py/routers/voice.py
@@ -1,15 +1,12 @@
 import re
-from tempfile import NamedTemporaryFile
-from fastapi import APIRouter, Depends, Query, WebSocket
+from fastapi import APIRouter, Depends, WebSocket
 from sqlalchemy import select
 import whisper
 from time import time
-from torchaudio.functional import resample
 
 import numpy as np
 from asgiref.sync import sync_to_async
 import torch
-from torchaudio.functional import resample
 from nemo_text_processing.text_normalization.normalize import Normalizer
 
 from openduck_py.models import DBChatHistory
@@ -24,10 +21,8 @@
 
 
 def _transcribe(audio_data):
-    resampled = resample(
-        torch.tensor(audio_data).to("cuda"), orig_freq=24000, new_freq=16000
-    )
-    return model.transcribe(resampled)["text"]
+    audio_tensor = torch.tensor(audio_data).to("cuda")
+    return model.transcribe(audio_tensor)["text"]
 
 
 _async_transcribe = sync_to_async(_transcribe)