From cf8e30ea01edaf2e5336fabb24fa0ba775638b6b Mon Sep 17 00:00:00 2001 From: Ali Hamdi Ali Fadel Date: Mon, 1 Jul 2024 16:23:35 +0300 Subject: [PATCH] Update tafrigh version in Google Colab notebook --- colab_notebook.ipynb | 49 ++++++++++++++++++++++++++------------------ 1 file changed, 29 insertions(+), 20 deletions(-) diff --git a/colab_notebook.ipynb b/colab_notebook.ipynb index a6bd0ff..2317747 100644 --- a/colab_notebook.ipynb +++ b/colab_notebook.ipynb @@ -17,7 +17,7 @@ "

مرحبًا بك في تفريغ لتفريغ المواد الصوتية والمرئية باستخدام تقنيات الذكاء الاصطناعي. لاستخدام تفريغ:

\n", "\n", "
    \n", - "
  1. قم بإدخال روابط المواد المطلوب تحويلها من منصة YouTube في حقل \"urls\" وتأكد من فصلها بمسافة، أو قم بترك الحقل فارغًا لتفريغ المواد التي قمت برفعها
  2. \n", + "
  3. قم بإدخال روابط المواد المطلوب تحويلها من منصة YouTube أو أي منصة أخرى في حقل \"urls\" وتأكد من فصلها بمسافة، أو قم بترك الحقل فارغًا لتفريغ المواد التي قمت برفعها
  4. \n", "
  5. (اختياري) قم بتحديد أقل عدد من الكلمات في كل جزء من أجزاء التفريغ. يؤثر هذا في طول الأجزاء التي سيتم تفريغها
  6. \n", "
  7. \n", " إذا كنت تريد استخدام مجموعة نماذج Whisper:\n", @@ -69,7 +69,7 @@ "print('جارٍ تجهيز بيئة العمل.')\n", "\n", "# Setup Tafrigh.\n", - "%pip install -U tafrigh[wit,whisper]==1.1.4 > install_logs.txt\n", + "%pip install -U tafrigh[wit,whisper]==1.5.0 > install_logs.txt\n", "\n", "# Start: Quick fix related to Colab, HuggingFace, and faster-whisper.\n", "!apt install libcublas11 > fix_logs.txt\n", @@ -134,24 +134,33 @@ " print('جارٍ تحويل المواد إلى نصوص باستخدام نماذج Whisper.')\n", "\n", "config = Config(\n", - " urls_or_paths=list(map(str.strip, urls.split(' '))) if len(urls.strip()) else ['.'],\n", - " skip_if_output_exist=False,\n", - " playlist_items='',\n", - " verbose=False,\n", - " model_name_or_path=model,\n", - " task='transcribe',\n", - " language=language,\n", - " use_faster_whisper=True,\n", - " beam_size=5,\n", - " ct2_compute_type='default',\n", - " wit_client_access_tokens=[wit_api_key],\n", - " max_cutting_duration=max_cutting_duration,\n", - " min_words_per_segment=min_words_per_segment,\n", - " save_files_before_compact=False,\n", - " save_yt_dlp_responses=False,\n", - " output_sample=0,\n", - " output_formats=['txt', 'srt'],\n", - " output_dir=output_dir,\n", + " input=Config.Input(\n", + " urls_or_paths=list(map(str.strip, urls.split(' '))) if len(urls.strip()) else ['.'],\n", + " skip_if_output_exist=False,\n", + " playlist_items='',\n", + " download_retries=3,\n", + " verbose=False,\n", + " ),\n", + " whisper=Config.Whisper(\n", + " model_name_or_path=model,\n", + " task='transcribe',\n", + " language=language,\n", + " use_faster_whisper=True,\n", + " beam_size=5,\n", + " ct2_compute_type='default',\n", + " ),\n", + " wit=Config.Wit(\n", + " wit_client_access_tokens=wit_api_key.split(),\n", + " max_cutting_duration=max_cutting_duration,\n", + " ),\n", + " output=Config.Output(\n", + " min_words_per_segment=min_words_per_segment,\n", + " save_files_before_compact=False,\n", + " save_yt_dlp_responses=False,\n", + " output_sample=0,\n", + " output_formats=['txt', 'srt'],\n", + " output_dir=output_dir,\n", + " ),\n", ")\n", "\n", "deque(farrigh(config), maxlen=0)\n",