Skip to content

Latest commit

 

History

History
75 lines (42 loc) · 2.91 KB

README-ja.md

File metadata and controls

75 lines (42 loc) · 2.91 KB

audio-transcriber-docker

Click here for English README

動画・音声ファイルの音声をSpeechRecognitionを使って自動的に書き起こす。

警告・免責事項

このプロジェクトを使用したことによって引き起こされた問題に関して開発者は一切の責任を負いません。

というか、それなりに真面目なことに使うのであればGoogle Cloud PlatformのSpeech-to-Textとかを使いましょう。

一切のサポートはしません。

インストール

1. Git Clone

git clone https://github.com/book000/audio-transcriber-docker.git

2. start-mount.batまたはstart-mount.shを実行 (初めての場合)

Windowsならstart-mount.bat、Linuxならstart-mount.shを実行する。
このプログラム達はuser-dirフォルダとoutputフォルダをマウントする。

出てくる質問はDISPLAYだけ注意すればそれ以外はそのままEnterでも良い

3. マイクの使用許可

初期設定として、マイクの使用許可と使用するマイクの設定が必要。最初以外でも音声が正常に認識されないなどあるのであればこの作業をもう一度実行する必要がある。

3-1. Allowを押して許可

3-2. ビデオマークを押し、Microphone欄をVirtual Source Virtual Mic on Monitor of Virtual_Microphone_Outputに変更

4. 閉じる

Ctrl+Cをターミナルで押し、処理を中断する。必要であればdocker stop audio-transcriber, docker rm audio-transcriberを実行。

使い方

インストールを終えたあと、普通に使う場合

1. start.batまたはstart.shを実行

Windowsならstart.bat、Linuxならstart.shを実行する。
このプログラム達はoutputフォルダをマウントする。

出てくる質問は以下。

  • Movie or Audio File Path
    • 読み込むファイル(動画・音声ファイル)を指定。mp4, m4v, webmなどffmpegで変換できるものならなんでも良い
  • DockerName
    • Dockerのコンテナ名を指定。既存のコンテナ名を指定した場合確認せずstoprmをするので注意。
    • 指定せずEnterした場合audio-transcriberを使用。
  • DISPLAY
    • DISPLAY(映像出力先)の指定。Docker内には基本的に映像出力先がないので、ホストのDISPLAYを指定(192.168.0.100:0など)

TeraTermMobaxtermでX11の受け先を作っておくこと。

2. 処理

Chromeが起動してごにょごにょ動く。

3. output/{DateTime}.txtを見る

基本的にoutput/{DateTime}.txtに書き込まれるので、それ。

ライセンス / License

このプロジェクトのライセンスはMIT Licenseです。