動画・音声ファイルの音声をSpeechRecognition
を使って自動的に書き起こす。
このプロジェクトを使用したことによって引き起こされた問題に関して開発者は一切の責任を負いません。
というか、それなりに真面目なことに使うのであればGoogle Cloud PlatformのSpeech-to-Textとかを使いましょう。
一切のサポートはしません。
git clone https://github.com/book000/audio-transcriber-docker.git
Windowsならstart-mount.bat
、Linuxならstart-mount.sh
を実行する。
このプログラム達はuser-dir
フォルダとoutput
フォルダをマウントする。
出てくる質問はDISPLAY
だけ注意すればそれ以外はそのままEnterでも良い
初期設定として、マイクの使用許可と使用するマイクの設定が必要。最初以外でも音声が正常に認識されないなどあるのであればこの作業をもう一度実行する必要がある。
Ctrl+C
をターミナルで押し、処理を中断する。必要であればdocker stop audio-transcriber
, docker rm audio-transcriber
を実行。
インストールを終えたあと、普通に使う場合
Windowsならstart.bat
、Linuxならstart.sh
を実行する。
このプログラム達はoutput
フォルダをマウントする。
出てくる質問は以下。
Movie or Audio File Path
- 読み込むファイル(動画・音声ファイル)を指定。
mp4
,m4v
,webm
などffmpeg
で変換できるものならなんでも良い
- 読み込むファイル(動画・音声ファイル)を指定。
DockerName
- Dockerのコンテナ名を指定。既存のコンテナ名を指定した場合確認せず
stop
とrm
をするので注意。 - 指定せずEnterした場合
audio-transcriber
を使用。
- Dockerのコンテナ名を指定。既存のコンテナ名を指定した場合確認せず
DISPLAY
- DISPLAY(映像出力先)の指定。Docker内には基本的に映像出力先がないので、ホストのDISPLAYを指定(
192.168.0.100:0
など)
- DISPLAY(映像出力先)の指定。Docker内には基本的に映像出力先がないので、ホストのDISPLAYを指定(
TeraTerm
やMobaxterm
でX11の受け先を作っておくこと。
Chromeが起動してごにょごにょ動く。
基本的にoutput/{DateTime}.txt
に書き込まれるので、それ。
このプロジェクトのライセンスはMIT Licenseです。