項目 | 初期値 | 説明 |
---|---|---|
recognize_google_language | ja-JP |
Google音声認識で認識する言語を設定します。 デフォルトのja-JPは日本語です。アメリカ英語であればen-USなど、認識したい言語によって適宜変更してください。 |
wit_ai_server_access_token | 空文字列 |
Wit.aiのトークンを設定します。 設定することでWit.aiでの音声認識が有効になります。デフォルトでは無効です。 詳細はWit.aiでの音声認識についてを参照してください。 |
seg_tmp_audio_length | 30 |
音声ファイルの無音部分を解析する処理で、音声を何分ずつ区切って解析するかを設定します(分単位)。 音声認識が"MemoryError"というメッセージを出して失敗した場合に値を小さくしてみてください。 |
remove_temp_split_flac | 1 |
認識処理中に作成した一時ファイルを削除するかどうかを設定します。 1で削除します。0で削除しません(残します)。 基本的には1を推奨します。 |
is_recognize_noize | 0 |
ノイズっぽいところを音声認識するかどうかを設定します。 0で認識せず、1で認識します。 1にすると音声認識処理に非常に時間がかかったり、音声認識に失敗した行が大量に発生する可能性があります。基本的には非推奨です。 |
seg_filter_strength | 0.1 |
無音解析時に音声にかける Non-Local Means algorithm フィルタの強さです。 FFmpegのオプションで指定するanlmdnのsの値を指定します。 基本的には変更の必要はありません。 |
whisper_model | none |
Whisperのモデルを指定します。noneを指定すると、Whisperでの認識を行いません。 詳細はWhisperでの音声認識についてを参照してください。 |
recognize_whisper_language | ja |
Whisperで認識する際の言語を設定します。 デフォルトのjaは日本語です。アメリカ英語であればenなど、認識したい言語によって適宜変更してください。 |
whisper_binary_duration | 20 |
Whisperで認識する際に、何分区切りで認識を行うかを指定します。 基本的には変更の必要はありません。 |
is_use_binary_whisper | 1 | 開発者用のオプションです。変更しないでください。 |
whisper_tmp_audio_length | 5 | 開発者用のオプションです。変更しないでください。 |