---------------------------------------------- 【 ソフト名 】DisNOTE 【 バージョン 】v3.2.1 【 種別 】フリーソフト 【 動作環境 】Windows11(7以降なら多分動きますが試していません) GoogleChrome(他のブラウザでも動くかもしれませんが試していません) それなりに高スペックなPC 【 作者 】ろじろじ 【メールアドレス】mail@roji2.undo.jp 【 Twitter 】https://twitter.com/roji2 【 公開サイト 】https://roji3.jpn.org/disnote/ ---------------------------------------------- 【概要】 通話録音や録画ファイルからテキストに自動的に書き起こすソフトです。編集もできます。 インストール方法や大まかな使い方は以下の動画を見てください。2つとも内容は同じです。 https://www.nicovideo.jp/watch/sm42965566 https://youtu.be/poqMfxLl0hc 細かい機能については、公開サイトを参照してください。 https://roji3.jpn.org/disnote/ 【インストール方法】 公開サイトを参照してください。 バージョンアップ時は、配置したファイル・フォルダに上書きしてください。 【アンインストール方法】 配置したファイル・フォルダを削除してください。 Whisperを使用した場合、 <ユーザーフォルダ>\.cache\whisper にモデルファイルが置いてあります。必要に応じて削除してください。 【音声認識について】 DisNOTEは、以下の3つの音声認識エンジンを採用しています。 ・Google Cloud Speech API ・Wit.ai ・Whisper Google Cloud Speech APIは最初から使用できます。 Google Cloud Speech APIだけで十分という方や、とりあえずDisNOTEを使ってみたいという方は他のエンジンの設定は不要です。 他の音声認識エンジンを使用したい方は、以下を参照してください。 エンジンの特徴の説明と設定方法が書いてあります。 https://roji3.jpn.org/disnote/recognition.html 【編集機能と保存・読み込みについて】 ・管理画面(バージョン3以降)から操作する場合 編集画面で認識結果をダブルクリック、あるいは選択してEnterキーを押すと編集できます。 Ctrl+Sや右上の保存ボタンを押すと保存されます。 ・htmlファイルを直接開いた場合 ブラウザ上で認識結果をダブルクリック、あるいは選択してEnterキーを押すと編集できます。 Ctrl+Sや右上の保存ボタンを押すと編集ファイル(拡張子json)ダウンロードされます。 ブラウザを閉じると編集した内容は消えてしまいますが、htmlファイルを開いた後に編集ファイルをブラウザにドラッグ&ドロップすると元に戻ります。 【著作権/再配布に関して】 本ソフトウェアはフリーウェアですが、著作権は放棄しておらず、「ろじろじ」が保有しています。 無断転載/再配布はご遠慮ください。 連絡はReadme先頭に記載してあるメールアドレス、もしくはTwitterにお願いします。 【利用規約(商用利用について)】 Google Cloud Speech APIの利用規約に、 「You and any API Client you create may only access this API for your own development and personal uses.」 とあります。上記に反しない範囲でDisNOTEを使用してください。 【ソースコードについて】 ソースコードはgithubで公開しています。改良案のある方はpull requestを投げてみてください。 https://github.com/rojiroji/disnote 【注意事項】 以下の内容を十分に理解に上、同意いただけた場合のみご使用ください。 ・Readme.txt(このファイル) ・概要欄に示した動画 【免責】 このソフトウェアの使用により利用者がいかなる損害を受けても 本ソフトウェア作者及び各付属ソフトウェアの作者はその責任を負いません。 尚、当ソフトを使用した時点で、以上の要項を了承したものとして取り扱います。 了承ができない場合は、使用しないで下さい。 【謝辞】 pull requestありがとうございました。 ・capy-mimizukuさん (主にelectron、編集画面での上書き保存周り) 【その他】 感想とかありましたら、twitterで #DisNOTE タグをつけて呟いてもらえると嬉しいです。 バグ報告も同じようにしてもらえると対応するかもしれません。 【更新履歴】 2023/11/09 v3.2.1 [RECOGNIZE/BUGFIX]Whisperを使用するとエラーになる不具合を修正 [MANAGE]認識設定画面からエンジンの説明ページを開くようにした 2023/11/05 v3.2.0 [MANAGE]ゆっくりMovieMaker4のプロジェクトファイルを出力する機能を追加 2023/11/03 v3.1.0 [MANAGE/RECOGNIZE]Whisperを復活させた(ただし、バージョン2以前の認識結果は読み込まれません) [MANAGE]ロゴの画像をドラッグ&ドロップでサイズ変更できるようにした [RECOGNIZE]※仕様変更:Whisperやwit.aiを使わずに認識を行っても、過去の認識結果が残っていたら最終結果に含まれていたのを、含めないように修正 [UI/BUGFIX]音声ファイル名に # が含まれると音声が再生されない不具合を修正 [UI]※仕様変更:動画表示時、最初から動画メディアの形で表示するようにした [MANAGE]アルファ版の表記を削除 2023/10/15 v3.0.1 [MANAGE]新しいバージョンが出ていたら画面に出すようにした 2023/10/15 v3.0.0 [MANAGE]管理画面を作成(DisNOTE.exe) ※アルファ版です [RECOGNIZE]Whisperを除外 [RECOGNIZE]引数でWit.aiのトークンとWhisperのエンジンを指定できるようにした 2022/12/29 v2.6.0 [UI]編集機能追加 [UI]プロジェクト名を設定できるようにした [RECOGNIZE/BUGFIX]Whisperの認識が終了しないことがある不具合を修正 2022/11/26 v2.5.0 [RECOGNIZE]Whisperの認識速度を向上させた [RECOGNIZE]wit.aiの認識がタイムアウトした場合、リトライするようにした [RECOGNIZE]音声認識が完了している音声を再度認識しようすると下準備を再度行っていたが、それをスキップするようにした [RECOGNIZE/BUGFIX]mp3変換に失敗した場合、その変換をスキップするようにした 2022/10/29 v2.4.1 [RECOGNIZE]子スレッドが異常終了したときにエラーログが埋もれてしまうことがあったのでの、エラーログが最後に出るようにした [RECOGNIZE/BUGFIX]Whisperの音声認識結果が、音声と1行ズレることがあるのを抑制(無くなってはいない) [RECOGNIZE/BUGFIX]Whisperが、同じ区間の音声を何度も認識してしまうことがあるのを修正 2022/10/22 v2.4.0 [RECOGNIZE]Whisperによる音声認識機能を追加 [UI]選択行の保存方法を変更 [UI]候補の上にマウスを乗せると、どのエンジンで認識した結果なのかを表示するようにした [UI/BUGFIX]話者表示」のチェックボックスを外すと、話者設定画面の話者名変更の入力欄が消えるのを修正 2022/10/08 v2.3.0 [RECOGNIZE]無音検出中に中断すると、次回起動時に続きから再開するようにした [RECOGNIZE/BUGFIX]無音解析の処理時間が異常に長くなる不具合を修正 [RECOGNIZE/BUGFIX]Wit.aiを使用しているときに、音声認識の進捗がリセットされてしまうことがある不具合を修正 [RECOGNIZE/BUGFIX]中断タイミングによって、再開後の音声認識やhtml上での音声再生がおかしくなることがある不具合を修正 [RECOGNIZE]起動時にも新しいバージョンの宣伝をするようにした 2022/07/03 v2.2.0 [RECOGNIZE]Wit.aiによる音声認識機能を追加 [RECOGNIZE]※仕様変更:ノイズ混じりの音声を認識すると、結果の1行が長くなってしまうのを修正 [RECOGNIZE]作業終了後に、一時ファイルを削除するかどうかをiniファイルで指定できるようにした [RECOGNIZE]Google音声認識での認識言語をiniファイルで指定できるようにした [RECOGNIZE]※仕様変更:最終出力のCSVファイルで、これまでスコアを書いていた列に音声認識ライブラリの種類を出力するように変更 [UI/BUGFIX]連続再生時などで次の行に進んだ直後に、すぐに前の行に戻る現象が稀に発生するのを修正 [UI/BUGFIX]画面で行選択するたびにコンソールにログを出力していたのを修正 2022/05/13 v2.1.1 [UI/BUGFIX]ロードが完了する前にCSVファイルなどをダウンロードしようとするとエラーになるため、ロードが終わるまでダウンロードできないようにした [UI]CSVファイルなどをダウンロードする際に、ファイル名がencodeされた状態だったのを修正 2022/05/12 v2.1.0 [UI]認識結果をゆっくりMovieMaker4の台本形式、CSV形式、タブ区切りtxt形式でダウンロードする機能を追加 2022/05/04 v2.0.0 [RECOGNIZE]Windows用バイナリで公開するようにした(ソース版が欲しい方はgithubから回収してください) 2022/05/04 v1.5.0 [UI]話者列の表示/非表示を切り替られるようにした [UI]表示中の話者の人数を画面右上に表示するようにした [UI]オリジナルの音源をhtml画面右下で再生する機能を追加 [UI]動画ファイルを認識した場合、動画を画面上に表示する機能を追加 [UI]分割した音声の冒頭と末尾についていた無音部分を削除(v1.4.0以前に認識した音声ではこの機能は使えません。フォルダを削除して再度認識し直してください。) [RECOGNIZE]処理を多少高速化(できたはず) [RECOGNIZE]音声トラックのないファイルを渡すとエラー終了するようにした 2022/04/30 v1.4.0 [RECOGNIZE]マルチトラックファイルの解析に対応した [RECOGNIZE/BUGFIX]無音部分が連続したときに、認識対象の音声が異常に長くなることがある不具合を修正 2022/04/09 v1.3.0 [RECOGNIZE]最初に、ffmpegなどが正常に動作するかを確認するようにした [RECOGNIZE]ドラッグ&ドロップで渡したファイルが音声ファイルかどうかを確認するようにした [RECOGNIZE]※仕様変更:ノイズっぽい部分を音声認識にかけていたのをやめた(DisNOTE.iniでis_recognize_noize=1を設定すると今まで通り認識する) [RECOGNIZE]※仕様変更:最終出力ファイルのファイル名を変更した(ファイル名は処理の終了時に表示される) [RECOGNIZE]最終出力のCSVファイルに書く音声ファイルのパスを、絶対パスから相対パスに変更 [UI]話者の表示名を変更できるようにした [UI]各行の候補選択や表示/非表示設定を自動保存するようにした(Windows10+GoogleChromeでのみ動作確認) 2021/10/09 v1.2.0 [RECOGNIZE]最新版のDisNOTEがあるかどうかをチェックするようにした 2021/10/05 v1.1.1 [RECOGNIZE/BUGFIX]ファイル名に半角スペースが入っているとエラー終了する不具合を修正 2021/10/02 v1.1.0 [RECOGNIZE/BUGFIX]CP932にエンコードできない文字が認識結果に含まれていたときにエラー終了する不具合を修正 [RECOGNIZE]pipの実行に失敗することがあるのを回避(できるかも) [RECOGNIZE]メモリ使用量を抑制 [UI]話者でフィルタする機能を追加 [UI]検索機能を追加 [UI]音声の連続再生機能を追加 [UI]キーボードショートカットを追加 [RECOGNIZE]分割した音声にタグをつけるようにした [RECOGNIZE]分割した音声のプレイリストを作成するようにした [RECOGNIZE]エラーになった時のログの出力を変更 2021/09/04 v1.0.1 [RECOGNIZE]無音でない部分が3分以上続く場合に認識が失敗することがあるエラーを回避(回避はしたけど認識結果は多分悪いです) [UI/BUGFIX]最後の行を再生したり候補を変更できなかったのを修正 [RECOGNIZE]音声認識でエラーになったときのログ出力を変更 [RECOGNIZE]音声認識中に進捗を出すようにした [RECOGNIZE]認識結果をmerged.json.jsに出力していたのを、index.htmlに含めるように変更 2021/08/29 v1.0.0 初版 以上