このところ、ずっと裏で開発していた、日本語音声読み上げのソフト「
読みトーク」を公開しました。
内容的には、「
ラジオ・ブラウザ」の音声読み上げ部分を切り離して、バッチ処理したり、コンソールアプリとして利用できるようにしたものです。また、今回の開発に伴い、音声読み上げ部分も大幅に改良しました。
以前より「ラジオ・ブラウザの読み上げ精度を上げて欲しい」という要望があったのですが、この部分のソースが、けっこうごちゃごちゃしていて、改良するにも手をつけ難いという現状がありました。
そこで、いったんこの部分を分離して、整理して、「ラジオ・ブラウザ」からは、非表示のバッチ処理で呼び出そうという計画を立てていました。
そうすれば、他のソフトにも簡単に読み上げ機能を組み込めるし、様々なバッチファイルにも簡単に音声読み上げを組み込むことができます。
そうやって開発したのが、今回公開した「読みトーク」です。
名前は「読み&トーク」と「読み解く」をかけています。
本当は、デバッグをもっと続けたかったのですが、入力が「日本語」という時点で、全ての入力を試すわけにもいかず、どこかで作業を打ち切る必要がありました。
というわけで、本日デバッグをいったん打ち切って公開することに決めました。
元が「ラジオ・ブラウザ」の読み上げ部分ですので、入力はニュース記事を想定して作られています。
「ラジオ・ブラウザ」の頃からの、音声読み上げ部分の改良点(変更点)は、以下の通りです。
・文章区切りの改良。
・文節区切りの改良。
・アクセント位置の自動付加。
・フィルタ辞書の拡充。
・読み状態になった文字への中間フィルタ処理の追加。
・アクセント辞書の追加。
「ラジオ・ブラウザ」の頃よりは、流暢に読み上げるようになっています。
公開してしばらくフィードバックを待ったあと、大きなバグ報告がなければ、「読みトーク」を搭載した「ラジオ・ブラウザ 3.0」を公開する予定です(開発自体は既に完了している)。
さて、今回の「読みトーク」ですが、以下のような方法で、文章を読み上げることができます。
・コンソールアプリの標準入出力を利用して読み上げ。
・スクリプトを読み込ませてバッチ処理して読み上げ。
・exeの引数を利用して読み上げ。
・付属のウィンドウ アプリケーションから、手入力で読み上げ。
バッチ処理を想定しているソフトですので、ユーザーの用途に応じた様々な実行方法を用意しています。
また、「読みトーク」には、以下の命令が用意されています。
・日本語文章の発話タグ付きの読みを取得。
・日本語文章を読み上げ。
・日本語文章をwav保存。
・wavをmp3に変換。
その他、開発者に便利だと思われる命令をいくつか用意しています。
コマンド一覧に、その内容をまとめています。
「読みトーク」には、バッチ処理だけでなく、ウィンドウ アプリケーションも同梱しています。
こちらはHTA製のアプリケーションで、内部から「読みトーク」を呼び出しています。HTA製なので、ソースコードを全て見ることができます。
また、WSH製のソフトも同梱しているので、これらを参考にすれば、JavaScreiptの知識だけで、音声読み上げさせるプログラムを書くことが可能です。
JavaScriptや、HTA、WSHといった技術は、拙著「
マンガで分かる JavaScriptプログラミング講座」にまとめています。
これらを参考にして、パソコンに音声読み上げ処理を組み込むことができます。
「早く開発を終えないと」と思いながら、ずるずると弄り続けていたので、公開してしまいます。
というわけで、次の作業に移ります。