追記(2026年4月)— 合成音声機能の実装と、将来への布石
音声で質問し、音声で回答を受け取るUIを追加。
応答速度は理論値で”200〜500ms”に改善され、チャットボットの会話として違和感なく使えるレベルに達しています。
現時点の仕様と、正直な限界
TY-BT(とよボット)は男性ボイス「Takumi」、TY-MI(とよミー)は女性ボイス「Mizuki」を採用しています。いずれもAWSの日本語ニューラル音声で、自然な発音品質を備えています。
これは現時点のTTS技術の限界です。関西弁と東京語はピッチアクセントの体系そのものが異なるため、「発音を少し調整する」程度では対応できません。豊中というアイデンティティを語る声が、標準語イントネーションであることには、私たちも課題を感じています。
将来の可能性(1~2年以内)
ニューラルTTSの進化は急速です。日本国内のTTSスタートアップや、AWS・Googleといった主要クラウドが方言対応ボイスを提供し始めるのは、技術的には現実的な近未来として見込まれます。
豊中naviは、その日に備えた設計をすでに実装しています。方言対応ボイスが登場した際、1行のコード変更で即座に切り替えられるアーキテクチャを採用しています。
「テキストは大阪弁・声は標準語」から、「テキストも声も大阪弁」へ。
豊中というまちのアイデンティティを、声でも表現できる日を楽しみにしています。
最新の機能状態・更新履歴は リリースノート でご確認いただけます。
