【ChatGPTで音声読み上げ】Speechkiプラグインの活用方法を徹底解説!

「ChatGPTのおすすめプラグインが知りたい」「Speechkiプラグインの活用方法は?」

このように思う方は多いのではないでしょうか。

今回PROMPTYでは、ChatGPTのプラグイン「Speechki」を実際に使って活用方法を解説していきます。

ChatGPT プラグインの使い方を知りたい方は、こちらの記事をご覧ください。

関連記事

2023年5月16日ごろ、ChatGPTのプラグイン機能「ChatGPT plugins」がウェイトリストの登録無しで使用できるようになりました。 ChatGPT pluginsを使用すると、 ・リアルタイム情報の取得・Web[…]

Speechkiプラグインの主な機能・特徴

テキストから音声への変換

Speechkiプラグインでは、テキストを高品質な音声に変換することができます。これにより、入力したテキストを音声として聞くことができ、視覚的な情報に頼らずに情報を取得することが可能です。

多言語対応

Speechkiプラグインでは、多くの異なる言語でテキストを音声に変換することができます。自分が指定した言語で情報を取得することが可能です。

多様な音声選択

Speechkiプラグインでは、言語に加えて性別やナレーションスタイルを選択可能であり、自分のニーズに最も適した音声を選択することができます。

活用例1:音声スタイルとテキストを指定して読み上げを行う

プロンプト:

{
  "speaker_id": {数値},
  "text": "{自由記述}"
}

この入力文では、”Speaker_id”でスピーカーを選択します。Speaker_idを指定すると、スピーカーの名前、言語、性別、ナレーションスタイルが決定されます。以下のコマンドを使用してスピーカーのリストを取得できます。

speechki_tts_plugin.get__speakers

“text”には音声に変換したいテキストを入力します。

実際に、Speaker_idに 3(Yumi、日本語、女性)を選択し、「プロンプトエンジニアのための情報メディア、プロンプティでございます。」というテキストの読み上げをしてもらいます。

音声へのリンクが出力され、クリックすると次のページが表示されます。

再生ボタンを押すと音声が流れます。人間のような自然な音声ではありませんが、要求通りに読み上げてくれました。

活用例2:テーマを指定し、原稿を作成して読み上げる

Speechkiプラグインでは、文章を生成して原稿を読み上げることも可能です。

例として、新製品のプレゼンテーションの冒頭の「つかみ」を音声出力するように要求しました。

生成されたテキストは「皆様、想像してみてください。日々の生活が一瞬で劇的に変わる瞬間を。それが、今からご紹介する新製品がもたらす革新です。準備はいいですか?未来への扉を開ける時間です。」というもので、プレゼンテーションの冒頭にふさわしい内容でした。

Speaker_idは先ほどと同じ3(Yumi、日本語、女性)が選択され、生成されたテキストを高品質な音声に変換してリンクが出力されました。

注意点

Speechkiプラグインは非常に便利なツールですが、次のような制限もあります。

自然な感情表現

Speechkiプラグインはテキストを音声に変換しますが、人間のような感情表現やトーンの変化を完全に模倣することはできません

特定のアクセントや方言: Speechkiプラグインは多くの言語とアクセントをサポートしていますが、特定の地域のアクセントや方言を完全に模倣することはできません。

音声調整: Speechkiプラグインは音声のピッチや速度を調整する機能はありません。音声は提供されたスピーカーの設定に基づいて生成されます。

リアルタイム変換: Speechkiプラグインはテキストを音声に変換する際に時間がかかるため、リアルタイムの音声変換はできません。

特殊な音声効果: エコーやリバーブなどの特殊な音声効果を追加する機能はありません。

これらの制限を理解し、Speechkiプラグインを最大限に活用することが重要です。

まとめ

今回PROMPTYでは、ChatGPTのプラグイン「Speechki」の活用法を紹介しました。

Speechkiプラグインでテキストの読み上げが可能となったことで、視覚的に情報を得ることが困難な人々や、手間を省きたい人々にとって、大きなメリットがあるでしょう。

ぜひ皆さまもChatGPT プラグインを使ってChatGPTを活用する範囲を広げていきましょう。