Skip to main content
Open In Colab在 GitHub 上打开

Google Cloud 文本转语音

借助 Google Cloud Text-to-Speech,开发者可以将自然语音与 100+ 种语音合成,并提供多种语言和变体。它应用 DeepMind 在 WaveNet 中的开创性研究和 Google 强大的神经网络,以提供尽可能高的保真度。

它支持多种语言,包括英语、德语、波兰语、西班牙语、意大利语、法语、葡萄牙语和印地语。

此笔记本展示了如何与Google Cloud Text-to-Speech API实现语音合成能力。

首先,您需要设置一个 Google Cloud 项目。您可以按照此处的说明进行作。

!pip install --upgrade langchain-google-community[texttospeech]

实例

from langchain_google_community import TextToSpeechTool
API 参考:TextToSpeechTool

废弃的 GoogleCloudTextToSpeechTool

from langchain_community.tools import GoogleCloudTextToSpeechTool
text_to_speak = "Hello world!"

tts = GoogleCloudTextToSpeechTool()
tts.name

我们可以生成音频,将其保存到临时文件中,然后播放它。

speech_file = tts.run(text_to_speak)