Tutorial ini menunjukkan cara menggunakan Speech Synthesis Markup Language (SSML) untuk mengucapkan file teks alamat. Anda dapat menerapkan markup pada string teks dengan tag SSML untuk mempersonalisasi audio sintetis dari Text-to-Speech.
| Teks biasa | Rendering SSML teks biasa |
|---|---|
123 Street Ln | <speak>123 Street Ln</speak> |
1 Number St | <speak>1 Number St</speak> |
1 Piazza del Fibonacci | <speak>1 Piazza del Fibonacci</speak> |
Tujuan
Mengirim permintaan ucapan sintetis ke Text-to-Speech menggunakan SSML dan library klien Text-to-Speech.
Biaya
Lihat halaman harga Text-to-Speech untuk mengetahui informasi biaya.
Sebelum memulai
- Pastikan Anda memiliki project Text-to-Speech di konsolGoogle Cloud .
- Tutorial ini memungkinkan Anda menggunakan Java, Node.js, atau Python. Jika Anda berencana menggunakan Java, download dan instal Maven. Jika Anda berencana menggunakan Node.js, download npm.
Mendownload contoh kode
Guna mendownload contoh kode, clone contoh GitHub Google Cloud untuk bahasa pemrograman yang ingin Anda gunakan.
Java
Tutorial ini menggunakan kode di direktori texttospeech/cloud-client/src/main/java/com/example/texttospeech/ dari repositori contoh Java Google Cloud Platform.
Guna mendownload dan membuka kode untuk tutorial ini, jalankan perintah berikut dari terminal.
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git cd java-docs-samples/texttospeech/cloud-client/src/main/java/com/example/texttospeech/
Node.js
Tutorial ini menggunakan kode di direktori texttospeech dari repositori contoh Node.js Google Cloud Platform.
Guna mendownload dan membuka kode untuk tutorial ini, jalankan perintah berikut dari terminal.
git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git cd texttospeech/
Python
Tutorial ini menggunakan kode di direktori texttospeech/snippets dari repositori contoh Python Google Cloud Platform.
Guna mendownload dan membuka kode untuk tutorial ini, jalankan perintah berikut dari terminal.
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git cd samples/snippets
Menginstal library klien
Tutorial ini menggunakan library klien Text-to-Speech.
Java
Tutorial ini menggunakan dependensi berikut.
Node.js
Dari terminal, jalankan perintah berikut.
npm install @google-cloud/text-to-speech
Python
Dari terminal, jalankan perintah berikut.
pip install --upgrade google-cloud-texttospeech
Menyiapkan kredensial Google Cloud Platform
Provide authentication credentials to your application code by setting the environment variable GOOGLE_APPLICATION_CREDENTIALS. This variable applies only to your current shell session. If you want the variable to apply to future shell sessions, set the variable in your shell startup file, for example in the ~/.bashrc or ~/.profile file.
Linux atau macOS
export GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"Replace KEY_PATH with the path of the JSON file that contains your credentials.
For example:
export GOOGLE_APPLICATION_CREDENTIALS="/home/user/Downloads/service-account-file.json"
Windows
For PowerShell:
$env:GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"Replace KEY_PATH with the path of the JSON file that contains your credentials.
For example:
$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\username\Downloads\service-account-file.json"
For command prompt:
set GOOGLE_APPLICATION_CREDENTIALS=KEY_PATHReplace KEY_PATH with the path of the JSON file that contains your credentials.
Mengimpor library
Tutorial ini menggunakan sistem dan library klien berikut.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat Library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech API untuk Java.
Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat Library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech API untuk Node.js.
Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat Library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech API untuk Python.
Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Menggunakan Text-to-Speech API
Fungsi berikut menggunakan string teks yang diberi tag dengan SSML dan nama file MP3. Fungsi ini menggunakan teks yang diberi tag dengan SSML untuk menghasilkan audio sintetis. Fungsi ini menyimpan audio sintetis ke nama file MP3 yang ditetapkan sebagai parameter.
Seluruh input SSML hanya dapat dibaca oleh satu suara. Anda dapat menetapkan suara pada objek VoiceSelectionParams.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat Library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech API untuk Java.
Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat Library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech API untuk Node.js.
Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat Library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech API untuk Python.
Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Mempersonalisasi audio sintetis
Fungsi berikut menggunakan nama file teks dan mengonversi isi file menjadi string teks yang diberi tag dengan SSML.
Java
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat Library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech API untuk Java.
Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat Library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech API untuk Node.js.
Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Text-to-Speech, lihat Library klien Text-to-Speech. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Text-to-Speech API untuk Python.
Untuk mengautentikasi ke Text-to-Speech, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Menggabungkan semuanya
Program ini menggunakan input berikut.
123 Street Ln, Small Town, IL 12345 USA 1 Jenny St & Number St, Tutone City, CA 86753 1 Piazza del Fibonacci, 12358 Pisa, Italy
Meneruskan teks di atas ke text_to_ssml() akan menghasilkan teks yang diberi tag berikut.
<speak>123 Street Ln, Small Town, IL 12345 USA <break time="2s"/>1 Jenny St & Number St, Tutone City, CA 86753 <break time="2s"/>1 Piazza del Fibonacci, 12358 Pisa, Italy <break time="2s"/></speak>
Menjalankan kode
Untuk menghasilkan file audio ucapan sintetis, jalankan kode berikut dari command line.
Java
Linux atau MacOS
Dari direktori java-docs-samples/texttospeech/cloud-client/, jalankan perintah berikut di command line.
$ mvn clean package
Windows
Dari direktori java-docs-samples/texttospeech/cloud-client/, jalankan perintah berikut di command line.
$ mvn clean package
Node.js
Linux atau MacOS
Di file hybridGlossaries.js, hapus tanda komentar pada variabel yang dikomentari TODO (developer).
Pada perintah berikut, ganti projectId dengan project ID Google Cloud Anda. Dari direktori nodejs-docs-samples/texttospeech, jalankan perintah berikut di command line.
$ node ssmlAddresses.js projectId
Windows
Di file hybridGlossaries.js, hapus tanda komentar pada variabel yang dikomentari TODO (developer).
Pada perintah berikut, ganti projectId dengan project ID Google Cloud Anda. Dari direktori nodejs-docs-samples/texttospeech, jalankan perintah berikut di command line.
$env: C:/Node.js/node.exe C: ssmlAddresses.js projectId
Python
Linux atau MacOS
Dari direktori python-docs-samples/texttospeech/snippets, jalankan perintah berikut di command line.
$ python ssml_addresses.py
Windows
Dari direktori python-docs-samples/texttospeech/snippets, jalankan perintah berikut di command line.
$env: C:/Python3/python.exe C: ssml_addresses.py
Memeriksa output
Program ini menghasilkan file audio example.mp3 yang berisi ucapan sintetis.
Java
Buka direktori java-docs-samples/texttospeech/cloud-client/resources/.
Periksa direktori resources untuk menemukan file example.mp3.
Node.js
Buka direktori nodejs-docs-samples/texttospeech/resources/.
Periksa direktori resources untuk menemukan file example.mp3.
Python
Buka python-docs-samples/texttospeech/snippets/resources.
Periksa direktori resources untuk menemukan file example.mp3.
Dengarkan klip audio berikut untuk memastikan apakah file example.mp3 Anda terdengar sama.
Memecahkan masalah
Jika Anda lupa menetapkan variabel lingkungan GOOGLE_APPLICATION_CREDENTIALS pada command line, pesan error akan muncul:
The Application Default Credentials are not available.
Jika Anda meneruskan
text_to_ssml(), nama file yang tidak ada, pesan error akan muncul:IOError: [Errno 2] No such file or directory
Jika Anda meneruskan
ssml_to_audio(), parameter ssml_text yang berisi None, pesan error akan muncul:InvalidArgument: 400 Invalid input type. Type has to be text or SSML
Pastikan Anda menjalankan kode dari direktori yang benar.
Langkah berikutnya
- Pelajari tag SSML lainnya.
- Pelajari cara menggunakan SSML dengan Terjemahan dan Visi
Pembersihan
Agar akun Google Cloud Platform Anda tidak dikenai biaya untuk resource yang digunakan dalam tutorial ini, gunakan konsolGoogle Cloud untuk menghapus project jika Anda tidak memerlukannya.
Menghapus project Anda
- Di konsolGoogle Cloud , buka halaman Project.
- Dalam daftar project, pilih project yang ingin dihapus, lalu klik Delete.
- Di kotak dialog, ketik project ID, lalu klik Shut down untuk menghapus project.