日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

使用Python實現文字轉語音并生成wav文件的例子

系統 1821 0

目前手邊的一些工作,需要實現聲音播放功能,而且僅支持wav聲音格式。

現在,一些網站上支持文字轉語音功能,但是生成的都是MP3文件,這樣還需要額外的軟件來轉成wav文件,十分麻煩。

后來,研究Python,發現Python可以很容易的實現上面的功能。

步驟如下,

1。使用百度語音實現TTS(Text To Speech),生成mp3文件;

2。 使用pydub和ffmpeg實現mp3轉wav格式。

下面,先上簡單的示例代碼,然后對代碼作簡單的分析。

            
#!/usr/bin/python -tt
# -*- coding: utf-8 -*-
from aip import AipSpeech
from pydub import AudioSegment
 
# Step 1, Using baidu AI to generate mp3 file from text
#input your APP_ID/API_KEY/SECRET_KEY
APP_ID = 'Your_APP_ID' 
API_KEY = 'Your_API_KEY' 
SECRET_KEY = 'Your_Secret_Key' 
 
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) 
result = client.synthesis('你好百度, good morning', 'zh', 1, { 'vol': 5,'per':4 }) 
 
if not isinstance(result, dict): 
 with open('test.mp3', 'wb') as f: 
  f.write(result)
 
# Step 2, convert the mp3 file to wav file
sound = AudioSegment.from_mp3('test.mp3')
sound.export("test.wav", format="wav")
          

運行上面的python代碼,就會生成test.mp3和test.wav,使用命令“aplay test.wav”,可以測試播放聲音。

下面對代碼做解析,

1。在運行之前,需要安裝下面的庫,

1.1 安裝百度AI模塊,安裝命令“pip install baidu-aip”

1.2 安裝pydub,pydub是python的一個音頻處理庫處理,能對wav格式的音頻直接進行處理,安裝命令“pip install pydub”

1.3 安裝ffmpeg,可以實現對mp3格式的處理,安裝命令“sudo apt-get install ffmpeg”

2。需要注冊百度的應用開發者賬戶,

用戶可以自行去下面的網站去注冊語音合成-百度AI?ai.baidu.com,注冊百度云之后,去控制臺創建應用,過程比較簡單。

大家可以對上述代碼進行進一步的優化,以實現自己想要的功能。

下面是完整的Python代碼,大家可以拿來使用,

            
#!/usr/bin/python -tt
# -*- coding: utf-8 -*-
"""
 module: baiduVoiceGenerate
 platform: Linux
 description: Generate Speech from Text, and convert the audio to wav file.
 Precondition: Please install below module before run this progrom,
     1. pip install baidu-aip
     2. pip install pydub
     3. sudo apt-get install ffmpeg
 creater: Guangwei Jiang
 create time: 2018-11-21
"""
from aip import AipSpeech
from pydub import AudioSegment
import time
 
#input your own APP_ID/API_KEY/SECRET_KEY
APP_ID = '14891501' 
API_KEY = 'EIm2iXtvDSplvR5cyHU8dAeM' 
SECRET_KEY = '4KkGGzTq2GVrBEYPLXXWEEIoyLL1F6Zt ' 
 
print("baiduVoiceGenerate: V1.0, by Guanagwei_Jiang, 20181121")
str = raw_input("請輸入要轉成語音的文字: ")
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) 
result = client.synthesis(str, 'zh', 1, { 'vol': 5,'per':4 }) 
 
if not isinstance(result, dict): 
 with open('temp.mp3', 'wb') as f: 
  f.write(result)
 
sound = AudioSegment.from_mp3('temp.mp3')
sound.export(time.strftime("%Y%m%d_%H%M%S", time.localtime())+".wav", format="wav")
          

以上這篇使用Python實現文字轉語音并生成wav文件的例子就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 河曲县| 五华县| 门源| 乌兰浩特市| 连云港市| 卫辉市| 丹巴县| 剑阁县| 西充县| 上栗县| 连江县| 和平区| 富宁县| 东至县| 延川县| 贺州市| 松江区| 盈江县| 芜湖市| 澎湖县| 乐昌市| 西昌市| 永吉县| 阜南县| 元阳县| 甘洛县| 罗甸县| 察哈| 林西县| 望奎县| 南安市| 湖南省| 连城县| 郑州市| 浠水县| 霍邱县| 杨浦区| 屏边| 阿瓦提县| 静海县| 平乐县|