GitHub Action commited on
Commit
5593599
·
1 Parent(s): 70c3d88

Sync from GitHub: 70c3d88

Browse files
Files changed (1) hide show
  1. tab_uniaudio_demo.py +7 -0
tab_uniaudio_demo.py CHANGED
@@ -177,6 +177,8 @@ def load_and_merge_ips(original_dict: dict, filepath: str) -> dict:
177
 
178
  IP_DICT = load_and_merge_ips(IP_DICT, "uniaudio_ip_list.txt")
179
 
 
 
180
 
181
  class MingOmniTTSDemoTab:
182
  """
@@ -212,6 +214,7 @@ class MingOmniTTSDemoTab:
212
  value="emotion",
213
  )
214
  i_tts_text = gr.Textbox(label="合成文本", info="输入要合成的语音文本。")
 
215
  i_tts_prompt = gr.Audio(
216
  type="filepath",
217
  label="参考音频 (3-7秒)上传一段清晰的人声音频用于克隆基础音色。",
@@ -292,6 +295,7 @@ class MingOmniTTSDemoTab:
292
  zs_tts_text = gr.Textbox(
293
  label="目标文本", info="输入您想合成的语音文本。"
294
  )
 
295
  zs_tts_prompt = gr.Audio(
296
  type="filepath",
297
  label="参考音频 (3-7秒)上传一段清晰的人声音频用于克隆音色。",
@@ -313,11 +317,13 @@ class MingOmniTTSDemoTab:
313
  label="对话脚本",
314
  info="使用 'speaker_1:', 'speaker_2:' 区分不同说话人。e.g. speaker_1:就比如说各种就是给别人提供,提供帮助的都可以说是服务的\n speaker_2:是的 不管是什么,就是说感觉都是,大家都,都可以说是服务业的一方面\n",
315
  )
 
316
  pod_prompt1 = gr.Audio(
317
  type="filepath",
318
  label="说话人1参考音频",
319
  sources=["upload", "microphone"],
320
  )
 
321
  pod_prompt2 = gr.Audio(
322
  type="filepath",
323
  label="说话人2参考音频",
@@ -337,6 +343,7 @@ class MingOmniTTSDemoTab:
337
  with gr.Row():
338
  with gr.Column(scale=2):
339
  swb_text = gr.Textbox(label="语音文本")
 
340
  swb_prompt = gr.Audio(
341
  type="filepath",
342
  label="说话人参考音频",
 
177
 
178
  IP_DICT = load_and_merge_ips(IP_DICT, "uniaudio_ip_list.txt")
179
 
180
+ REFERENCE_AUDIO_WARNING = "**⚠️ 注意:参考音频建议长度约为 3-7 秒,过长的音频可能导致输出异常。您可以使用下方的音频控件对音频进行剪辑。**"
181
+
182
 
183
  class MingOmniTTSDemoTab:
184
  """
 
214
  value="emotion",
215
  )
216
  i_tts_text = gr.Textbox(label="合成文本", info="输入要合成的语音文本。")
217
+ gr.Markdown(REFERENCE_AUDIO_WARNING)
218
  i_tts_prompt = gr.Audio(
219
  type="filepath",
220
  label="参考音频 (3-7秒)上传一段清晰的人声音频用于克隆基础音色。",
 
295
  zs_tts_text = gr.Textbox(
296
  label="目标文本", info="输入您想合成的语音文本。"
297
  )
298
+ gr.Markdown(REFERENCE_AUDIO_WARNING)
299
  zs_tts_prompt = gr.Audio(
300
  type="filepath",
301
  label="参考音频 (3-7秒)上传一段清晰的人声音频用于克隆音色。",
 
317
  label="对话脚本",
318
  info="使用 'speaker_1:', 'speaker_2:' 区分不同说话人。e.g. speaker_1:就比如说各种就是给别人提供,提供帮助的都可以说是服务的\n speaker_2:是的 不管是什么,就是说感觉都是,大家都,都可以说是服务业的一方面\n",
319
  )
320
+ gr.Markdown(REFERENCE_AUDIO_WARNING)
321
  pod_prompt1 = gr.Audio(
322
  type="filepath",
323
  label="说话人1参考音频",
324
  sources=["upload", "microphone"],
325
  )
326
+ gr.Markdown(REFERENCE_AUDIO_WARNING)
327
  pod_prompt2 = gr.Audio(
328
  type="filepath",
329
  label="说话人2参考音频",
 
343
  with gr.Row():
344
  with gr.Column(scale=2):
345
  swb_text = gr.Textbox(label="语音文本")
346
+ gr.Markdown(REFERENCE_AUDIO_WARNING)
347
  swb_prompt = gr.Audio(
348
  type="filepath",
349
  label="说话人参考音频",