Spaces:
Running
Running
GitHub Action commited on
Commit ·
5593599
1
Parent(s): 70c3d88
Sync from GitHub: 70c3d88
Browse files- tab_uniaudio_demo.py +7 -0
tab_uniaudio_demo.py
CHANGED
|
@@ -177,6 +177,8 @@ def load_and_merge_ips(original_dict: dict, filepath: str) -> dict:
|
|
| 177 |
|
| 178 |
IP_DICT = load_and_merge_ips(IP_DICT, "uniaudio_ip_list.txt")
|
| 179 |
|
|
|
|
|
|
|
| 180 |
|
| 181 |
class MingOmniTTSDemoTab:
|
| 182 |
"""
|
|
@@ -212,6 +214,7 @@ class MingOmniTTSDemoTab:
|
|
| 212 |
value="emotion",
|
| 213 |
)
|
| 214 |
i_tts_text = gr.Textbox(label="合成文本", info="输入要合成的语音文本。")
|
|
|
|
| 215 |
i_tts_prompt = gr.Audio(
|
| 216 |
type="filepath",
|
| 217 |
label="参考音频 (3-7秒)上传一段清晰的人声音频用于克隆基础音色。",
|
|
@@ -292,6 +295,7 @@ class MingOmniTTSDemoTab:
|
|
| 292 |
zs_tts_text = gr.Textbox(
|
| 293 |
label="目标文本", info="输入您想合成的语音文本。"
|
| 294 |
)
|
|
|
|
| 295 |
zs_tts_prompt = gr.Audio(
|
| 296 |
type="filepath",
|
| 297 |
label="参考音频 (3-7秒)上传一段清晰的人声音频用于克隆音色。",
|
|
@@ -313,11 +317,13 @@ class MingOmniTTSDemoTab:
|
|
| 313 |
label="对话脚本",
|
| 314 |
info="使用 'speaker_1:', 'speaker_2:' 区分不同说话人。e.g. speaker_1:就比如说各种就是给别人提供,提供帮助的都可以说是服务的\n speaker_2:是的 不管是什么,就是说感觉都是,大家都,都可以说是服务业的一方面\n",
|
| 315 |
)
|
|
|
|
| 316 |
pod_prompt1 = gr.Audio(
|
| 317 |
type="filepath",
|
| 318 |
label="说话人1参考音频",
|
| 319 |
sources=["upload", "microphone"],
|
| 320 |
)
|
|
|
|
| 321 |
pod_prompt2 = gr.Audio(
|
| 322 |
type="filepath",
|
| 323 |
label="说话人2参考音频",
|
|
@@ -337,6 +343,7 @@ class MingOmniTTSDemoTab:
|
|
| 337 |
with gr.Row():
|
| 338 |
with gr.Column(scale=2):
|
| 339 |
swb_text = gr.Textbox(label="语音文本")
|
|
|
|
| 340 |
swb_prompt = gr.Audio(
|
| 341 |
type="filepath",
|
| 342 |
label="说话人参考音频",
|
|
|
|
| 177 |
|
| 178 |
IP_DICT = load_and_merge_ips(IP_DICT, "uniaudio_ip_list.txt")
|
| 179 |
|
| 180 |
+
REFERENCE_AUDIO_WARNING = "**⚠️ 注意:参考音频建议长度约为 3-7 秒,过长的音频可能导致输出异常。您可以使用下方的音频控件对音频进行剪辑。**"
|
| 181 |
+
|
| 182 |
|
| 183 |
class MingOmniTTSDemoTab:
|
| 184 |
"""
|
|
|
|
| 214 |
value="emotion",
|
| 215 |
)
|
| 216 |
i_tts_text = gr.Textbox(label="合成文本", info="输入要合成的语音文本。")
|
| 217 |
+
gr.Markdown(REFERENCE_AUDIO_WARNING)
|
| 218 |
i_tts_prompt = gr.Audio(
|
| 219 |
type="filepath",
|
| 220 |
label="参考音频 (3-7秒)上传一段清晰的人声音频用于克隆基础音色。",
|
|
|
|
| 295 |
zs_tts_text = gr.Textbox(
|
| 296 |
label="目标文本", info="输入您想合成的语音文本。"
|
| 297 |
)
|
| 298 |
+
gr.Markdown(REFERENCE_AUDIO_WARNING)
|
| 299 |
zs_tts_prompt = gr.Audio(
|
| 300 |
type="filepath",
|
| 301 |
label="参考音频 (3-7秒)上传一段清晰的人声音频用于克隆音色。",
|
|
|
|
| 317 |
label="对话脚本",
|
| 318 |
info="使用 'speaker_1:', 'speaker_2:' 区分不同说话人。e.g. speaker_1:就比如说各种就是给别人提供,提供帮助的都可以说是服务的\n speaker_2:是的 不管是什么,就是说感觉都是,大家都,都可以说是服务业的一方面\n",
|
| 319 |
)
|
| 320 |
+
gr.Markdown(REFERENCE_AUDIO_WARNING)
|
| 321 |
pod_prompt1 = gr.Audio(
|
| 322 |
type="filepath",
|
| 323 |
label="说话人1参考音频",
|
| 324 |
sources=["upload", "microphone"],
|
| 325 |
)
|
| 326 |
+
gr.Markdown(REFERENCE_AUDIO_WARNING)
|
| 327 |
pod_prompt2 = gr.Audio(
|
| 328 |
type="filepath",
|
| 329 |
label="说话人2参考音频",
|
|
|
|
| 343 |
with gr.Row():
|
| 344 |
with gr.Column(scale=2):
|
| 345 |
swb_text = gr.Textbox(label="语音文本")
|
| 346 |
+
gr.Markdown(REFERENCE_AUDIO_WARNING)
|
| 347 |
swb_prompt = gr.Audio(
|
| 348 |
type="filepath",
|
| 349 |
label="说话人参考音频",
|