Merge branch 'feat/enhance-multi-modal-support' into deploy/dev

2024-11-16 11:42:29 +08:00 · 2024-10-17 17:23:33 +08:00 · 2024-10-17 17:23:33 +08:00 · 81aafbcf69
commit 81aafbcf69
parent a3e6a965ce 6d818418a3
1 changed files with 2 additions and 2 deletions
--- a/api/core/tools/provider/builtin/podcast_generator/tools/podcast_audio_generator.py
+++ b/api/core/tools/provider/builtin/podcast_generator/tools/podcast_audio_generator.py
@ -26,8 +26,8 @@ class PodcastAudioGeneratorTool(BuiltinTool):
        index: int,
    ) -> tuple[int, Union[AudioSegment, str], Optional[AudioSegment]]:
        try:
-            response = client.audio.speech.create(model="tts-1", voice=voice, input=line.strip())
-            audio = AudioSegment.from_file(io.BytesIO(response.content), format="wav")
+            response = client.audio.speech.create(model="tts-1", voice=voice, input=line.strip(), response_format="wav")
+            audio = AudioSegment.from_wav(io.BytesIO(response.content))
            silence_duration = random.uniform(0.1, 1.5)
            silence = PodcastAudioGeneratorTool._generate_silence(silence_duration)
            return index, audio, silence