Skip to Content
API 接口文档AI实时音频/直播

AI实时音频/直播接口

专为AI直播、实时语音合成等高实时性要求场景设计的语音克隆接口。该接口能够快速响应并返回实时音频流,适用于直播、在线会议、实时对话等应用场景。

接口特点

  • 超低延迟:针对实时场景优化,响应时间更快
  • 🎙️ 直播专用:专为AI直播、实时语音合成场景设计
  • 🔄 实时流式:支持实时音频流返回
  • 📱 即时响应:适合需要即时反馈的应用

基本信息

项目详情
请求方式GET
接口地址http://8.148.211.142:8080/api/instant/clone-get
适用场景AI直播、实时语音合成、在线对话
响应格式音频流

请求参数

URL参数

参数名类型必填说明
audio_pathsstring参考音频文件的URL地址,用于声音克隆的音频样本
api_keystring您的API密钥,用于身份验证
textstring需要克隆合成的语音文本内容

参数详细说明

audio_paths

  • 格式:完整的音频文件URL
  • 来源:通过 音频上传页面 上传后获得
  • 支持格式:WAV、MP3、M4A
  • 建议规格
    • 时长:5-30秒
    • 音质:清晰无噪音
    • 内容:单人说话,发音清晰

api_key

  • 获取方式:在 API密钥管理页面 生成
  • 格式:以 sk- 开头的字符串
  • 权限要求:需要专业版或无限版用户权限

text

  • 类型:UTF-8编码的文本
  • 长度限制:建议500字符以内(超长文本可能影响实时性)
  • 支持语言:中文、英文等多种语言
  • 特殊字符:URL编码处理

请求示例

基础调用

curl -X GET "http://8.148.211.142:8080/api/instant/clone-get?audio_paths=https://xiaoditest.oss-cn-hangzhou.aliyuncs.com/audio_uploads/808/1750951190043_lby4d6lwoy_jay_promptvn.wav&api_key=sk-56S5DficiTEGwj8f54dGXgeKBhDs323&text=欢迎使用AI实时语音克隆服务"

JavaScript 示例

const params = new URLSearchParams({ audio_paths: 'https://xiaoditest.oss-cn-hangzhou.aliyuncs.com/audio_uploads/808/1750951190043_lby4d6lwoy_jay_promptvn.wav', api_key: 'sk-56S5DficiTEGwj8f54dGXgeKBhDs323', text: '这是一段实时语音合成的测试文本' }); fetch(`http://8.148.211.142:8080/api/instant/clone-get?${params}`) .then(response => response.blob()) .then(audioBlob => { // 处理返回的音频数据 const audioUrl = URL.createObjectURL(audioBlob); const audio = new Audio(audioUrl); audio.play(); }) .catch(error => console.error('Error:', error));

Python 示例

import requests import urllib.parse # 参数设置 params = { 'audio_paths': 'https://xiaoditest.oss-cn-hangzhou.aliyuncs.com/audio_uploads/808/1750951190043_lby4d6lwoy_jay_promptvn.wav', 'api_key': 'sk-56S5DficiTEGwj8f54dGXgeKBhD3Y23', 'text': '这是Python调用实时语音克隆的示例' } # 发送请求 url = 'http://8.148.211.142:8080/api/instant/clone-get' response = requests.get(url, params=params) if response.status_code == 200: # 保存音频文件 with open('real_time_clone_output.wav', 'wb') as f: f.write(response.content) print("音频生成成功!") else: print(f"请求失败: {response.status_code}")

响应说明

成功响应

  • 状态码:200 OK
  • 内容类型audio/wav
  • 响应体:二进制音频数据流

错误响应

当请求失败时,接口会返回相应的错误信息:

状态码说明
400请求参数错误
401API密钥无效或权限不足
404音频文件不存在
429请求频率超限
500服务器内部错误

使用场景

🎥 AI直播

  • 实时语音播报
  • 虚拟主播语音合成
  • 直播间互动回复

💬 在线对话

  • 智能客服语音回复
  • 语音助手实时响应
  • 在线教育语音讲解

🎮 游戏应用

  • 游戏角色配音
  • 实时语音提示
  • 互动娱乐应用

最佳实践

性能优化

  1. 音频样本优化:使用高质量、清晰的音频样本
  2. 文本长度控制:保持文本简洁,提高响应速度
  3. 网络优化:确保网络连接稳定,减少延迟

安全建议

  1. API密钥保护:不要在客户端代码中暴露API密钥
  2. 请求频率控制:合理控制请求频率,避免触发限制
  3. 错误处理:实现完善的错误处理机制

费用说明

⚠️ 重要提醒:AI实时音频/直播接口仅支持专业版、无限版用户使用。

  • 免费版用户无法调用此接口
  • 需要先购买相应套餐:立即购买

技术支持

如果在使用过程中遇到问题:

  1. 检查API密钥是否有效
  2. 确认音频文件URL可正常访问
  3. 验证文本内容是否符合要求
  4. 扫码联系技术支持获取帮助

技术支持微信

技术支持微信二维码

扫码添加技术支持微信

Last updated on