AI实时音频/直播接口

专为AI直播、实时语音合成等高实时性要求场景设计的语音克隆接口。该接口能够快速响应并返回实时音频流，适用于直播、在线会议、实时对话等应用场景。

接口特点

⚡ 超低延迟：针对实时场景优化，响应时间更快
🎙️ 直播专用：专为AI直播、实时语音合成场景设计
🔄 实时流式：支持实时音频流返回
📱 即时响应：适合需要即时反馈的应用

基本信息

项目	详情
请求方式	GET
接口地址	`http://8.148.211.142:8080/api/instant/clone-get`
适用场景	AI直播、实时语音合成、在线对话
响应格式	音频流

请求参数

URL参数

参数名	类型	必填	说明
`audio_paths`	string	是	参考音频文件的URL地址，用于声音克隆的音频样本
`api_key`	string	是	您的API密钥，用于身份验证
`text`	string	是	需要克隆合成的语音文本内容
`speed`	float	否	语速调节参数，范围 0.5-2.0，默认值为 1.0。值越大语速越快，值越小语速越慢

参数详细说明

`audio_paths`

格式：完整的音频文件URL
来源：通过音频上传页面上传后获得
支持格式：WAV、MP3、M4A
建议规格：
- 时长：5-30秒
- 音质：清晰无噪音
- 内容：单人说话，发音清晰

`api_key`

获取方式：在 API密钥管理页面生成
格式：以 sk- 开头的字符串
权限要求：需要专业版或无限版用户权限

`text`

类型：UTF-8编码的文本
长度限制：建议500字符以内（超长文本可能影响实时性）
支持语言：中文、英文等多种语言
特殊字符：URL编码处理

`speed`

类型：浮点数
范围：0.5-2.0
默认值：1.0
说明：
- 0.5：最慢语速（原速度的50%）
- 1.0：正常语速（默认）
- 1.5：1.5倍速
- 2.0：最快语速（原速度的2倍）

请求示例

基础调用


curl -X GET "http://8.148.211.142:8080/api/instant/clone-get?audio_paths=https://xiaoditest.oss-cn-hangzhou.aliyuncs.com/audio_uploads/808/1750951190043_lby4d6lwoy_jay_promptvn.wav&api_key=sk-56S5DficiTEGwj8f54dGXgeKBhDs323&text=欢迎使用AI实时语音克隆服务"

使用语速参数


curl -X GET "http://8.148.211.142:8080/api/instant/clone-get?audio_paths=https://xiaoditest.oss-cn-hangzhou.aliyuncs.com/audio_uploads/808/1750951190043_lby4d6lwoy_jay_promptvn.wav&api_key=sk-56S5DficiTEGwj8f54dGXgeKBhDs323&text=欢迎使用AI实时语音克隆服务&speed=1.5"

JavaScript 示例


const params = new URLSearchParams({
    audio_paths: 'https://xiaoditest.oss-cn-hangzhou.aliyuncs.com/audio_uploads/808/1750951190043_lby4d6lwoy_jay_promptvn.wav',
    api_key: 'sk-56S5DficiTEGwj8f54dGXgeKBhDs323',
    text: '这是一段实时语音合成的测试文本',
    speed: 1.2  // 可选：设置语速为1.2倍
});
 
fetch(`http://8.148.211.142:8080/api/instant/clone-get?${params}`)
    .then(response => response.blob())
    .then(audioBlob => {
        // 处理返回的音频数据
        const audioUrl = URL.createObjectURL(audioBlob);
        const audio = new Audio(audioUrl);
        audio.play();
    })
    .catch(error => console.error('Error:', error));

Python 示例


import requests
import urllib.parse
 
# 参数设置
params = {
    'audio_paths': 'https://xiaoditest.oss-cn-hangzhou.aliyuncs.com/audio_uploads/808/1750951190043_lby4d6lwoy_jay_promptvn.wav',
    'api_key': 'sk-56S5DficiTEGwj8f54dGXgeKBhD3Y23',
    'text': '这是Python调用实时语音克隆的示例',
    'speed': 1.2  # 可选：设置语速为1.2倍
}
 
# 发送请求
url = 'http://8.148.211.142:8080/api/instant/clone-get'
response = requests.get(url, params=params)
 
if response.status_code == 200:
    # 保存音频文件
    with open('real_time_clone_output.wav', 'wb') as f:
        f.write(response.content)
    print("音频生成成功！")
else:
    print(f"请求失败: {response.status_code}")

响应说明

成功响应

状态码：200 OK
内容类型：audio/wav
响应体：二进制音频数据流

错误响应

当请求失败时，接口会返回相应的错误信息：

状态码	说明
400	请求参数错误
401	API密钥无效或权限不足
404	音频文件不存在
429	请求频率超限
500	服务器内部错误

使用场景

🎥 AI直播

实时语音播报
虚拟主播语音合成
直播间互动回复

💬 在线对话

智能客服语音回复
语音助手实时响应
在线教育语音讲解

🎮 游戏应用

游戏角色配音
实时语音提示
互动娱乐应用

最佳实践

性能优化

音频样本优化：使用高质量、清晰的音频样本
文本长度控制：保持文本简洁，提高响应速度
网络优化：确保网络连接稳定，减少延迟

安全建议

API密钥保护：不要在客户端代码中暴露API密钥
请求频率控制：合理控制请求频率，避免触发限制
错误处理：实现完善的错误处理机制

费用说明

⚠️ 重要提醒：AI实时音频/直播接口仅支持专业版、无限版用户使用。

免费版用户无法调用此接口
需要先购买相应套餐：立即购买

技术支持

如果在使用过程中遇到问题：

检查API密钥是否有效
确认音频文件URL可正常访问
验证文本内容是否符合要求
扫码联系技术支持获取帮助

技术支持微信

扫码添加技术支持微信