客户接入说明

统一接口，接入主流大模型

一个 API Key 即可调用 Claude、GPT、Gemini、DeepSeek、GLM、Kimi、Qwen 等模型，覆盖文本、图片、视频与语音合成。本文档面向技术接入方，以及会自动生成接入代码的 AI 助手，对每类模型只给出一种推荐调用方式以降低歧义。

基本信息

Base URL

https://api.example.com

鉴权方式

Bearer Key / x-api-key / x-goog-api-key

模型列表接口

GET /v1/models

同一个 API Key 可访问当前账号下全部已开放模型。
接入时请直接按本文档给出的方式调用对应模型。
如果只想先验证 Key 是否可用，建议先调用 /v1/models。

快速连通性测试

返回 success: true 且能看到 data 数组，说明 Key 与平台链路正常。

curl "https://api.example.com/v1/models" \
  -H "Authorization: Bearer <YOUR_API_KEY>"

模型清单

按协议归类如下。同类模型切换时通常只需替换 model 字段。

Anthropic Claude 文本

claude-haiku-4-5-20251001claude-opus-4-6 claude-opus-4-7claude-opus-4-8claude-sonnet-4-6

OpenAI GPT / DeepSeek / GLM / Kimi / Qwen

gpt-5.4gpt-5.5 DeepSeek-V4-FlashDeepSeek-V4-Pro glm-4.7glm-5GLM-5.1GLM-5V-Turbo Kimi-K2.6qwen3.6-flashqwen3.6-max-previewqwen3.6-plus

Gemini 文本

gemini-3-flash-previewgemini-3-pro-preview gemini-3.5-flashgemini-3.1-pro-preview

Gemini 图像

gemini-3-pro-image-previewgemini-3.1-flash-image-preview

OpenAI Images 图片生成 / 编辑

gpt-image-2

视频任务 Happyhorse 视频

happyhorse-1.0-t2vhappyhorse-1.0-i2v happyhorse-1.0-r2vhappyhorse-1.0-video-edit

视频任务 Seedance 视频

doubao-seedance-2.0doubao-seedance-2.0-fast

Audio Speech 语音合成

qwen3-tts-flashMiniMax/speech-2.8-turboMiniMax/speech-2.8-hd

Anthropic Claude 文本

接口：POST /v1/messages。鉴权头为 x-api-key，需带 anthropic-version。

curl "https://api.example.com/v1/messages" \
  -H "x-api-key: <YOUR_API_KEY>" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-sonnet-4-6",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "请用一句话介绍你自己"}
    ]
  }'

import requests

resp = requests.post(
    "https://api.example.com/v1/messages",
    headers={
        "x-api-key": "<YOUR_API_KEY>",
        "anthropic-version": "2023-06-01",
        "content-type": "application/json",
    },
    json={
        "model": "claude-sonnet-4-6",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "请用一句话介绍你自己"}
        ],
    },
    timeout=120,
)

resp.raise_for_status()
print(resp.json()["content"][0]["text"])

OpenAI GPT / DeepSeek / GLM / Kimi / Qwen 文本

接口：POST /v1/chat/completions。切换同类模型时只需替换 model。

curl "https://api.example.com/v1/chat/completions" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.4",
    "messages": [
      {"role": "user", "content": "请用一句话介绍你自己"}
    ],
    "max_tokens": 512
  }'

from openai import OpenAI

client = OpenAI(
    api_key="<YOUR_API_KEY>",
    base_url="https://api.example.com/v1",
)

resp = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "user", "content": "请用一句话介绍你自己"}
    ],
    max_tokens=512,
)

print(resp.choices[0].message.content)

部分推理模型会消耗较多输出 token。使用 DeepSeek-V4-Pro 等模型时，建议设置足够的 max_tokens。切换到 DeepSeek-V4-Flash、GLM-5.1、Kimi-K2.6、qwen3.6-plus 等同类模型时，只需替换 model。

Gemini 文本 · 原生协议

接口：POST /v1beta/models/{model}:generateContent。鉴权头为 x-goog-api-key。

curl "https://api.example.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "parts": [
          {"text": "请用一句话介绍你自己"}
        ]
      }
    ]
  }'

import requests

resp = requests.post(
    "https://api.example.com/v1beta/models/gemini-3.5-flash:generateContent",
    headers={
        "x-goog-api-key": "<YOUR_API_KEY>",
        "Content-Type": "application/json",
    },
    json={
        "contents": [
            {
                "parts": [
                    {"text": "请用一句话介绍你自己"}
                ]
            }
        ]
    },
    timeout=120,
)

resp.raise_for_status()
print(resp.json()["candidates"][0]["content"]["parts"][0]["text"])

图片生成 / 编辑

OpenAI Images GPT 图片模型

文生图接口：POST /v1/images/generations。

图像编辑 / 参考图生成接口：POST /v1/images/edits。gpt-image-2 默认返回 base64，图片内容在 data[0].b64_json。

平台限制：n 仅支持省略或传 1，文生图和图像编辑均返回单张图片。

端点选择

场景	接口	请求格式	输入图片字段
文生图	`POST /v1/images/generations`	`application/json`	不需要
本地图片编辑 / 多参考图	`POST /v1/images/edits`	`multipart/form-data`	`image` 或多个 `image[]`
公网 URL / data URL 编辑	`POST /v1/images/edits`	`application/json`	`images[].image_url`
局部重绘	`POST /v1/images/edits`	`multipart/form-data`	`image` + `mask`

curl "https://api.example.com/v1/images/generations" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "生成一张电商主图：白底、极简构图、一只红色陶瓷马克杯，柔和自然光，产品边缘清晰",
    "n": 1,
    "size": "1536x1024",
    "quality": "high",
    "output_format": "png"
  }'

curl "https://api.example.com/v1/images/edits" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -F "model=gpt-image-2" \
  -F "prompt=保留人物主体、姿势和服装，把背景替换为傍晚海边，整体电影感，边缘自然融合" \
  -F "image=@input.png" \
  -F "n=1" \
  -F "size=1024x1024" \
  -F "quality=high" \
  -F "output_format=png"

curl "https://api.example.com/v1/images/edits" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -F "model=gpt-image-2" \
  -F "prompt=参考图1的人物外观、参考图2的服装风格、参考图3的背景氛围，生成一张自然的半身商业肖像" \
  -F "image[]=@person.png" \
  -F "image[]=@style.png" \
  -F "image[]=@background.png" \
  -F "input_fidelity=high" \
  -F "n=1" \
  -F "size=1536x1024" \
  -F "quality=high" \
  -F "output_format=png"

curl "https://api.example.com/v1/images/edits" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "基于参考图生成一张同款产品的节日海报，保留产品外观，增加红色礼盒和暖色灯光",
    "images": [
      {"image_url": "https://example.com/product.png"},
      {"image_url": "data:image/png;base64,<BASE64>"}
    ],
    "n": 1,
    "size": "1024x1536",
    "quality": "high",
    "output_format": "png",
    "input_fidelity": "high"
  }'

curl "https://api.example.com/v1/images/edits" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -F "model=gpt-image-2" \
  -F "prompt=只替换透明遮罩区域：把桌上的空杯子改成一杯拿铁，其他区域保持不变" \
  -F "image=@input.png" \
  -F "mask=@mask.png" \
  -F "n=1" \
  -F "size=1024x1024" \
  -F "quality=high" \
  -F "output_format=png"

import base64
import requests

resp = requests.post(
    "https://api.example.com/v1/images/generations",
    headers={
        "Authorization": "Bearer <YOUR_API_KEY>",
        "Content-Type": "application/json",
    },
    json={
        "model": "gpt-image-2",
        "prompt": "生成一张极简蓝色圆形应用图标，白色背景，轻微玻璃质感",
        "n": 1,
        "size": "1024x1024",
        "quality": "medium",
        "output_format": "png",
    },
    timeout=180,
)

resp.raise_for_status()
image_b64 = resp.json()["data"][0]["b64_json"]

with open("output.png", "wb") as f:
    f.write(base64.b64decode(image_b64))

返回说明：生成和编辑的返回结构一致。GPT 图片模型默认返回 data[0].b64_json，前端可拼成 data:image/png;base64,... 预览，后端可 base64 解码后保存为文件。response_format 适用于 DALL-E 系列，gpt-image-2 无需传该参数。

常用参数

参数	适用接口	说明
`prompt`	生成 / 编辑	必填。描述目标图片，编辑场景要明确哪些元素保持不变、哪些元素需要替换。
`n`	生成 / 编辑	仅支持省略或传 `1`。
`size`	生成 / 编辑	常用 `1024x1024`、`1536x1024`、`1024x1536`、`auto`。`gpt-image-2` 也支持 `WIDTHxHEIGHT`，宽高需为 16 的倍数，宽高比建议保持在 `1:3` 到 `3:1`。
`quality`	生成 / 编辑	可传 `low`、`medium`、`high`、`auto`。质量越高通常耗时和成本越高。
`output_format`	生成 / 编辑	可传 `png`、`jpeg`、`webp`。使用 `jpeg` / `webp` 时可额外传 `output_compression`。
`image` / `image[]`	编辑	multipart 上传本地文件。单图可用 `image`，多图用多个 `image[]` 字段。
`images`	编辑	JSON 方式输入图片引用，元素形如 `{"image_url": "https://..."}` 或 data URL。
`input_fidelity`	编辑	可传 `high` 或 `low`。需要尽量保留参考图人物、产品、构图时传 `high`。
`mask`	编辑	局部重绘用。遮罩图需和原图尺寸一致，并带透明通道。

本地图片编辑使用 multipart/form-data，公网 URL 或 data URL 编辑可使用 JSON。
多参考图使用多个 image[] 字段，或在 JSON 中传入多个 images 元素。
图片 base64 体积较大，建议将 HTTP 超时时间设置为 180 秒或更高。

Gemini 图片模型 · 原生协议

接口：POST /v1beta/models/{model}:generateContent。

curl "https://api.example.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "x-goog-api-key: <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "parts": [
          {"text": "生成一张极简蓝色圆形图标，白色背景"}
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"]
    }
  }'

返回结构说明：图片 base64 返回在 candidates[0].content.parts[*].text 字段中，不要按 Gemini 官方 inlineData.data 方式解析。需要保存图片时，取出对应 text 字段内容后自行做 base64 解码。

返回示例（伪结构）：

{
  "candidates": [
    {
      "content": {
        "parts": [
          {
            "text": "<image_base64>"
          }
        ]
      }
    }
  ]
}

视频生成

Happyhorse 系列 · `/v1/videos`

视频生成是异步任务。创建任务后返回 id / task_id，需通过 GET /v1/videos/{task_id} 轮询结果。素材图片 / 视频必须通过公网可访问 URL 提供。

curl -X POST "https://api.example.com/v1/videos" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "happyhorse-1.0-t2v",
    "input": {
      "prompt": "一匹白色小马在草原上奔跑，阳光明媚，电影感镜头"
    },
    "parameters": {
      "resolution": "720P",
      "duration": 5,
      "ratio": "16:9",
      "watermark": false
    }
  }'

# 图片必须通过公网可访问 URL 提供
curl -X POST "https://api.example.com/v1/videos" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "happyhorse-1.0-i2v",
    "input": {
      "prompt": "让图片中的人物自然挥手，背景保持稳定",
      "media": [
        {
          "type": "input_image",
          "url": "https://example.com/input.jpg"
        }
      ]
    },
    "parameters": {
      "resolution": "720P",
      "duration": 5,
      "watermark": false
    }
  }'

# 参考图片必须通过公网可访问 URL 提供
curl -X POST "https://api.example.com/v1/videos" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "happyhorse-1.0-r2v",
    "input": {
      "prompt": "[Image 1]中的人物向镜头挥手，保持人物特征一致",
      "media": [
        {
          "type": "reference_image",
          "url": "https://example.com/reference-1.jpg"
        },
        {
          "type": "reference_image",
          "url": "https://example.com/reference-2.jpg"
        }
      ]
    },
    "parameters": {
      "resolution": "720P",
      "duration": 3,
      "ratio": "16:9",
      "watermark": false
    }
  }'

# 输入视频必须通过公网可访问 URL 提供
# duration 放在顶层，用于计费用时；media.type 使用 video
curl -X POST "https://api.example.com/v1/videos" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "happyhorse-1.0-video-edit",
    "duration": 3,
    "input": {
      "prompt": "将视频调整为电影感暖色调，保持主体动作自然",
      "media": [
        {
          "type": "video",
          "url": "https://example.com/input.mp4"
        }
      ]
    },
    "parameters": {
      "resolution": "720P",
      "watermark": false,
      "audio_setting": "origin"
    }
  }'

curl "https://api.example.com/v1/videos/<task_id>" \
  -H "Authorization: Bearer <YOUR_API_KEY>"

创建任务响应示例：

{
  "id": "task_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
  "task_id": "task_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
  "model": "happyhorse-1.0-video-edit",
  "status": "queued",
  "created_at": 1779381684
}

任务完成响应示例（结果视频地址在 metadata.url）：

{
  "id": "task_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
  "task_id": "task_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
  "model": "happyhorse-1.0-video-edit",
  "status": "completed",
  "progress": 100,
  "metadata": {
    "url": "https://example.com/generated-video.mp4"
  },
  "error": null
}

状态包括 queued、in_progress、completed、failed、cancelled。
素材 URL 必须公网可访问，应为图片或视频文件直链；不支持本地路径，不建议 base64，不要使用需登录 / Cookie / 内网访问的地址。

Seedance 2.0 · `/v1/video/generations`

字节豆包 Seedance 视频模型，使用独立端点 /v1/video/generations（与 Happyhorse 的 /v1/videos 不同），返回结构也不同。同样是异步任务：提交 → 轮询。

doubao-seedance-2.0 · 标准版（画质更好） doubao-seedance-2.0-fast · 快速版（生成更快）

Seedance 2.0 当前使用 zlhub 第二批接入链路。请按 KJAPI 兼容格式调用，不要把上游原生 content 数组直接放在请求顶层。

普通文生视频：保留顶层 model 与 prompt，把 resolution、ratio、duration、generate_audio 等生成参数放入 metadata。
简单参考图片：使用顶层 images 数组，数组项可以是公网图片 URL 或审核后的 Asset://... 地址。
需要首尾帧、参考视频、参考音频或显式 role 时，把上游素材数组放入 metadata.content，同时保留顶层 prompt。

时长参数实测说明：如需严格控制时长，建议同时在 metadata.duration 中设置秒数，并在 prompt 末尾追加官方 legacy 参数，例如 --dur 15 --rs 720p --rt 16:9 --wm false。实测 --dur 15 可生成约 15 秒视频。

curl "https://api.example.com/v1/video/generations" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedance-2.0",
    "prompt": "一个中国男孩在挥舞一把宝剑 --dur 4 --rs 720p --rt 16:9 --wm false",
    "metadata": {
      "resolution": "720p",
      "ratio": "16:9",
      "duration": 4,
      "generate_audio": false
    }
  }'

curl "https://api.example.com/v1/video/generations" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedance-2.0",
    "prompt": "以图片1作为首帧、图片2作为尾帧，生成一段自然流畅的产品转场视频，保持主体一致 --dur 4 --rs 720p --rt adaptive --wm false",
    "metadata": {
      "content": [
        {
          "type": "image_url",
          "image_url": {
            "url": "https://example.com/first-frame.jpg"
          },
          "role": "first_frame"
        },
        {
          "type": "image_url",
          "image_url": {
            "url": "https://example.com/last-frame.jpg"
          },
          "role": "last_frame"
        }
      ],
      "resolution": "720p",
      "ratio": "adaptive",
      "duration": 4,
      "generate_audio": false,
      "watermark": false,
      "return_last_frame": true
    }
  }'

curl "https://api.example.com/v1/video/generations" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedance-2.0-fast",
    "prompt": "参考图片1的人物外观、参考视频1的镜头运动、参考音频1的节奏，生成一段电影感短视频 --dur 4 --rs 720p --rt 16:9 --wm false",
    "metadata": {
      "content": [
        {
          "type": "image_url",
          "image_url": {
            "url": "https://example.com/reference-image.jpg"
          },
          "role": "reference_image"
        },
        {
          "type": "video_url",
          "video_url": {
            "url": "https://example.com/reference-video.mp4"
          },
          "role": "reference_video"
        },
        {
          "type": "audio_url",
          "audio_url": {
            "url": "https://example.com/reference-audio.mp3"
          },
          "role": "reference_audio"
        }
      ],
      "resolution": "720p",
      "ratio": "16:9",
      "duration": 4,
      "generate_audio": true,
      "watermark": false
    }
  }'

curl "https://api.example.com/v1/video/generations/<task_id>" \
  -H "Authorization: Bearer <YOUR_API_KEY>"

提交任务返回 task_id，状态为 queued：

{
  "id": "task_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
  "task_id": "task_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
  "status": "queued"
}

轮询：生成中为 IN_PROGRESS，完成为 SUCCESS，取 data.result_url 下载（链接有效期约 7 天）：

{
  "data": {
    "status": "SUCCESS",
    "progress": "100%",
    "result_url": "https://.../task.mp4?sign=..."
  }
}

参数	类型	说明
`model`	string	模型名，见上表
`prompt`	string	提示词；必须保留在顶层。严格控制时长时建议在末尾追加 `--dur N`
`images`	array	简单参考图片数组；支持公网 URL 或审核后返回的 `Asset://...`
`metadata`	object	生成参数和高级素材参数容器；推荐把 `resolution`、`ratio`、`duration`、`generate_audio` 放在这里
`metadata.content`	array	多模态输入数组。需要参考视频、音频、首尾帧或指定 `role` 时使用
`metadata.resolution`	string	`480p` / `720p` / `1080p`；快速版通常建议用 `720p`
`metadata.ratio`	string	`16:9` / `9:16` / `1:1` / `4:3` / `3:4` / `21:9` / `adaptive`
`metadata.duration`	int	时长（秒）。当前链路如需严格生效，建议同时在 `prompt` 末尾追加 `--dur N`
`metadata.generate_audio`	bool	是否生成或使用音频；使用参考音频时通常设为 `true`
`metadata.watermark`	bool	是否添加水印
`metadata.return_last_frame`	bool	是否在结果中返回最后一帧图片 URL

Seedance `metadata.content` 素材项写法

用途	`type`	URL 字段	`role`
提示词	`text`	`text`	不需要
首帧图片	`image_url`	`image_url.url`	`first_frame`
尾帧图片	`image_url`	`image_url.url`	`last_frame`
参考图片	`image_url`	`image_url.url`	`reference_image`
参考视频	`video_url`	`video_url.url`	`reference_video`
参考音频	`audio_url`	`audio_url.url`	`reference_audio`

图片、视频、音频都必须使用公网可访问的文件直链，不支持本地路径，不要使用需要登录、Cookie 或内网访问的地址。
简单图片参考优先使用顶层 images。需要明确首尾帧、参考视频、参考音频或素材 role 时，再使用 metadata.content。
参考素材在提示词中可用“图片1 / 视频1 / 音频1”等方式指代，顺序对应 metadata.content 数组里的素材顺序。
只使用首尾帧时，建议标准版 doubao-seedance-2.0；普通参考素材追求速度时可用快速版。
如需指定时长，建议设置 metadata.duration，并在提示词末尾追加 --dur N，例如 --dur 15。

真人 / 仿真人参考图素材审核

如果参考图片中包含真人或仿真人形象，需先调用素材审核 / 虚拟人像创建接口，拿到 Asset://... 资源地址后，再传给 Seedance 视频生成接口。请确保上传图片拥有合法使用权，不要上传侵害他人权益的素材。

同步接口通常会在数秒内返回审核结果，成功后可立即使用 asset_urls[0]。该接口使用客户自己的 API Key 鉴权，平台会代为转发到上游，客户无需也不应传上游素材审核认证。

curl "https://api.example.com/v1/seedance/assets/sync" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "images": ["https://example.com/person-reference.jpg"],
    "asset_type": "Image"
  }'

curl "https://api.example.com/v1/seedance/assets/async" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "images": ["https://example.com/person-reference.jpg"],
    "asset_type": "Image"
  }'

curl "https://api.example.com/v1/seedance/assets/tasks/<task_id>" \
  -H "Authorization: Bearer <YOUR_API_KEY>"

curl "https://api.example.com/v1/video/generations" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedance-2.0",
    "prompt": "使用参考图中的主体，在香港雨夜街头生成一段电影感视频 --dur 4 --rs 720p --rt 16:9 --wm false",
    "images": ["Asset://asset-xxxxxxxxxxxxxxxx"],
    "metadata": {
      "resolution": "720p",
      "ratio": "16:9",
      "duration": 4,
      "generate_audio": false
    }
  }'

同步审核成功响应示例：

{
  "track_id": "track_xxxxxxxxxxxxxxxx",
  "mode": "sync",
  "code": 200,
  "status": "completed",
  "task_id": "task_xxxxxxxxxxxxxxxx",
  "asset_urls": ["Asset://asset-xxxxxxxxxxxxxxxx"]
}

异步创建任务会先返回 task_id，再通过查询接口取 asset_urls：

{
  "track_id": "track_xxxxxxxxxxxxxxxx",
  "mode": "async",
  "code": 202,
  "task_id": "task_xxxxxxxxxxxxxxxx"
}

images 支持公网图片 URL、base64 字符串或 data URI；建议单次最多 10 张。
KJAPI 不会把图片另存到本地容器，只校验客户 API Key 后转发请求并返回上游结果。
素材审核接口当前不单独计费；后续视频生成仍按对应 Seedance 模型正常计费。
普通非真人参考图可继续直接传公网 URL；涉及真人 / 仿真人时使用 Asset://... 更稳妥。

建议每隔 30 秒轮询一次，最多等待约 10 分钟超时。4 秒视频标准版约 2–3 分钟、快速版约 1–2 分钟。

语音合成 TTS · `/v1/audio/speech`

以下模型统一使用该接口：qwen3-tts-flash、MiniMax/speech-2.8-turbo、MiniMax/speech-2.8-hd。返回音频二进制，需按文件流保存。

curl "https://api.example.com/v1/audio/speech" \
  -H "Authorization: Bearer <YOUR_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-tts-flash",
    "input": "你好，这是一个测试。",
    "voice": "Cherry"
  }' \
  --output speech.wav

import requests

resp = requests.post(
    "https://api.example.com/v1/audio/speech",
    headers={
        "Authorization": "Bearer <YOUR_API_KEY>",
        "Content-Type": "application/json",
    },
    json={
        "model": "qwen3-tts-flash",
        "input": "你好，这是一个测试。",
        "voice": "Cherry",
    },
    timeout=180,
)

resp.raise_for_status()
with open("speech.wav", "wb") as f:
    f.write(resp.content)

qwen3-tts-flash

voice：Cherry

MiniMax/speech-2.8-turbo

voice：male-qn-qingse

MiniMax/speech-2.8-hd

voice：male-qn-qingse

可选参数 response_format：指定音频格式，例如 mp3。
可选参数 speed：调整语速。

Claude thinking 使用说明

如需 Claude thinking，可在 Anthropic 接口里传入 thinking 参数。

{
  "model": "claude-sonnet-4-6",
  "max_tokens": 4096,
  "thinking": {
    "type": "enabled",
    "budget_tokens": 8192
  },
  "messages": [
    {
      "role": "user",
      "content": "证明根号 2 是无理数，并写出完整步骤"
    }
  ]
}

claude-sonnet-4-6 可返回 thinking / signature。
claude-opus-4-7 如需使用 thinking，建议先单独验证业务请求。
如果只是普通聊天，不需要传 thinking。

模型接入方式汇总

模型类型	接入方式
Claude	Anthropic `/v1/messages`
GPT / DeepSeek / GLM / Kimi / Qwen 文本	OpenAI `/v1/chat/completions`
Gemini 文本	Gemini 原生 `POST /v1beta/models/{model}:generateContent`
Gemini 图像相关模型	Gemini 原生 `POST /v1beta/models/{model}:generateContent`
图片生成 / 编辑	`/v1/images/generations` / `/v1/images/edits`
视频生成	`/v1/videos` / `/v1/video/generations`
Seedance 真人 / 仿真人素材审核	`/v1/seedance/assets/sync` / `/v1/seedance/assets/async` / `/v1/seedance/assets/tasks/{task_id}`
TTS	`/v1/audio/speech`

接入注意事项

GET /v1/models 返回的是当前 Key 可见的模型集合，接入前建议先拉取一次。
接入时请直接采用本文档对应模型的接口与请求格式。
Gemini 系列使用本文档中的原生接口与请求格式。
视频接口为异步任务接口，不能按普通文本接口理解。
Seedance 参考图若涉及真人 / 仿真人，请先完成素材审核并使用返回的 Asset://... 地址。
TTS 返回的是音频二进制内容，客户端要按文件流保存。

统一接口，接入主流大模型

基本信息

快速连通性测试

模型清单

Anthropic Claude 文本

OpenAI GPT / DeepSeek / GLM / Kimi / Qwen 文本

Gemini 文本 · 原生协议

图片生成 / 编辑

OpenAI Images GPT 图片模型

Gemini 图片模型 · 原生协议

视频生成

Happyhorse 系列 · /v1/videos

Seedance 2.0 · /v1/video/generations

Seedance metadata.content 素材项写法

真人 / 仿真人参考图素材审核

语音合成 TTS · /v1/audio/speech

Claude thinking 使用说明

模型接入方式汇总

接入注意事项

Happyhorse 系列 · `/v1/videos`

Seedance 2.0 · `/v1/video/generations`

Seedance `metadata.content` 素材项写法

语音合成 TTS · `/v1/audio/speech`