OpenAI Python SDK 完整参考

基于 openai v2.36.0 官方源码 & README · 部署于 api-ref.karenepitaya.xyz/openai/

1. 安装
2. 快速开始 (Responses API)
3. Chat Completions API
4. 模型列表
5. 消息格式 & Vision
6. Streaming
7. Function Calling / Tools
8. Structured Outputs
9. 音频 TTS + STT
10. 图像
11. Embeddings
12. 错误处理
13. 配置
14. 异步
15. Azure OpenAI
16. Realtime API
17. Vector Stores
18. Assistants API

1. 安装 Installation

pip install openai

客户端初始化

from openai import OpenAI

# 默认从环境变量 OPENAI_API_KEY 读取
client = OpenAI()

# 显式传入
client = OpenAI(api_key="sk-...")

# 自定义 base_url（代理、兼容接口）
client = OpenAI(base_url="https://your-proxy.example.com/v1")

设置环境变量 export OPENAI_API_KEY="sk-..." 后，OpenAI() 会自动读取，无需在代码中硬编码密钥。

2. 快速开始 · Responses API 主推

SDK README 明确标注 Responses API 为当前主推接口（"primary API for interacting with OpenAI models"）。Chat Completions 仍受支持，但列为 "previous standard"。

from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="gpt-5.4",
    instructions="You are a helpful assistant.",
    input="Explain quantum computing in one sentence.",
)

print(response.output_text)

核心参数

参数	类型	说明
`model`	str	模型名称（必填）
`instructions`	str	系统指令（类似 Chat 的 system prompt）
`input`	str \| list	用户输入，可以是字符串或内容数组
`stream`	bool	是否流式输出
`tools`	list	工具 / 函数定义
`text`	dict	结构化输出配置（JSON Schema）

3. Chat Completions API 稳定接口

Chat Completions 是上一个标准接口，仍被广泛使用且完全受支持。新项目建议优先使用 Responses API。

response = client.chat.completions.create(
    model="gpt-5.2",
    messages=[
        {"role": "developer", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"},
    ],
    temperature=0.7,
    max_completion_tokens=500,
    top_p=1,
)

print(response.choices[0].message.content)

常用参数

参数	类型	说明
`model`	str	模型名称（必填）
`messages`	list[dict]	消息列表（必填）
`temperature`	float	采样温度 0–2，越高越随机
`max_completion_tokens`	int	最大输出 token 数
`top_p`	float	核采样阈值
`stream`	bool	流式输出
`tools`	list	工具/函数定义
`response_format`	dict	结构化输出

Response 结构

response.id                          # "chatcmpl-xxx"
response.model                       # 实际使用的模型快照
response.choices[0].message.content  # 回复正文
response.choices[0].message.role     # "assistant"
response.choices[0].finish_reason    # "stop" | "length" | "content_filter"
response.usage.prompt_tokens         # 输入 token 数
response.usage.completion_tokens     # 输出 token 数
response.usage.total_tokens          # 总 token 数

4. 模型列表 Models

以下模型全部来自官方 SDK v2.36+ 源码。标注 Chat 表示可用于 Chat Completions API；标注仅Resp 表示仅可用于 Responses API / AllModels，不支持 Chat Completions。

GPT-5.4 系列（最新旗舰）

模型 ID	类型	说明
`gpt-5.4`	Chat	最新旗舰模型
`gpt-5.4-mini`	Chat	轻量旗舰
`gpt-5.4-nano`	Chat	最轻量快速

GPT-5.3 / 5.2 / 5.1 系列

模型 ID	类型	说明
`gpt-5.3-chat-latest`	Chat	ChatGPT 动态快照
`gpt-5.2`	Chat	稳定旗舰
`gpt-5.2-pro`	Chat	专业增强版
`gpt-5.1`	Chat	上一代旗舰
`gpt-5.1-codex`	Chat	代码专用
`gpt-5.1-mini`	Chat	轻量版

GPT-5 / GPT-4.1 系列

模型 ID	类型	说明
`gpt-5`	Chat	初代 GPT-5
`gpt-5-mini`	Chat	初代 GPT-5 轻量
`gpt-5-nano`	Chat	初代 GPT-5 极轻
`gpt-4.1`	Chat	1M context 旗舰
`gpt-4.1-mini`	Chat	1M context 轻量
`gpt-4.1-nano`	Chat	1M context 极轻

推理模型 o-series

模型 ID	类型	说明
`o4-mini`	Chat	最新推理模型
`o3`	Chat	深度推理
`o3-mini`	Chat	轻量推理
`o1`	Chat	成熟推理
`o1-preview`	Chat	推理预览版
`o1-mini`	Chat	轻量推理

经典模型（仍可用）

模型 ID	类型	说明
`gpt-4o`	Chat	多模态旗舰
`gpt-4o-mini`	Chat	轻量快速便宜
`gpt-4-turbo`	Chat	上一代旗舰
`gpt-4`	Chat	经典模型
`gpt-3.5-turbo`	Chat	旧版低成本

扩展模型（仅 Responses API / AllModels）

以下模型属于 AllModels / ResponsesModel，不能用于 Chat Completions API。

模型 ID	说明
`o1-pro`	o1 专业增强版
`o3-pro`	o3 专业增强版
`o3-deep-research`	深度研究
`o4-mini-deep-research`	轻量深度研究
`computer-use-preview`	计算机操作预览
`gpt-5-codex`	GPT-5 代码增强版
`gpt-5-pro`	GPT-5 专业增强版
`gpt-5.1-codex-max`	GPT-5.1 代码最大版

音频模型

模型 ID	用途	说明
TTS · 文本转语音
`tts-1`	TTS	标准 TTS
`tts-1-hd`	TTS	高音质 TTS
`gpt-4o-mini-tts`	TTS NEW	新一代 TTS
STT · 语音转文本
`whisper-1`	STT	经典转录
`gpt-4o-transcribe`	STT NEW	新一代转录
`gpt-4o-mini-transcribe`	STT NEW	轻量转录
`gpt-4o-transcribe-diarize`	STT NEW	说话人分离转录

图像模型

模型 ID	说明
`gpt-image-1`	初代 GPT 图像模型
`gpt-image-1-mini`	轻量图像模型
`gpt-image-2`	NEW 最新图像生成
`gpt-image-1.5`	中代图像模型
`chatgpt-image-latest`	ChatGPT 动态图像快照
`dall-e-2`	经典 DALL·E
`dall-e-3`	DALL·E 3

Embeddings 模型

模型 ID	维度	说明
`text-embedding-ada-002`	1536	经典 embedding
`text-embedding-3-small`	1536	新一代轻量
`text-embedding-3-large`	3072（可降维）	新一代旗舰

5. 消息格式 & Vision

Chat Completions 消息角色

# developer 角色（推荐用作 system prompt，优先级高于 system）
{"role": "developer", "content": "You are a helpful assistant."}

# system 角色（仍可用）
{"role": "system", "content": "You are helpful."}

# user 角色
{"role": "user", "content": "Hello!"}

# assistant 角色
{"role": "assistant", "content": "Hi! How can I help?"}

Responses API 输入格式

# 简单文本（自动转为 list）
client.responses.create(model="gpt-5.4", input="Hello!")

# 结构化输入
client.responses.create(model="gpt-5.4", input=[
    {"role": "user", "content": "Hello!"}
])

Vision · 图片输入（Responses API）

SDK README 明确推荐通过 Responses API 使用 input_image + input_text 内容类型进行视觉输入，而非旧版 image_url 格式。

response = client.responses.create(
    model="gpt-5.4",
    input=[
        {
            "role": "user",
            "content": [
                {"type": "input_text", "text": "What's in this image?"},
                {
                    "type": "input_image",
                    "image_url": "https://example.com/photo.jpg",
                },
            ],
        }
    ],
)

print(response.output_text)

Chat Completions 中的 Vision（旧格式）

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "图中有什么？"},
            {"type": "image_url", "image_url": {"url": "https://example.com/img.jpg"}},
        ],
    }],
)

6. Streaming 流式响应

Responses API 流式

stream = client.responses.create(
    model="gpt-5.4",
    input="Tell me a story.",
    stream=True,
)

for event in stream:
    if event.type == "response.output_text.delta":
        print(event.delta, end="")

Chat Completions 流式

stream = client.chat.completions.create(
    model="gpt-5.2",
    messages=[{"role": "user", "content": "Tell me a story."}],
    stream=True,
    stream_options={"include_usage": True},
)

for chunk in stream:
    if chunk.choices and chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")
    if chunk.usage:
        print(f"\n--- Tokens: {chunk.usage.total_tokens} ---")

7. Function Calling / Tools

Responses API（推荐）

response = client.responses.create(
    model="gpt-5.4",
    input="What's the weather in Beijing?",
    tools=[{
        "type": "function",
        "name": "get_weather",
        "description": "Get current weather for a city",
        "parameters": {
            "type": "object",
            "properties": {
                "city": {"type": "string", "description": "City name"},
            },
            "required": ["city"],
        },
    }],
)

Chat Completions API

tools = [{
    "type": "function",
    "function": {
        "name": "get_weather",
        "description": "Get weather by city",
        "parameters": {
            "type": "object",
            "properties": {
                "city": {"type": "string"}
            },
            "required": ["city"],
            "additionalProperties": False,
        },
    },
}]

response = client.chat.completions.create(
    model="gpt-5.2",
    messages=[{"role": "user", "content": "Beijing weather?"}],
    tools=tools,
    tool_choice="auto",
)

tool_calls = response.choices[0].message.tool_calls

8. Structured Outputs

Responses API · JSON Schema

response = client.responses.create(
    model="gpt-5.4",
    input="List 3 famous physicists with their birth years.",
    text={
        "format": {
            "type": "json_schema",
            "name": "physicists",
            "schema": {
                "type": "object",
                "properties": {
                    "physicists": {
                        "type": "array",
                        "items": {
                            "type": "object",
                            "properties": {
                                "name": {"type": "string"},
                                "birth_year": {"type": "integer"},
                            },
                            "required": ["name", "birth_year"],
                        },
                    }
                },
                "required": ["physicists"],
            },
        }
    },
)

print(response.output_text)  # valid JSON matching schema

Chat Completions · JSON Schema

client.beta.chat.completions.parse() 已在 v2.36.0 中移除。请使用 response_format 参数。

response = client.chat.completions.create(
    model="gpt-5.2",
    messages=[{"role": "user", "content": "List 3 planets with their moons count."}],
    response_format={
        "type": "json_schema",
        "json_schema": {
            "name": "planets",
            "schema": {
                "type": "object",
                "properties": {
                    "planets": {
                        "type": "array",
                        "items": {
                            "type": "object",
                            "properties": {
                                "name": {"type": "string"},
                                "moons": {"type": "integer"},
                            },
                            "required": ["name", "moons"],
                            "additionalProperties": False,
                        },
                    }
                },
                "required": ["planets"],
                "additionalProperties": False,
            },
            "strict": True,
        },
    },
)

import json
data = json.loads(response.choices[0].message.content)

9. 音频 Audio · TTS + STT

TTS · 文本转语音

模型	说明
`tts-1`	标准 TTS
`tts-1-hd`	高音质 TTS
`gpt-4o-mini-tts`	NEW 新一代 TTS

# 生成语音
response = client.audio.speech.create(
    model="gpt-4o-mini-tts",
    voice="alloy",
    input="Hello world",
)

# 保存到文件
response.stream_to_file("output.mp3")

# 或写入 BytesIO
response.write_to_file("output.mp3")

STT · 语音转文本（Transcription）

模型	说明
`whisper-1`	经典 Whisper 转录
`gpt-4o-transcribe`	NEW 新一代转录
`gpt-4o-mini-transcribe`	NEW 轻量转录
`gpt-4o-transcribe-diarize`	NEW 说话人分离

# 音频转录
audio = open("audio.mp3", "rb")
transcript = client.audio.transcriptions.create(
    model="gpt-4o-mini-transcribe",
    file=audio,
    language="zh",
)

print(transcript.text)

音频翻译（Translation）

audio = open("audio.mp3", "rb")
translation = client.audio.translations.create(
    model="whisper-1",
    file=audio,
)

print(translation.text)  # translated to English

10. 图像 Images

模型 ID	说明
`gpt-image-2`	NEW 最新图像生成
`gpt-image-1.5`	中代图像模型
`gpt-image-1`	初代 GPT 图像模型
`gpt-image-1-mini`	轻量图像模型
`chatgpt-image-latest`	ChatGPT 动态图像快照
`dall-e-3`	DALL·E 3 经典
`dall-e-2`	DALL·E 2 旧版

图像生成

response = client.images.generate(
    model="gpt-image-2",
    prompt="A cat sitting in moonlight, digital art style",
    size="1024x1024",
    quality="standard",
    n=1,
)

image_url = response.data[0].url
print(image_url)

# 或获取 base64
# b64_json = response.data[0].b64_json

图像编辑

response = client.images.edit(
    model="dall-e-2",
    image=open("original.png", "rb"),
    mask=open("mask.png", "rb"),
    prompt="Add a rainbow in the sky",
    size="1024x1024",
)

图像变体

response = client.images.create_variation(
    model="dall-e-2",
    image=open("original.png", "rb"),
    n=3,
)

11. Embeddings

模型	维度	最大输入
`text-embedding-ada-002`	1536	8191 tokens
`text-embedding-3-small`	1536	8191 tokens
`text-embedding-3-large`	3072（可降维）	8191 tokens

# 基础用法
response = client.embeddings.create(
    model="text-embedding-3-small",
    input="Hello world",
    encoding_format="float",
)

vector = response.data[0].embedding  # list[float]
print(len(vector))                    # 1536

# 批量输入
response = client.embeddings.create(
    model="text-embedding-3-large",
    input=["Hello world", "Goodbye world"],
    dimensions=1024,  # 可选降维，减少存储
)

for item in response.data:
    print(len(item.embedding))  # 1024

12. 错误处理 Error Handling

from openai import (
    APIError,
    APIConnectionError,
    APITimeoutError,
    RateLimitError,
    AuthenticationError,
    PermissionDeniedError,
    NotFoundError,
    BadRequestError,
    UnprocessableEntityError,
    InternalServerError,
    APIStatusError,
)

import time

try:
    response = client.chat.completions.create(
        model="gpt-5.2",
        messages=[{"role": "user", "content": "Hello"}],
    )
except AuthenticationError:
    print("❌ API Key 无效 (401)")
except PermissionDeniedError:
    print("❌ 权限不足 (403)")
except NotFoundError:
    print("❌ 资源不存在 (404)")
except RateLimitError:
    print("⏳ 速率限制，等待后重试 (429)")
    time.sleep(5)
except BadRequestError as e:
    print(f"❌ 请求参数错误 (400): {e}")
except UnprocessableEntityError as e:
    print(f"❌ 验证错误 (422): {e}")
except InternalServerError:
    print("❌ 服务器内部错误 (500+)")
except APIConnectionError:
    print("❌ 网络连接失败")
except APITimeoutError:
    print("❌ 请求超时")
except APIStatusError as e:
    print(f"❌ HTTP 状态错误: {e.status_code}")
except APIError as e:
    print(f"❌ API 错误: {e}")

异常类	HTTP 码	触发场景
`AuthenticationError`	401	无效 API Key
`PermissionDeniedError`	403	权限不足
`NotFoundError`	404	资源不存在
`RateLimitError`	429	速率/配额超限
`BadRequestError`	400	请求参数错误
`UnprocessableEntityError`	422	参数验证失败
`InternalServerError`	500+	服务器内部错误
`APIConnectionError`	—	网络连接失败
`APITimeoutError`	—	请求超时
`APIStatusError`	任意	非 2xx 响应基类

13. 配置 Configuration

超时控制

# 默认超时: 10 分钟 (600 秒)
client = OpenAI()

# 全局超时
client = OpenAI(timeout=30.0)  # 30 秒

# 单次请求超时
response = client.chat.completions.create(
    model="gpt-5.2",
    messages=[{"role": "user", "content": "Hello"}],
    timeout=15.0,  # 仅此请求 15 秒
)

自动重试

SDK 默认自动重试 2 次，触发条件：连接错误、HTTP 408、409、429、≥500。

# 自定义重试
client = OpenAI(max_retries=5)   # 最多重试 5 次
client = OpenAI(max_retries=0)   # 禁用自动重试

代理 Proxy

# 通过 httpx 代理
import httpx

client = OpenAI(
    http_client=httpx.Client(proxy="http://user:pass@proxy.example.com:8080"),
)

自定义 base_url

# 自建代理 / 兼容接口
client = OpenAI(base_url="https://your-proxy.example.com/v1")

# 常用例子：通过 One API / FastGPT 等网关访问
client = OpenAI(
    api_key="sk-your-key",
    base_url="https://api.openai-forward.com/v1",
)

其他配置选项

client = OpenAI(
    api_key="sk-...",              # API 密钥
    organization="org-...",        # 组织 ID
    base_url="https://...",        # 自定义端点
    timeout=60.0,                  # 请求超时（秒）
    max_retries=2,                 # 最大重试次数
    default_headers={"X-My-Header": "value"},
    default_query={"api-version": "2024-02-01"},
)

14. 异步 Async

AsyncOpenAI 接口与同步 OpenAI 完全一致，所有方法前加 await 即可。

import asyncio
from openai import AsyncOpenAI

async def main():
    client = AsyncOpenAI()

    # 异步调用
    response = await client.responses.create(
        model="gpt-5.4",
        input="Hello!",
    )
    print(response.output_text)

    # 异步流式
    stream = await client.responses.create(
        model="gpt-5.4",
        input="Tell me a joke.",
        stream=True,
    )
    async for event in stream:
        if event.type == "response.output_text.delta":
            print(event.delta, end="")

    # 并发处理多个请求
    tasks = [
        client.chat.completions.create(
            model="gpt-4o-mini",
            messages=[{"role": "user", "content": f"Topic {i}"}],
        )
        for i in range(5)
    ]
    results = await asyncio.gather(*tasks)
    for r in results:
        print(r.choices[0].message.content)

asyncio.run(main())

15. Azure OpenAI

Azure OpenAI 使用 AzureOpenAI 类，接口与标准 OpenAI 一致。

from openai import AzureOpenAI

client = AzureOpenAI(
    azure_endpoint="https://your-resource.openai.azure.com/",
    api_key="your-azure-api-key",
    api_version="2024-10-01-preview",
)

response = client.chat.completions.create(
    model="gpt-4o",  # 部署名称
    messages=[{"role": "user", "content": "Hello"}],
)

print(response.choices[0].message.content)

Azure 异步

from openai import AsyncAzureOpenAI

client = AsyncAzureOpenAI(
    azure_endpoint="https://your-resource.openai.azure.com/",
    api_key="your-azure-api-key",
    api_version="2024-10-01-preview",
)

response = await client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "Hello"}],
)

16. Realtime API

Realtime API 通过 WebSocket 连接 (client.realtime.connect())，以 gpt-realtime 为模型名。

from openai import OpenAI

client = OpenAI()

# WebSocket 连接
async with client.realtime.connect(model="gpt-realtime") as conn:
    # 发送音频/文本
    await conn.send({
        "type": "conversation.item.create",
        "item": {
            "type": "message",
            "role": "user",
            "content": [{"type": "input_text", "text": "Hello!"}],
        },
    })

    # 触发响应
    await conn.send({"type": "response.create"})

    # 接收事件
    async for event in conn:
        print(event.type, event)

Realtime API 需要 asyncio 环境运行。模型参数为 "gpt-realtime"（不是具体的模型 ID）。

17. Vector Stores · 文件搜索

from openai import OpenAI

client = OpenAI()

# 创建 Vector Store
vector_store = client.vector_stores.create(
    name="my_knowledge_base",
)

# 上传文件
file = client.files.create(
    file=open("document.pdf", "rb"),
    purpose="assistants",
)

# 将文件添加到 Vector Store
client.vector_stores.files.create(
    vector_store_id=vector_store.id,
    file_id=file.id,
)

# 搜索
results = client.vector_stores.search(
    vector_store_id=vector_store.id,
    query="What is the main topic?",
    max_num_results=5,
)

for result in results.data:
    print(result.content[0].text)

结合 Responses API 使用 File Search

response = client.responses.create(
    model="gpt-5.4",
    input="What documents mention the project timeline?",
    tools=[{
        "type": "file_search",
        "vector_store_ids": [vector_store.id],
        "max_num_results": 5,
    }],
)

print(response.output_text)

18. Assistants API

Assistants API 属于 beta 命名空间，通过 client.beta.assistants 访问。

from openai import OpenAI

client = OpenAI()

# 创建 Assistant
assistant = client.beta.assistants.create(
    name="Math Tutor",
    instructions="You are a personal math tutor. Explain step by step.",
    model="gpt-5.2",
    tools=[{"type": "code_interpreter"}],
)

# 创建 Thread（对话线程）
thread = client.beta.threads.create()

# 添加用户消息
message = client.beta.threads.messages.create(
    thread_id=thread.id,
    role="user",
    content="Solve 3x + 5 = 20",
)

# 运行 Assistant
run = client.beta.threads.runs.create(
    thread_id=thread.id,
    assistant_id=assistant.id,
)

# 轮询等待结果
import time
while run.status in ("queued", "in_progress"):
    time.sleep(1)
    run = client.beta.threads.runs.retrieve(
        thread_id=thread.id,
        run_id=run.id,
    )

# 获取回复
messages = client.beta.threads.messages.list(thread_id=thread.id)
for msg in messages.data:
    if msg.role == "assistant":
        print(msg.content[0].text.value)

Batch 批处理

from openai import OpenAI

client = OpenAI()

# 创建批处理作业
batch = client.batches.create(
    input_file_id="file-xxx",
    endpoint="/v1/chat/completions",
    completion_window="24h",
)

# 查询状态
batch = client.batches.retrieve(batch.id)
print(batch.status)  # validating | in_progress | finalizing | completed | failed

Files API

# 上传文件
file = client.files.create(
    file=open("data.jsonl", "rb"),
    purpose="batch",
)

# 列出文件
for f in client.files.list():
    print(f.id, f.filename)

# 获取文件内容
content = client.files.content(file.id)
print(content.text)

Models API

# 列出所有可用模型
models = client.models.list()
for model in models:
    print(model.id)

# 获取特定模型信息
model = client.models.retrieve("gpt-5.4")
print(model.id, model.created)

Moderations

response = client.moderations.create(
    model="text-moderation-latest",
    input="Some text to check",
)
print(response.results[0].flagged)  # bool

Uploads API

upload = client.uploads.create(
    filename="large_file.jsonl",
    purpose="batch",
    bytes=file_size,
)
# 分块上传
client.uploads.upload_part(
    upload_id=upload.id,
    data=chunk_data,
)
client.uploads.complete(upload_id=upload.id)

Fine-tuning

# 创建微调作业
job = client.fine_tuning.jobs.create(
    training_file="file-xxx",
    model="gpt-4o-mini",
)

# 列出微调作业
for job in client.fine_tuning.jobs.list():
    print(job.id, job.status)

# 获取特定作业事件
events = client.fine_tuning.jobs.list_events(fine_tuning_job_id=job.id)
for event in events:
    print(event.message)

Webhooks

# Webhooks 用于接收异步事件回调
# 详见 SDK 文档: client.webhooks.*

API 资源总览

资源路径	说明
`client.responses`	主推 Responses API
`client.chat.completions`	Chat Completions API
`client.completions`	Legacy Completions（旧版）
`client.embeddings`	文本 Embedding
`client.files`	文件上传/管理
`client.images`	图像生成/编辑/变体
`client.audio.transcriptions`	语音转文本
`client.audio.translations`	语音翻译
`client.audio.speech`	文本转语音
`client.moderations`	内容审核
`client.models`	模型列表/信息
`client.fine_tuning.jobs`	模型微调
`client.vector_stores`	向量存储/文件搜索
`client.beta.assistants`	Assistants API
`client.beta.threads`	对话线程管理
`client.beta.realtime`	WebSocket 实时对话
`client.webhooks`	Webhook 管理
`client.batches`	批量异步处理
`client.uploads`	大文件分块上传

OpenAI Python SDK 完整参考 · v2.36.0 · api-ref.karenepitaya.xyz