云聚 AI Token Plan 满 199 减 35 元
port:80 AI Junkie
AI 重度玩家的工程笔记本
DigitalOcean 开发者云

英伟达NIM平台:免费调用GLM-4.7与MiniMax M2.1指南

云聚 AI Token Plan 满 199 减 35 元

NVIDIA NIM 是什么

NVIDIA NIM(NVIDIA Inference Microservices)是英伟达推出的推理服务平台,提供多家厂商的 AI 模型 API。重点是:部分模型免费调用,包括智谱 GLM-4.7 和 MiniMax M2.1。

API 兼容 OpenAI 格式,意味着你现有的代码基本不用改。

阿里云 OPC 一人公司创业装备库

NVIDIA NIM API 调用流程

3 步上手

第 1 步:注册 NVIDIA 账号

访问 NVIDIA Developer,用邮箱注册账号。已有账号直接登录。

第 2 步:获取 API Key

  1. 进入 NIM 模型目录
  2. 选择你要用的模型(比如 GLM-4 或 MiniMax M2.1)
  3. 点击 “Get API Key”,复制 nvapi- 开头的密钥

第 3 步:调用模型

API 端点统一为:

https://integrate.api.nvidia.com/v1

Python 示例

from openai import OpenAI

client = OpenAI(
    base_url="https://integrate.api.nvidia.com/v1",
    api_key="nvapi-你的密钥"
)

# 调用 GLM-4.7
response = client.chat.completions.create(
    model="zhipu-ai/glm4.7",  # 或 thudm/glm-4
    messages=[{"role": "user", "content": "你好"}],
    max_tokens=1024
)
print(response.choices[0].message.content)

调用 MiniMax M2.1

response = client.chat.completions.create(
    model="minimaxai/minimax-m2.1",
    messages=[{"role": "user", "content": "写一首关于春天的诗"}],
    max_tokens=1024
)

可用模型

模型 Model ID 说明
GLM-4.7 zhipu-ai/glm4.7thudm/glm-4 智谱最新模型
MiniMax M2.1 minimaxai/minimax-m2.1 MiniMax 大模型

注意事项

  • API Key 格式都是 nvapi- 开头
  • 免费额度有限,适合测试和小规模使用
  • 响应速度取决于模型和网络状况
  • 更多模型可在 NIM 目录 查看

原文来源Linux.do

阿里云函数计算 一键部署 AI 大模型
赞(0)
未经允许不得转载:80aj » 英伟达NIM平台:免费调用GLM-4.7与MiniMax M2.1指南
ReClaude Claude Code 合租
阿里云函数计算 一键部署 AI 大模型

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC,封号还得自己重新折腾?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。

上车 4 人车 400/月查看四档套餐