Embeddings

Используйте embeddings, чтобы преобразовать текст в векторы для поиска, retrieval, clustering, ranking и similarity.

text

POST https://api.rout.my/v1/embeddings

Запрос

bash

curl https://api.rout.my/v1/embeddings \
  -H "Authorization: Bearer $ROUTMY_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3-embedding-8b",
    "input": "The food was delicious and the service was excellent."
  }'

Поля запроса

Поле	Тип	Обязательное	Примечания
`model`	string	Да	Точный embedding model ID из `/v1/models`.
`input`	string, array of strings, token array, or batch token arrays	Да	Text или token input для embedding.
`encoding_format`	string	Нет	`float` или `base64`, если upstream model поддерживает.
`dimensions`	integer	Нет	Желаемое число dimensions, если модель поддерживает.
`user`	string	Нет	Принимается для совместимости, но не пробрасывается в upstream.

Extra fields сохраняются для провайдеров, которые их поддерживают.

Batch input

json

{
  "model": "qwen/qwen3-embedding-8b",
  "input": [
    "First document.",
    "Second document.",
    "Third document."
  ]
}

Ответ сохраняет порядок входа через поле index.

Python

python

from openai import OpenAI
import os

client = OpenAI(
    base_url="https://api.rout.my/v1",
    api_key=os.environ["ROUTMY_API_KEY"],
)

response = client.embeddings.create(
    model="qwen/qwen3-embedding-8b",
    input=["First document.", "Second document."],
)

for item in response.data:
    print(item.index, len(item.embedding))

Ответ

json

{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "index": 0,
      "embedding": [0.0023, -0.0093, 0.0142]
    }
  ],
  "model": "qwen/qwen3-embedding-8b",
  "usage": {
    "prompt_tokens": 5,
    "total_tokens": 5
  }
}

Расход квоты

Embedding requests считают только prompt tokens. Итоговый расход:

text

input tokens x token_multiplier

token_multiplier смотрите в /v1/models.

Embeddings ​

Запрос ​

Поля запроса ​

Batch input ​

Python ​

Ответ ​

Расход квоты ​