Embeddings
Используйте embeddings, чтобы преобразовать текст в векторы для поиска, retrieval, clustering, ranking и similarity.
text
POST https://api.rout.my/v1/embeddingsЗапрос
bash
curl https://api.rout.my/v1/embeddings \
-H "Authorization: Bearer $ROUTMY_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "provider/embedding-model-id",
"input": "The food was delicious and the service was excellent."
}'Поля запроса
| Поле | Тип | Обязательное | Примечания |
|---|---|---|---|
model | string | Да | Точный embedding model ID из /v1/models. |
input | string, array of strings, token array, or batch token arrays | Да | Text или token input для embedding. |
encoding_format | string | Нет | float или base64, если upstream model поддерживает. |
dimensions | integer | Нет | Желаемое число dimensions, если модель поддерживает. |
user | string | Нет | Client-side user identifier. |
Extra fields сохраняются для провайдеров, которые их поддерживают.
Batch input
json
{
"model": "provider/embedding-model-id",
"input": [
"First document.",
"Second document.",
"Third document."
]
}Ответ сохраняет порядок входа через поле index.
Python
python
from openai import OpenAI
import os
client = OpenAI(
base_url="https://api.rout.my/v1",
api_key=os.environ["ROUTMY_API_KEY"],
)
response = client.embeddings.create(
model="provider/embedding-model-id",
input=["First document.", "Second document."],
)
for item in response.data:
print(item.index, len(item.embedding))Ответ
json
{
"object": "list",
"data": [
{
"object": "embedding",
"index": 0,
"embedding": [0.0023, -0.0093, 0.0142]
}
],
"model": "provider/embedding-model-id",
"usage": {
"prompt_tokens": 5,
"total_tokens": 5
}
}Расход квоты
Embedding requests считают только prompt tokens. Итоговый расход:
text
input tokens x token_multipliertoken_multiplier смотрите в /v1/models.