API Augure
API de complétion de chat compatible OpenAI sur une infrastructure canadienne souveraine. Aucune exposition américaine. Aucun CLOUD Act.
URL de base : https://api.augureai.caAcheminement et résidence des données
Toutes les requêtes API transitent par notre passerelle à Beauharnois, au Québec. L’inférence s’exécute sur une infrastructure souveraine sans société mère américaine dans la chaîne — aucune donnée ne touche une infrastructure américaine à aucun moment. Ossington 4 fonctionne sur une infrastructure GPU canadienne à Calgary. Les requêtes sont chiffrées en transit (TLS 1.2+), jamais journalisées par Augure et jamais utilisées pour l’entraînement de modèles.
Authentification
Tous les points de terminaison nécessitent un jeton Bearer. Incluez votre clé API dans l’en-tête Authorization de chaque requête.
curl https://api.augureai.ca/v1/models \
-H "Authorization: Bearer VOTRE_CLE_API"Obtenir une clé : les clés API sont émises via notre processus de candidature. Demander l’accès pour commencer.
Modèles
Trois modèles sont disponibles, optimisés pour différentes charges de travail.
ossington-4Grand modèle, capacité maximale
Raisonnement complexe, analyse juridique, révision de documents
Lun–ven 6 h – minuit, sam–dim 10 h – 18 h HE
tofino-2.5Petit modèle rapide et efficace
Chat, résumés, tâches rapides
24/7
augure-nanoModèle compact 8B
Classification, extraction, tâches simples
24/7
Compatibilité OpenAI : les alias gpt-4, gpt-4o, gpt-4o-mini et gpt-3.5-turbo sont pris en charge pour une compatibilité directe avec les bibliothèques client OpenAI. Ils correspondent respectivement à ossington-4 et tofino-2.5.
Points de terminaison
/v1/chat/completionsCréer une complétion de chat. Accepte le même format de requête que le point de terminaison de complétion de chat d’OpenAI.
Paramètres
| Champ | Type | Requis | Description |
|---|---|---|---|
| model | string | Oui | Identifiant du modèle (voir Modèles ci-dessus) |
| messages | array | Oui | Tableau d'objets message |
| stream | boolean | Non | Réponse en continu via SSE. Par défaut : false |
| temperature | number | Non | Température d'échantillonnage (0,0–2,0) |
| max_tokens | number | Non | Nombre maximal de jetons à générer (jusqu'à 32 768) |
| top_p | number | Non | Seuil d'échantillonnage nucleus |
| stop | string | array | Non | Séquence(s) d'arrêt |
Chaque message du tableau messages possède un role ("system", "user" ou "assistant") et un content de type chaîne.
Exemple de requête
curl -X POST https://api.augureai.ca/v1/chat/completions \
-H "Authorization: Bearer VOTRE_CLE_API" \
-H "Content-Type: application/json" \
-d '{
"model": "ossington-4",
"messages": [
{"role": "system", "content": "Tu es un assistant utile."},
{"role": "user", "content": "Qu'est-ce que le Code civil du Québec?"}
]
}'Exemple de réponse
{
"id": "chatcmpl-a9adf17e-5ff3-4804-b01e-f7cbd30ae996",
"object": "chat.completion",
"created": 1771286577,
"model": "ossington-4",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "Le Code civil du Québec (CCQ) est..."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 24,
"completion_tokens": 150,
"total_tokens": 174
},
"_augure": {
"gateway_region": "ca-montreal-1",
"inference_region": "augure-cloud",
"request_id": "a9adf17e-5ff3-4804-b01e-f7cbd30ae996"
}
}Streaming
Définissez "stream": true pour recevoir des événements Server-Sent Events. Chaque événement est un fragment JSON contenant un objet delta avec le contenu incrémental. Le flux se termine par data: [DONE].
curl -N -X POST https://api.augureai.ca/v1/chat/completions \
-H "Authorization: Bearer VOTRE_CLE_API" \
-H "Content-Type: application/json" \
-d '{
"model": "tofino-2.5",
"messages": [{"role": "user", "content": "Bonjour"}],
"stream": true
}'/v1/modelsRetourne la liste de tous les modèles disponibles.
curl https://api.augureai.ca/v1/models \
-H "Authorization: Bearer VOTRE_CLE_API"Réponse
{
"object": "list",
"data": [
{ "id": "ossington-4", "object": "model", "owned_by": "augure" },
{ "id": "tofino-2.5", "object": "model", "owned_by": "augure" },
{ "id": "augure-nano", "object": "model", "owned_by": "augure" }
]
}Bibliothèques client
Utilisez n’importe quel SDK compatible OpenAI. Pointez-le simplement vers https://api.augureai.ca/v1 comme URL de base.
from openai import OpenAI
client = OpenAI(
api_key="VOTRE_CLE_API",
base_url="https://api.augureai.ca/v1"
)
response = client.chat.completions.create(
model="ossington-4",
messages=[
{"role": "user", "content": "Explique la Loi sur la protection des renseignements personnels du Québec"}
]
)
print(response.choices[0].message.content)import OpenAI from "openai";
const client = new OpenAI({
apiKey: "VOTRE_CLE_API",
baseURL: "https://api.augureai.ca/v1",
});
const response = await client.chat.completions.create({
model: "tofino-2.5",
messages: [{ role: "user", content: "Résume la LPRPDE" }],
});
console.log(response.choices[0].message.content);Limites
Corps de la requête
2 Mo max
Messages par requête
256 max
Jetons de sortie max
32 768
Délai d'expiration
300 secondes
Les quotas de jetons sont appliqués par clé API. Contactez-nous si vous avez besoin d’un débit plus élevé pour vos charges de production.
Erreurs
Toutes les erreurs retournent un objet JSON avec un champ error, conforme au format d’erreur OpenAI.
{
"error": {
"message": "Invalid API key provided",
"type": "invalid_request_error",
"param": null,
"code": "invalid_api_key"
}
}| Statut | Signification |
|---|---|
| 401 | Clé API manquante ou invalide |
| 400 | Requête mal formée ou champs requis manquants |
| 404 | Modèle ou point de terminaison inconnu |
| 413 | Corps de la requête supérieur à 2 Mo |
| 429 | Quota de jetons dépassé pour cette clé API |
| 502 | Erreur de traitement en amont — réessayez sous peu |
Prêt à intégrer?
Obtenez votre clé API et commencez à développer avec Augure.
Demander l’accès à l’API