Documentation pour développeurs

API Augure

API de complétion de chat compatible OpenAI sur une infrastructure canadienne souveraine. Aucune exposition américaine. Aucun CLOUD Act.

URL de base : https://api.augureai.ca
🍁

Acheminement et résidence des données

Toutes les requêtes API transitent par notre passerelle à Beauharnois, au Québec. L’inférence s’exécute sur une infrastructure souveraine sans société mère américaine dans la chaîne — aucune donnée ne touche une infrastructure américaine à aucun moment. Ossington 4 fonctionne sur une infrastructure GPU canadienne à Calgary. Les requêtes sont chiffrées en transit (TLS 1.2+), jamais journalisées par Augure et jamais utilisées pour l’entraînement de modèles.

Passerelle canadienneInférence souveraineAucune exposition USAucune journalisation

Authentification

Tous les points de terminaison nécessitent un jeton Bearer. Incluez votre clé API dans l’en-tête Authorization de chaque requête.

Exemple
curl https://api.augureai.ca/v1/models \
  -H "Authorization: Bearer VOTRE_CLE_API"

Obtenir une clé : les clés API sont émises via notre processus de candidature. Demander l’accès pour commencer.

Modèles

Trois modèles sont disponibles, optimisés pour différentes charges de travail.

ossington-4

Grand modèle, capacité maximale

Raisonnement complexe, analyse juridique, révision de documents

Lun–ven 6 h – minuit, sam–dim 10 h – 18 h HE

tofino-2.5

Petit modèle rapide et efficace

Chat, résumés, tâches rapides

24/7

augure-nano

Modèle compact 8B

Classification, extraction, tâches simples

24/7

Compatibilité OpenAI : les alias gpt-4, gpt-4o, gpt-4o-mini et gpt-3.5-turbo sont pris en charge pour une compatibilité directe avec les bibliothèques client OpenAI. Ils correspondent respectivement à ossington-4 et tofino-2.5.

Points de terminaison

POST/v1/chat/completions

Créer une complétion de chat. Accepte le même format de requête que le point de terminaison de complétion de chat d’OpenAI.

Paramètres

ChampTypeRequisDescription
modelstringOuiIdentifiant du modèle (voir Modèles ci-dessus)
messagesarrayOuiTableau d'objets message
streambooleanNonRéponse en continu via SSE. Par défaut : false
temperaturenumberNonTempérature d'échantillonnage (0,0–2,0)
max_tokensnumberNonNombre maximal de jetons à générer (jusqu'à 32 768)
top_pnumberNonSeuil d'échantillonnage nucleus
stopstring | arrayNonSéquence(s) d'arrêt

Chaque message du tableau messages possède un role ("system", "user" ou "assistant") et un content de type chaîne.

Exemple de requête

curl
curl -X POST https://api.augureai.ca/v1/chat/completions \
  -H "Authorization: Bearer VOTRE_CLE_API" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "ossington-4",
    "messages": [
      {"role": "system", "content": "Tu es un assistant utile."},
      {"role": "user", "content": "Qu'est-ce que le Code civil du Québec?"}
    ]
  }'

Exemple de réponse

Réponse
{
  "id": "chatcmpl-a9adf17e-5ff3-4804-b01e-f7cbd30ae996",
  "object": "chat.completion",
  "created": 1771286577,
  "model": "ossington-4",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Le Code civil du Québec (CCQ) est..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 150,
    "total_tokens": 174
  },
  "_augure": {
    "gateway_region": "ca-montreal-1",
    "inference_region": "augure-cloud",
    "request_id": "a9adf17e-5ff3-4804-b01e-f7cbd30ae996"
  }
}

Streaming

Définissez "stream": true pour recevoir des événements Server-Sent Events. Chaque événement est un fragment JSON contenant un objet delta avec le contenu incrémental. Le flux se termine par data: [DONE].

Requête en streaming
curl -N -X POST https://api.augureai.ca/v1/chat/completions \
  -H "Authorization: Bearer VOTRE_CLE_API" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tofino-2.5",
    "messages": [{"role": "user", "content": "Bonjour"}],
    "stream": true
  }'
GET/v1/models

Retourne la liste de tous les modèles disponibles.

curl
curl https://api.augureai.ca/v1/models \
  -H "Authorization: Bearer VOTRE_CLE_API"

Réponse

Réponse
{
  "object": "list",
  "data": [
    { "id": "ossington-4",  "object": "model", "owned_by": "augure" },
    { "id": "tofino-2.5",   "object": "model", "owned_by": "augure" },
    { "id": "augure-nano",  "object": "model", "owned_by": "augure" }
  ]
}

Bibliothèques client

Utilisez n’importe quel SDK compatible OpenAI. Pointez-le simplement vers https://api.augureai.ca/v1 comme URL de base.

Python
from openai import OpenAI

client = OpenAI(
    api_key="VOTRE_CLE_API",
    base_url="https://api.augureai.ca/v1"
)

response = client.chat.completions.create(
    model="ossington-4",
    messages=[
        {"role": "user", "content": "Explique la Loi sur la protection des renseignements personnels du Québec"}
    ]
)
print(response.choices[0].message.content)
JavaScript / TypeScript
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "VOTRE_CLE_API",
  baseURL: "https://api.augureai.ca/v1",
});

const response = await client.chat.completions.create({
  model: "tofino-2.5",
  messages: [{ role: "user", content: "Résume la LPRPDE" }],
});
console.log(response.choices[0].message.content);

Limites

Corps de la requête

2 Mo max

Messages par requête

256 max

Jetons de sortie max

32 768

Délai d'expiration

300 secondes

Les quotas de jetons sont appliqués par clé API. Contactez-nous si vous avez besoin d’un débit plus élevé pour vos charges de production.

Erreurs

Toutes les erreurs retournent un objet JSON avec un champ error, conforme au format d’erreur OpenAI.

Réponse d'erreur
{
  "error": {
    "message": "Invalid API key provided",
    "type": "invalid_request_error",
    "param": null,
    "code": "invalid_api_key"
  }
}
StatutSignification
401Clé API manquante ou invalide
400Requête mal formée ou champs requis manquants
404Modèle ou point de terminaison inconnu
413Corps de la requête supérieur à 2 Mo
429Quota de jetons dépassé pour cette clé API
502Erreur de traitement en amont — réessayez sous peu

Prêt à intégrer?

Obtenez votre clé API et commencez à développer avec Augure.

Demander l’accès à l’API