Documentation pour développeurs

API Augure

API de complétion de chat compatible OpenAI sur une infrastructure canadienne souveraine. Aucune exposition américaine. Aucun CLOUD Act.

URL de base : https://api.augureai.ca

🍁

Acheminement et résidence des données

Toutes les requêtes API transitent par notre passerelle à Beauharnois, au Québec. L’inférence s’exécute sur une infrastructure souveraine sans société mère américaine dans la chaîne — aucune donnée ne touche une infrastructure américaine à aucun moment. Ossington 4 fonctionne sur une infrastructure GPU canadienne à Calgary. Les requêtes sont chiffrées en transit (TLS 1.2+), jamais journalisées par Augure et jamais utilisées pour l’entraînement de modèles.

Passerelle canadienneInférence souveraineAucune exposition USAucune journalisation

Authentification

Tous les points de terminaison nécessitent un jeton Bearer. Incluez votre clé API dans l’en-tête Authorization de chaque requête.

Exemple

curl https://api.augureai.ca/v1/models \
  -H "Authorization: Bearer VOTRE_CLE_API"

Obtenir une clé : les clés API sont émises via notre processus de candidature. Demander l’accès pour commencer.

Modèles

Trois modèles sont disponibles, optimisés pour différentes charges de travail.

ossington-4

Grand modèle, capacité maximale

Raisonnement complexe, analyse juridique, révision de documents

Lun–ven 6 h – minuit, sam–dim 10 h – 18 h HE

tofino-2.5

Petit modèle rapide et efficace

Chat, résumés, tâches rapides

24/7

augure-nano

Modèle compact 8B

Classification, extraction, tâches simples

24/7

Compatibilité OpenAI : les alias gpt-4, gpt-4o, gpt-4o-mini et gpt-3.5-turbo sont pris en charge pour une compatibilité directe avec les bibliothèques client OpenAI. Ils correspondent respectivement à ossington-4 et tofino-2.5.

Points de terminaison

POST/v1/chat/completions

Créer une complétion de chat. Accepte le même format de requête que le point de terminaison de complétion de chat d’OpenAI.

Paramètres

Champ	Type	Requis	Description
model	string	Oui	Identifiant du modèle (voir Modèles ci-dessus)
messages	array	Oui	Tableau d'objets message
stream	boolean	Non	Réponse en continu via SSE. Par défaut : false
temperature	number	Non	Température d'échantillonnage (0,0–2,0)
max_tokens	number	Non	Nombre maximal de jetons à générer (jusqu'à 32 768)
top_p	number	Non	Seuil d'échantillonnage nucleus
stop	string \| array	Non	Séquence(s) d'arrêt

Chaque message du tableau messages possède un role ("system", "user" ou "assistant") et un content de type chaîne.

Exemple de requête

curl

curl -X POST https://api.augureai.ca/v1/chat/completions \
  -H "Authorization: Bearer VOTRE_CLE_API" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "ossington-4",
    "messages": [
      {"role": "system", "content": "Tu es un assistant utile."},
      {"role": "user", "content": "Qu'est-ce que le Code civil du Québec?"}
    ]
  }'

Exemple de réponse

Réponse

{
  "id": "chatcmpl-a9adf17e-5ff3-4804-b01e-f7cbd30ae996",
  "object": "chat.completion",
  "created": 1771286577,
  "model": "ossington-4",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Le Code civil du Québec (CCQ) est..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 150,
    "total_tokens": 174
  },
  "_augure": {
    "gateway_region": "ca-montreal-1",
    "inference_region": "augure-cloud",
    "request_id": "a9adf17e-5ff3-4804-b01e-f7cbd30ae996"
  }
}

Streaming

Définissez "stream": true pour recevoir des événements Server-Sent Events. Chaque événement est un fragment JSON contenant un objet delta avec le contenu incrémental. Le flux se termine par data: [DONE].

Requête en streaming

curl -N -X POST https://api.augureai.ca/v1/chat/completions \
  -H "Authorization: Bearer VOTRE_CLE_API" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tofino-2.5",
    "messages": [{"role": "user", "content": "Bonjour"}],
    "stream": true
  }'

GET/v1/models

Retourne la liste de tous les modèles disponibles.

curl

curl https://api.augureai.ca/v1/models \
  -H "Authorization: Bearer VOTRE_CLE_API"

Réponse

{
  "object": "list",
  "data": [
    { "id": "ossington-4",  "object": "model", "owned_by": "augure" },
    { "id": "tofino-2.5",   "object": "model", "owned_by": "augure" },
    { "id": "augure-nano",  "object": "model", "owned_by": "augure" }
  ]
}

Bibliothèques client

Utilisez n’importe quel SDK compatible OpenAI. Pointez-le simplement vers https://api.augureai.ca/v1 comme URL de base.

Python

from openai import OpenAI

client = OpenAI(
    api_key="VOTRE_CLE_API",
    base_url="https://api.augureai.ca/v1"
)

response = client.chat.completions.create(
    model="ossington-4",
    messages=[
        {"role": "user", "content": "Explique la Loi sur la protection des renseignements personnels du Québec"}
    ]
)
print(response.choices[0].message.content)

JavaScript / TypeScript

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "VOTRE_CLE_API",
  baseURL: "https://api.augureai.ca/v1",
});

const response = await client.chat.completions.create({
  model: "tofino-2.5",
  messages: [{ role: "user", content: "Résume la LPRPDE" }],
});
console.log(response.choices[0].message.content);

Limites

Corps de la requête

2 Mo max

Messages par requête

256 max

Jetons de sortie max

32 768

Délai d'expiration

300 secondes

Les quotas de jetons sont appliqués par clé API. Contactez-nous si vous avez besoin d’un débit plus élevé pour vos charges de production.

Erreurs

Toutes les erreurs retournent un objet JSON avec un champ error, conforme au format d’erreur OpenAI.

Réponse d'erreur

{
  "error": {
    "message": "Invalid API key provided",
    "type": "invalid_request_error",
    "param": null,
    "code": "invalid_api_key"
  }
}

Statut	Signification
401	Clé API manquante ou invalide
400	Requête mal formée ou champs requis manquants
404	Modèle ou point de terminaison inconnu
413	Corps de la requête supérieur à 2 Mo
429	Quota de jetons dépassé pour cette clé API
502	Erreur de traitement en amont — réessayez sous peu

Prêt à intégrer?

Obtenez votre clé API et commencez à développer avec Augure.

Demander l’accès à l’API