Skip to content

← Production

Observability and best practices

Measure cost and tokens per call, tag traffic, protect keys and set spend limits before the bill catches you.

6 slides 5 min read
  1. OpenRouter · Producció

    Observability and best practices

    Know what you spend, where and why — before the bill tells you.

    OpenRouter · Production arlaf.dev
  2. The activity dashboard

    OpenRouter offers an activity and usage dashboard showing calls, models, tokens and cost. It's the first place to look when spend climbs and you don't know why.

    OpenRouter · Production arlaf.dev
  3. Cost and tokens per call

    Each response carries usage data and there's an endpoint detailing a generation's exact cost. Log model and cost on every call and you get real traceability, not estimates.

    OpenRouter · Production arlaf.dev
  4. Query a generation's cost

    # Exemple: consultar les dades d'una generació pel seu id
    curl https://openrouter.ai/api/v1/generation?id=$GEN_ID \
      -H "Authorization: Bearer $OPENROUTER_API_KEY"
    
    # Etiqueta el trànsit a cada crida amb capçaleres
    #   HTTP-Referer: https://elmeuapp.com
    #   X-Title: El meu app
    # així el panell agrupa l'ús per aplicació.
    
    OpenRouter · Production arlaf.dev
  5. Tag and protect

    Add HTTP-Referer and X-Title to requests to identify where each call comes from. And the usual: keys live on the server, get rotated and have spend limits configured.

    OpenRouter · Production arlaf.dev
  6. Best-practices checklist

    Before calling the integration done, review:

    • Keys server-side only, rotated periodically.
    • Spend limits set on the account and per key.
    • Model and cost logged on every call.
    • Traffic tagged with HTTP-Referer and X-Title.
    • Fallback chain and timeouts in place.
    • Model catalog reviewed every so often.
    OpenRouter · Production arlaf.dev
Read the full note

Una integració que funciona no és el mateix que una integració que controles. A producció necessites saber, en tot moment, què gastes, amb quin model i d’on ve cada crida. Això és observabilitat, i a OpenRouter la tens a tret.

Mesurar cost i tokens

El panell d’activitat i ús és el teu punt de partida: hi veus crides, models emprats, tokens i cost acumulat. Per a una traçabilitat fina, cada resposta porta dades d’ús (tokens d’entrada i sortida) i hi ha un endpoint de generació que et dóna el cost exacte d’una crida concreta a partir del seu identificador.

La regla d’or: registra model i cost a cada crida als teus logs. Quan la factura pugi, no endevinaràs — ho sabràs.

Nota: el nom exacte de l’endpoint de generació i els camps que retorna poden canviar. Contrasta’ls amb la documentació actual d’OpenRouter abans de construir-hi a sobre.

Etiquetar el trànsit

Afegint les capçaleres HTTP-Referer i X-Title a cada petició, el panell pot agrupar l’ús per aplicació. Si tens diversos projectes o entorns compartint compte, és la manera de saber qui gasta què sense barrejar-ho tot.

Protegir-se de sorpreses

La seguretat i el control de cost van junts:

  • Keys al servidor — mai al navegador ni a un repositori. I rota-les cada cert temps o davant qualsevol sospita de filtració.
  • Límits de despesa — configura’ls al compte i, si pots, per key. Un bug amb un bucle de crides no t’hauria de buidar el saldo.
  • Revisa el catàleg — els models apareixen, es deprecien i canvien de preu. El slug que avui és el millor cost/qualitat potser d’aquí a uns mesos ja no ho és. Una ullada periòdica al catàleg et manté optimitzat.

Amb cost mesurat, trànsit etiquetat, keys protegides i límits a lloc, la teva integració deixa de ser una caixa negra i passa a ser una cosa que pots operar amb confiança.