Hoppa till huvudinnehåll
NexarAcademy
/ academy
Logga inSkapa kontoMentorskap
←Expert

Prototyp till produktion

Playbook · 45 min
📖Teori·1 / 9

Prototyp till produktion

Vad förändras: felhantering, skalning, monitoring, säkerhet och dokumentation. Det här kapitlet ger dig expertkunskapen som krävs för att leverera professionella AI-lösningar i produktion.

📖Teori·2 / 9

De sju pelarna som skiljer prototyp från produktion

  1. Felhantering — Vad händer när Anthropic är nere? När verktyget timeoutar? När JSON är trasig?
  2. Idempotens — Samma anrop två gånger ska INTE skapa två fakturor
  3. Observability — Du måste se varje token, kostnad och latens
  4. Säkerhet — API-nycklar, prompt injection, dataläckage
  5. Skalning — Rate limits, kö, parallellitet
  6. Cost controls — Budget caps per kund, per dag, per session
  7. Dokumentation — Runbook när något går fel kl 23:00 lördag

En prototyp behöver bara fungera när du visar den. En produktionslösning fungerar när du sover.

📖Teori·3 / 9

Det första du gör när kunden säger "vi vill köra det här live"

Definiera SLA (Service Level Agreement):

  • Uptime-mål (99%? 99.9%?)
  • Maxlatens (P95 < 5 sek?)
  • Vad händer om SLA bryts?

Lista failure modes:

  • Vad händer om LLM-leverantör är nere?
  • Vad om kund matar in 50 000 tokens?
  • Vad om verktyget hänger?
  • Vad om svaret innehåller PII?

Bestäm fallback-strategi:

  • Cached respons? Mänsklig handoff? Felmeddelande?

Ett halvtimmes möte här sparar 40 timmar senare.

🎯Reflektion·4 / 9
+50 XP

Tänk på en prototyp du eller någon i din omgivning byggt (AI eller inte). Vilka tre saker skulle behöva förändras INNAN den kan köras i produktion hos en betalande kund? Var konkret.

Produktion handlar om uthållighet — systemet ska tåla att DU inte sitter och tittar på det. Tänk: vad händer kl 02:00 när du sover och något går sönder?

📖Teori·5 / 9

Production-readiness checklist (använd hos varje kund)

Innan go-live:

  • API-nycklar i secret manager (aldrig i kod/git)
  • Rate limiting per kund/användare
  • Timeouts på ALLA externa anrop (LLM, verktyg, DB)
  • Retry med exponential backoff
  • Strukturerad loggning (JSON, sökbar)
  • Cost tracking per request
  • PII-scrubbing i loggar
  • Budget cap per dag
  • Hälsokontroll-endpoint
  • Runbook för de 5 vanligaste felen
  • Backup-prompt om huvudprompten failar
  • Eval-suite som körs vid varje deploy
📋Mini-projekt·6 / 9
🎨 Mini-projekt
Designa produktionsarkitektur för en riktig kund
~45 min+200 XP

Du ska skissa upp en produktionsarkitektur för en konkret kund. Det här är dokumentet du faktiskt levererar i ett SOW innan utveckling startar.

1
Skissa systemkomponenterna

Lista alla komponenter som behövs (frontend, backend, LLM-anrop, vektorlagring, autentisering, loggning). För varje: vilket konkret val (t.ex. Next.js, Claude Sonnet, Pinecone, Azure AD) och en mening om varför.

Bedömningskriterier
  • ▸Minst 6 komponenter listade
  • ▸Konkreta tekniker namngivna (inte 'en databas' utan 'PostgreSQL på Supabase')
  • ▸Motiverat varje val kort
  • ▸GDPR-aspekten adresserad (var lagras data, dataresidency)
2
Identifiera de 5 viktigaste failure modes

Lista 5 sätt systemet kan misslyckas. För varje: hur ofta tror du det händer, vad är konsekvensen för användaren, och vilken mitigering bygger du in?

Bedömningskriterier
  • ▸5 distinkta failure modes
  • ▸Realistisk frekvensbedömning
  • ▸Konkret mitigering per fall
  • ▸Inkluderar både tekniska fel och AI-specifika fel (hallucination, lång kontext)
3
Räkna ut kostnad per månad

Räkna ut förväntad LLM-kostnad/månad vid 200 frågor/dag, ~3000 input tokens och ~500 output tokens per fråga med Claude Sonnet. Lägg till hosting, vektorlagring och övriga kostnader. Jämför med vad ni skulle ta betalt (månadsavgift för drift).

Bedömningskriterier
  • ▸Korrekt token-räkning (input × pris + output × pris)
  • ▸Inkluderar hosting + vektor-DB
  • ▸Anger månadskostnad totalt
  • ▸Föreslår en månadsavgift med marginal (3-5x kostnad)
🛠️Tillämpa·7 / 9
+75 XP

En kund vill att du sätter upp en staging-miljö (test) skild från produktion. Beskriv exakt hur du strukturerar det: vilka miljöer (dev/staging/prod), vilka API-nycklar i varje, hur deploy går till, och hur testdata hanteras. Skriv det som en kort intern PM till kundens IT-ansvarig.

Kunden använder Vercel + GitHub + Anthropic API. De är vana vid traditionell SaaS men har inte byggt AI-lösning förut. De vill kunna testa nya prompts utan att riskera produktionen.

⚠️Varning·8 / 9

Vanligaste misstaget: tro att en demo som funkar = produktion. En demo körs av dig själv, en gång, med curated input. Produktion körs av 30 personer som matar in vad som helst, samtidigt, dygnet runt. Bygg för det andra fallet.

🔁Flashcards·9 / 9
📇 Flashcards1 / 5
Felhantering och graceful degradation →