Vad förändras: felhantering, skalning, monitoring, säkerhet och dokumentation. Det här kapitlet ger dig expertkunskapen som krävs för att leverera professionella AI-lösningar i produktion.
En prototyp behöver bara fungera när du visar den. En produktionslösning fungerar när du sover.
Definiera SLA (Service Level Agreement):
Lista failure modes:
Bestäm fallback-strategi:
Ett halvtimmes möte här sparar 40 timmar senare.
Tänk på en prototyp du eller någon i din omgivning byggt (AI eller inte). Vilka tre saker skulle behöva förändras INNAN den kan köras i produktion hos en betalande kund? Var konkret.
Produktion handlar om uthållighet — systemet ska tåla att DU inte sitter och tittar på det. Tänk: vad händer kl 02:00 när du sover och något går sönder?
Innan go-live:
Du ska skissa upp en produktionsarkitektur för en konkret kund. Det här är dokumentet du faktiskt levererar i ett SOW innan utveckling startar.
Lista alla komponenter som behövs (frontend, backend, LLM-anrop, vektorlagring, autentisering, loggning). För varje: vilket konkret val (t.ex. Next.js, Claude Sonnet, Pinecone, Azure AD) och en mening om varför.
Lista 5 sätt systemet kan misslyckas. För varje: hur ofta tror du det händer, vad är konsekvensen för användaren, och vilken mitigering bygger du in?
Räkna ut förväntad LLM-kostnad/månad vid 200 frågor/dag, ~3000 input tokens och ~500 output tokens per fråga med Claude Sonnet. Lägg till hosting, vektorlagring och övriga kostnader. Jämför med vad ni skulle ta betalt (månadsavgift för drift).
En kund vill att du sätter upp en staging-miljö (test) skild från produktion. Beskriv exakt hur du strukturerar det: vilka miljöer (dev/staging/prod), vilka API-nycklar i varje, hur deploy går till, och hur testdata hanteras. Skriv det som en kort intern PM till kundens IT-ansvarig.
Kunden använder Vercel + GitHub + Anthropic API. De är vana vid traditionell SaaS men har inte byggt AI-lösning förut. De vill kunna testa nya prompts utan att riskera produktionen.
Vanligaste misstaget: tro att en demo som funkar = produktion. En demo körs av dig själv, en gång, med curated input. Produktion körs av 30 personer som matar in vad som helst, samtidigt, dygnet runt. Bygg för det andra fallet.