Walma

AI Cost Management. Få svar på vad AI-verktygen faktiskt kostar.

Realtidsdata över spend, prognoser per modell, budgetar per team. Allt på en plats, automatiskt synkat från APIM.

Ni betalar tre fakturor i tre olika valutor till tre olika leverantörer, och säljarna ringer en gång i månaden för att fråga om ni ska uppgradera. AI Hub samlar all AI-användning på ett ställe. Ni ser exakt vad varje krona går till, vem som spenderar den, vilken modell som driver kostnaden och hur månaden ser ut att landa. När budgeten närmar sig taket triggas varningar automatiskt, och när någon teammedlem byter tier slår nya gränserna igenom på nästa request.

Några kunder & samarbetspartners

SKBVictoriahemOne MoreInseraJunglemapAlice LabsPublic PartnerOMIFAWS PartnerMicrosoft

Tre AI-leverantörer, fem prenumerationer, noll översikt.

Så ser den typiska AI-spendbilden ut i ett organisations-IT idag.

Se hur AI Hub samlar det

Per-token-pris ni inte kan budgetera mot

Modellerna debiterar per input- och output-token, med olika priser per modell. En enskild användare kan elda upp månadsbudgeten på en eftermiddag utan att någon märker det förrän fakturan kommer.

Inget team-perspektiv

Anthropic och OpenAI rapporterar spend per organisation, inte per team eller individ. När finanschefen vill fördela kostnader på cost center är svaret 'vi gissar'.

Användningen växer fortare än insynen

Varje vecka lägger någon till en ny modell eller ett nytt verktyg. Tracking-arket sackar efter, ingen vet vad totalkostnaden faktiskt är just nu.

Spend MTD, månadsprognos och daglig burn rate. I realtid.

Från APIM direkt in i er dashboard.

AI Hub samlar alla AI-anrop genom samma gateway. Varje request loggas med modell, tokens, tool och developer. Dashboard-vyn räknar fram månads-MTD, kvarvarande budget, prognos baserad på daglig burn rate och deviation mot budget pace. Ni ser samtidigt hur fördelningen mellan modeller ser ut och var pengarna faktiskt går.

AI Cost Management dashboard med MTD, prognos och modellfördelning
Funktioner

Allt ni behöver för att driva AI-kostnaden professionellt

Inte ett rapportverktyg ovanpå CSV-exporter. En levande styrning där policy och kostnad hänger ihop.

Realtidsbudgetar

Realtidsbudgetar

  • Månadsbudget per organisation, team och individ
  • Hard cap som suspenderar trafik vid överträdelse
  • Varningsnivåer (75 %, 90 %, 100 %) med notifiering
  • Daily budget rate för att jämföra mot 30-dagars rolling
Prognos och scenarioplanering

Prognos och scenarioplanering

  • Månadsslut-prognos baserad på burn rate
  • Per-modell prognos och stackad area-chart
  • Identifiera över-pace vs under-pace mot budget
  • Beräkna effekten av att flytta team mellan tiers
Cache hit och spareffekter

Cache hit och spareffekter

  • Cache hit rate per organisation
  • Kronor sparade genom caching
  • Tokens per krona som effektivitetsmått
  • Throttling-statistik som hjälper kapacitetsplaneringen
Cost center och fakturering

Cost center och fakturering

  • Tagga team med cost center för intern fakturering
  • Export i CSV och JSON för ekonomisystem
  • Markup-transparens (vad ni betalar Walma vs leverantör)
  • Månadsrapport per cost center, klar att lägga i ekonomimötet
Hur det funkar

Loggning som inte saktar ner produktionen

Spend-data är beräknad utifrån faktiska tokens, inte prognosticerade siffror. Underlaget är samma som leverantörens faktura.

Async telemetri

APIM loggar varje request asynkront. Era utvecklare märker inte gateway-trafiken. Rollups körs i workers, dashboarden uppdateras minutligen.

Modellpriser som ni kan justera

Modellprislistan ligger i en tabell ni kan ändra. När leverantören sänker priset skriver ni in det och rollups räknar om historiskt.

Multivaluta

Spend lagras i organisationens valuta och presenteras i den valuta er FinOps väljer. Växelkurser uppdateras dagligen.

Varför styra AI-kostnaden centralt

Allt är inte AI-säkerhet. En del är bara pengar.

Tre konkreta effekter ni får ut första kvartalet.

Sparar 20 till 40 procent på modellanvändning

Genom cache, billigare modell för enklare uppgifter och tier-baserad styrning. Vi har sett kunder gå från 80 000 till 50 000 kronor på samma utvecklarteam, utan att utvecklarna märkte något.

Slut på fakturachockerna

Hard cap och prognos gör att ingen månad slutar med 'va, vad hände?'. Ni ser i mitten av månaden om läget håller och kan agera.

Cost center på riktigt

När ekonomi frågar 'vad kostade AI för affärsområde X?' har ni svaret. Inte gissningar, inte CSV-exporter ni klistrar ihop manuellt.

Underlag för förhandling med leverantörerna

När ni ser exakt hur mycket ni använder per modell har ni ett konkret förhandlingsläge med Anthropic eller OpenAI. Skillnaden mellan att gissa och att veta är ofta många procent i rabatt.

AI-spend dashboard
Onboarding

Från första anslutning till första rapport på två veckor

Standardpaket. Ni har dashboarden i drift innan månaden är slut.

1

Anslut leverantörerna

Vi konfigurerar APIM mot era Anthropic- och OpenAI-konton. Befintliga nycklar fortsätter fungera, gatewayen lägger sig framför.

Dag 1 till 3
2

Definiera teamen

Cost center, team och budgetar matas in. SCIM-grupper kopplas till tiers så att nya medarbetare automatiskt får rätt åtkomst.

Dag 4 till 7
3

Pilotrullning

Två team flyttar över sina endpoints. Vi övervakar tillsammans, justerar priser och budgetnivåer.

Vecka 2
4

Full rapportering

Resterande team flyttas över. Första månadsrapporten levereras automatiskt med spend, prognos och cost center-fördelning.

Vecka 3 till 4

AI Hub. Gatewayen mellan era utvecklare och AI-modellerna.

Få kontroll på kostnad, säkerhet och policy för Claude Code, Codex och alla AI-verktyg era team redan använder.

Läs mer

Vanliga frågor om AI Cost Management

Detaljer. Varje request lagras med input-tokens, output-tokens, modell, tool och developer. Vi visar totaler i dashboarden men ni kan exportera till radnivå om er FinOps behöver det för internfakturering.

Prognosen tar daglig burn rate hittills i månaden och multiplicerar med antal dagar i månaden. Det är konservativt vid månadens början och precist från dag 7. För team med kraftigt säsongsmönster kan vi växla till 7-dagars rullande snitt.

Beroende på tier-policy. Default är att ny request returnerar en informativ 429 med 'budget exceeded'. Ni kan också välja soft cap där requests fortsätter men en notifiering skickas till chef och utvecklare.

Vi tar en månadskostnad per organisation och en transparent markup på modellanvändningen. Den markupen är typiskt mindre än vad ni sparar genom cache och tier-styrning. Vi visar break-even-kalkyl i första mötet.

Telemetrin landar i Supabase med max 60 sekunders fördröjning. Aggregeringen körs minutligen. Dashboarden är effektivt realtid.

Ja. Det finns en data export-endpoint som ger er rådata. Många kunder kopplar in den i Power BI eller Looker för att korsa AI-spend mot annan FinOps-data.