We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Bästa AI-tjänsten på Azure du inte visste fanns

Bästa AI-tjänsten på Azure du inte visste fanns

2024/9/30
logo of podcast Microsoft Partnerpodden

Microsoft Partnerpodden

Shownotes Transcript

När man byggt och skalar AI-lösningar stöter man sannolikt på ett specifikt problem, nämligen att slå i taket för rate limits och hur många requests man kan göra under en viss tid. Ett sätt att hantera detta är att ha flera instanser av AI-modellerna och växla mellan dom. I det här avsnittet pratar jag med Simon Kurtz om hur GenAI Gateway för API Management kan hjälpa till på riktigt smarta sätt för att lastbalansera och minska antal tokens som behövs. Hosted on Acast. See acast.com/privacy) for more information.