AI in je applicatie: wie houdt de controle?

AI toevoegen aan een applicatie is technisch niet zo ingewikkeld meer. Je koppelt een model, schrijft een prompt en krijgt antwoord terug. De moeilijkere vraag komt daarna: hoe houd je grip op wat AI doet?

Timo
Geschreven door Timo
ai digitale landschap breed
ai digitale landschap breed

AI krijgt een plek in bestaande systemen

Als back-end developer zorg ik ervoor dat verschillende systemen met elkaar samenwerken. Wanneer een gebruiker iets doet in een applicatie, bouw ik de logica die bepaalt wat er daarna moet gebeuren. Moeten gegevens worden opgehaald? Moet informatie worden opgeslagen? Of moet er data worden uitgewisseld met een ander systeem? Denk aan een backoffice, een zorgsysteem of een ander platform waar belangrijke informatie staat.

Bij een van onze klanten in de zorg krijgt AI een plek in zo’n flow. Het helpt gebruikers bij rapportages die ze toch al moeten maken. AI kijkt hier mee naar een open tekst. Is de uitleg compleet genoeg? Mist er nog iets? Is de onderbouwing logisch?

Dat is iets anders dan controleren of een veld goed is ingevuld. Bij een datum kun je zeggen: dit moet dag, maand en jaar zijn. Bij een telefoonnummer kun je controleren of er genoeg cijfers in staan. Maar bij een vrije tekst werkt dat niet zo simpel.

Daar gaat het om context. Waarom is iets nodig? Is de uitleg sterk genoeg? Zijn er alternatieven genoemd? Daar kan AI helpen om eerder in het proces betere vragen te stellen.

Zodra je AI op zo’n plek gebruikt, moet je ook nieuwe keuzes maken. Welke informatie stuur je mee? Welke prompt gebruik je? Welk model geeft antwoord? Wat kost die actie? En wie controleert of de uitkomst klopt?

Die vragen wil je niet pas stellen als de functie al live staat.

Prompts beheren buiten de code

Als je AI in een applicatie gebruikt, bouw je niet alleen een koppeling met een model. Je bouwt ook een manier om die AI te beheren. Daar zit voor mij een belangrijk deel van onze rol als ontwikkelaar.

Een prompt is de instructie die je aan AI geeft. Bijvoorbeeld waar AI op moet letten bij een rapportage, welke toon past en wanneer het moet aangeven dat er informatie mist.

Je kunt zo’n prompt vast in de code zetten. Dan werkt het technisch prima, maar elke inhoudelijke wijziging wordt ook meteen een technische wijziging. Een developer moet de prompt aanpassen, testen en opnieuw uitrollen.

Bij deze zorgorganisatie is dat niet altijd logisch. Zij weten beter dan ik wanneer een rapportage inhoudelijk klopt. Als developer wil ik vooral zorgen dat de koppeling veilig, duidelijk en onderhoudbaar is. De inhoudelijke sturing hoort dichter bij de mensen met domeinkennis te liggen.

Daarom kijken we naar een tussenlaag voor promptbeheer. In dit project gebruiken we Langfuse als voorbeeld van zo’n schakel. Daarmee halen we de prompt uit de vaste code en maken we het beheer ervan beter zichtbaar.

Dat lost niet alles op. Je moet nog steeds goede keuzes maken over data, veiligheid, rollen en controle. Maar het zorgt er wel voor dat AI niet als losse black box in je applicatie hangt.

De plek van Langfuse in een digitaal landschap

Wat zo’n aanpak praktisch oplevert

De waarde zit vooral in grip. Je maakt zichtbaar wat anders snel verstopt raakt in de applicatie.

Met een aanpak zoals Langfuse kun je bijvoorbeeld:

  • promptversies beheren en terugzien wat er is aangepast
  • testen welke prompt betere output geeft
  • bijhouden welk model is gebruikt
  • zien hoeveel tokens een actie kost
  • meten hoe lang een AI-actie duurt
  • feedback verzamelen op het resultaat
  • onderzoeken waarom een antwoord goed of juist niet goed was

Dat helpt ons om AI niet alleen werkend te maken, maar ook beheerbaar. En dat is belangrijk als je AI serieus wilt gebruiken in een product of proces.

Want AI is niet iets wat je één keer goed zet en daarna vergeet. Prompts veranderen. Modellen veranderen. Kosten veranderen. En gebruikers leren pas in de praktijk wat wel en niet helpt.

Als agency zit onze rol daarom niet alleen in de koppeling bouwen. We moeten ook helpen bepalen waar AI in het landschap past, wat je wilt kunnen meten en wie waarvoor verantwoordelijk is.

Langfuse is daarin één schakel. De grotere aanpak is dat je AI vanaf het begin inricht als iets wat je kunt volgen, aanpassen en uitleggen.

Een groeiende valkuil: de kosten van AI

AI wordt vaak gezien als manier om sneller te werken. Dat klopt ook. Maar elke keer dat je AI gebruikt, loopt er ook een teller mee.

Eén losse actie kost misschien weinig, maar in een applicatie met veel gebruikers kan dat hard gaan. Zeker als AI automatisch wordt gestart op plekken waar het weinig toevoegt.

Daarbij maakt het ook uit welk model je gebruikt. Niet elk AI-model kost hetzelfde, en niet elk model is even geschikt voor dezelfde taak. Een model dat goed is in inhoudelijk redeneren kan handig zijn bij een complexe controle. Voor een simpele herschrijving of het omzetten van tekst naar een vast format is zo’n zwaar model misschien niet nodig.

Voor je het weet betaal je dan een senior AI-model voor juniorwerk. Dat kan technisch prima werken, maar je betaalt waarschijnlijk veel meer voor het gebruik dan nodig.

Daarom kijken wij per stap wat logisch is. Heeft deze taak echt AI nodig? Welk model past daarbij? Hoe vaak wordt deze actie uitgevoerd? En wat levert dat op voor de gebruiker of het proces?

Soms is een sterk model logisch. Soms is een eenvoudiger model genoeg. En soms is gewone techniek beter.

Een formulier, een vaste controle of een FAQ kan sneller, goedkoper en duidelijker zijn dan een AI-functie. Dat klinkt minder spannend, maar voor de gebruiker en je kostenplaatje is het soms gewoon beter. Juist daar moeten we scherp op blijven: niet overal AI tussen zetten, maar bewust kiezen waar het waarde toevoegt en hoe je dat blijft meten.

De mens moet verantwoordelijk blijven

Bij deze zorgorganisatie helpt AI om rapportages beter en makkelijker te maken. AI kan vragen stellen, aangeven dat er informatie mist of helpen om tekst aan te vullen. Een medewerker controleert daarna zelf of het klopt.

Dat vind ik belangrijk. Zeker bij processen waar kwaliteit en verantwoording een rol spelen. AI mag ondersteunen, maar het moet duidelijk blijven wie de uitkomst beoordeelt.

Daar komt ook wetgeving bij kijken, zoals de EU AI Act. Als organisatie moet je kunnen uitleggen hoe je AI gebruikt, welke keuzes je maakt en hoe je risico’s beperkt. Dat vraagt niet alleen om beleid, maar ook om techniek die dit mogelijk maakt.

Daar helpen wij als ontwikkelaar bij. Denk aan logging, veiligheid en data. We leggen vast welke informatie nodig is om achteraf te kunnen controleren wat er is gebeurd en maken bewuste keuzes over welke data juist niet wordt opgeslagen. Ook richten we processen in voor het beheren van prompts en zorgen we dat de gebruiker altijd de laatste controle houdt.

Dat zijn keuzes die je aan het begin moet maken en bepalen of AI verantwoord in je product past.

AI zonder controle is gewoon een nieuw kostbaar risico in je systeem

Daar komt het voor mij op neer.

Je wilt niet alleen weten óf AI iets kan. Je wilt vooral inzicht hebben in hoe AI binnen je organisatie wordt gebruikt. Het moet duidelijk zijn waar AI wordt ingezet, welke instructies het meekrijgt, welk model wordt gebruikt, wat het gebruik kost en hoe de kwaliteit van de uitkomsten wordt gecontroleerd.

Dat moet je samen goed inrichten. De mensen die het proces en de inhoud kennen, weten wanneer een uitkomst bruikbaar is. Ontwikkelaars helpen om AI zo in te richten dat gebruik, kosten en uitkomsten beter te volgen en beheersen zijn. Een tool als Langfuse helpt daarbij. Dat lost niet alles op, maar is een schakel om meer grip te krijgen.

AI kan veel werk makkelijker maken. Maar je moet erbij kunnen blijven. Je moet kunnen bijsturen als het niet goed werkt. En je moet kunnen uitleggen waarom AI op die plek duidelijk iets toevoegt.