Designing with LLMs: A UX Framework for E-commerce

LLM's in e-commerce voelen slim. Totdat je ze echt gebruikt

Vorige maand zat ik bij een klant die net een AI-chatbot had uitgerold op hun webshop. Trots. €8.000 aan implementatie. "Klantenservice wordt 60% goedkoper," zei de COO.

Na twee weken had de bot 340 tickets gegenereerd die handmatig gecorrigeerd moesten worden. Levertijden die niet klopten. Retourinformatie die juridisch niet door de beugel kon. Productteksten die meer leken op Wikipedia dan op conversiegerichte copy.

Het model werkte prima. De UX eromheen was een ramp.

De meeste AI-features in e-commerce falen niet door het model, maar doordat niemand de UX-vraag heeft gesteld.

Twee fouten die ik overal terugzie

De black box

Bij een outdoormerk waar ik voor werk genereerde hun AI-tool producttitels voor Amazon DE. Technisch correct. Maar de titels misten de Duitse zoektermen die daadwerkelijk verkeer opleveren. Het model had geen toegang tot actuele zoekdata en vulde de gaten met aannemelijk klinkende maar waardeloze keywords.

Niemand in het team wist dat. Het zag er professioneel uit. Pas toen de Click-Through Rate met 23% daalde in zes weken, ging iemand handmatig checken.

Dat is het gevaar: de output oogt zelfverzekerd, ook als hij nergens op slaat.

De vervangingsval

Een beautymerk waarmee ik werk. 85 SKU's en €2 miljoen jaaromzet. Ze wilden hun volledige productcontent laten genereren door AI. "Scheelt ons een copywriter."

Het scheelde ze een copywriter. Het kostte ze 14% meer retouren in drie maanden. De AI schreef dat een serum "geschikt is voor alle huidtypes" terwijl het product retinol bevat. Dat stond in de specs, maar het model negeerde die nuance.

AI kan werk versnellen. Maar niet elke taak moet end-to-end geautomatiseerd worden.

Vijf principes die ik overal toepas

1. Bepaal de betrouwbaarheidsgrens

Een AI-gegenereerde categorietekst is iets anders dan een technisch gevalideerde fitment-specificatie. Een eerste productdraft is iets anders dan een listing die klaar is voor Bol.com.

Maar eigenlijk behandelen de meeste interfaces alle output alsof het goud is. Dezelfde vormgeving. Dezelfde impliciete boodschap: "dit klopt."

Wat ik doe: output visueel onderscheiden op basis van zekerheid. Hoog? Toon direct. Laag? Frame als suggestie of startpunt. Klinkt simpel. Maakt een wereld van verschil.

2. Houd de mens in de loop, maar maak het snel

De mens moet erbij blijven. Maar als "erbij blijven" betekent dat je elk stukje output handmatig moet reviewen, verlies je het snelheidsvoordeel waar je AI voor inzette.

De truc: niet "hier is output, check alles." Wel: "hier zijn drie opties, kies er één en pas de toon aan." AI schrijft producttitels per platform. De specialist keurt goed met één klik of past aan.

Het gekke is: de meeste AI-tools zijn ontworpen alsof de mens er niet meer bij hoeft. Terwijl de mens er juist sneller bij moet kunnen.

3. Laat zien wat het systeem deed

Gebruikers hoeven niet te weten hoe een transformer werkt. Ze moeten wél begrijpen waar de output vandaan komt.

Bij een klant in de automotive hebben we dit ingevoerd voor AI-gegenereerde fitment data. Voorheen vertrouwde het team blind op de output. Nu zien ze bij elk record: "Bron: TecDoc database, match-confidence: 87%." Dat ene label halveerde het aantal fouten dat live ging.

4. Ontwerp voor correctie, niet voor perfectie

LLM's zijn nooit in één keer perfect. Punt.

De vraag is niet "hoe maken we de AI foutloos" maar "hoe maken we corrigeren zo makkelijk dat het bijna leuk is."

Herschrijven met één klik. Toon aanpassen van formeel naar casual. Versies naast elkaar leggen. Voor teams die werken met Amazon, Bol.com, Channable en paid search is dat geen luxe maar noodzaak.

5. Bescherm de momenten waar vertrouwen telt

Bij een van mijn klanten ging een AI-gegenereerd antwoord over garantievoorwaarden live via hun chatbot. Subtiel maar feitelijk onjuist. Eén klant escaleerde. Juridisch gelukkig te herstellen, maar het kostte drie dagen en een hoop stress.

Mijn regel: hoe hoger het risico, hoe strakker de UX. Meer validatie, strengere review, minder ruimte voor interpretatie.

Snelheid zonder controle is geen innovatie. Het is risico in een nette interface.

Wat ik in de praktijk zie

Goed ingezet helpen LLM's teams om productcontent sneller op te schalen, zoekintentie te structureren en klantenservice te ondersteunen. Niet door mensen te vervangen, maar door het repetitieve werk te versnellen zodat mensen zich focussen op waar hun expertise ertoe doet.

Slecht ingezet krijg je generieke content, feitelijke fouten en het ergste: extra reviewwerk dat alle tijdswinst weer opheft.

Bij een marketplace-team zag ik dat AI-producttitels 3x sneller werden gegenereerd. Maar zonder UX-aanpassingen in het reviewproces leidde het tot 30% extra correctietijd. Netto was het team langzamer dan voorheen.

Het verschil zit bijna nooit in het model. Het zit in het productdenken eromheen.

De teams die gaan winnen

De vraag is niet meer of AI iets bruikbaars kan genereren. Dat kan het.

De vraag is of je er een ervaring omheen bouwt die het ook betrouwbaar, begrijpelijk en commercieel bruikbaar maakt.

AI wordt niet gewonnen door wie het snelst bouwt. Het wordt gewonnen door wie het het best ontwerpt.

---

*Wil je sparren over hoe AI past in jouw e-commerce operatie? [Neem contact op](/about) voor een vrijblijvend gesprek.*

Ontwerpen met LLM's in e-commerce: een praktisch UX-framework dat wél werkt