Het onderstaande rapport toont de prestaties van elke intentie aan de hand van verschillende maatregelen. Elke maatregel biedt inzicht in waarom elke intentie op een bepaalde manier presteert.
Soorten prestatiebeoordelingen
1. Nauwkeurigheid (Precision)
Het toont het percentage verwarring tussen één intentie en andere intenties, bijvoorbeeld: als de nauwkeurigheid 100% is, is er geen verwarring tussen de voorbeeldsamples en andere intenties. Deze maat geeft inzicht in de verwarring tussen 2 of meer intenties.
Stel dat je twee intenties hebt; de ene heeft voorbeelden die in de andere intentie zouden moeten zijn. Het model is nu in de war, kan de sample niet categoriseren in welke intentie, bijvoorbeeld: als één intentie 20 voorbeelden heeft en ze zijn allemaal nauwkeurig, en een andere intentie heeft 10 voorbeelden, waarvan er 5 behoren tot de vorige intentie, dan wordt de precisie van de eerste intentie minder.
Wat te doen als de precisie van de intentie laag is
- Ga naar het rapport over verwarring tussen intenties.
- Controleer de kolom Intentie om te zien welke intenties verward zijn.
ℹ️ De grafiek toont de intenties met minder precisie in Geel en die met meer precisie in Blauw.
2. Recall
Toont de nauwkeurigheid van elke intentiesample, bijvoorbeeld: wanneer een intentie 20 voorbeelden heeft, zijn er 10 nauwkeurig en de andere 10 zijn onnauwkeurig. De intentie recall is hier 50% nauwkeurigheid. De recall controleert de nauwkeurigheid van de samples van elke intentie. Het beantwoordt de vraag: “Hoeveel samples zijn correct geclassificeerd?”
Wat te doen als de recall van een intentie laag is
- Ga terug naar de pagina met intentievoorbeelden om te zien of de samples verkeerd zijn geclassificeerd of in een andere intentie zijn geclassificeerd.
- Als de samples niet zijn geclassificeerd, voeg dan meer samples toe.
- Als de samples verkeerd zijn geclassificeerd in andere intenties, controleer dan of ze bij de intentie horen of niet. Zo niet, voeg dan meer vergelijkbare samples toe.
ℹ️ Als de recall-maat van je samples laag is, moet je meer samples toevoegen aan je intenties.
ℹ️ De grafiek toont intenties met minder recall in Rood en die met meer recall in Blauw.
3. F1-score
Dit is de gemiddelde maat tussen Precisie en Recall. Om de effectiviteit van het model volledig te evalueren, moet je zowel precisie als recall overwegen.
Wat te doen als de F1-score laag is
- Balanceer het aantal samples tussen intenties en los precisie- en recall-problemen op.