Zoeken op maat: zoekstrategieën

Geplaatst op 26 juli 2023 door Peter Tessel

In de vorige blogpost in deze serie hebben we uitgelegd dat we voor Raadzaam een knowledge graph creëren over de bestaande raadssystemen. Eén rijke databron waarin we de data uit verschillende systemen integreren, aanvullende kennis vastleggen en de structuur van het raadsdomein modelleren.

Zoekstrategieën

Raadzaam gebruikt de knowledge graph om de verschillende zoektaken die raadsleden en andere gebruikers hebben zo goed mogelijk te ondersteunen. Wij doen dit door voor iedere zoektaak een apart algoritme, of wat wij een 'zoekstrategie' noemen, te definiëren in Desk, de online toolset voor het maken van zoekmachines van Spinque. Een zoekstrategie is een combinatie van bouwblokken die concepten in de knowledge graph selecteert en rangschikt. Elk van deze bouwblokken voert een bewerking uit op de data in de knowledge graph (rangschikken, filteren, extraheren, transformeren, combineren, matchen, enz.).

De zoekstrategie die de agendapunten bij een specifiek raadsinstrument retourneert.

Een zoekstrategie levert zo een gerangschikte selectie van concepten op die relevant zijn voor de beantwoording van een specifieke zoekvraag. Raadzaam biedt voor iedere zoektaak een op maat gemaakte zoekstrategie in plaats van één zoekstrategie voor álle zoektaken. Dit zorgt ervoor dat raadsleden eenvoudig en snel de informatie vinden die relevant is voor de betreffende zoektaak.

Hieronder vier voorbeelden van de veelzijdigheid van de zoekstrategieën binnen Raadzaam:

Voorbeeld 1: passende concepten selecteren

Dat Raadzaam verschillende zoektaken ondersteunt komt duidelijk naar voren in de drie verschillende zoekingangen die de applicatie biedt: raadsstukken, wie zei wat en toezeggingen. Achter elk van deze ingangen gaat een andere zoekstrategie schuil die toegang geeft tot andersoortige informatie/concepten.

Tijdens het ontwerpproces bleek dat raadsleden in de voorbereiding op raadsvergaderingen drie verschillende informatiebehoeften hebben die via deze ingangen effectief worden ondersteund: het vinden van raadsinstrumenten om te bepalen hoe beleid tot stand is gekomen, het vinden van uitspraken van mede raadsleden om te bepalen wat zij in het verleden over bepaalde onderwerpen hebben gezegd en het vinden van toezeggingen door wethouders om te bepalen of zij zich aan hun woord hebben gehouden.

Via drie zoekingangen zijn verschillende concepten te vinden: raadsinstrumenten, uitspraken en toezeggingen.

De drie zoekstrategieën selecteren niet alleen andere concepten in de knowledge graph, maar bepalen de rangschikking van deze concepten ook op een andere manier. Voor het rangschikken van uitspraken wordt alleen de relevantie van een zoekterm ten opzichte van de inhoud van een uitspraak bepaald. Bij toezeggingen worden naast de inhoud ook de portefeuillehouder en eventuele antwoorden meegewogen. Bij raadsinstrumenten ten slotte wordt de gehele context rondom een raadsinstrument meegenomen in de bepaling van de relevantie:

Voorbeeld 2: de context meenemen bij het vinden en rangschikken

Raadsvoorstellen zijn gerelateerd aan veel verschillende documenten. De beschrijving van het voorstel zelf en daarnaast aan allerlei bijlagen: brieven, nota's, infographics, verordeningen, visies, rapporten, bestemmingsplannen, perspectieven, besluiten, toelichtingen, etc. En na een vergadering komen daar nog de notulen en eventueel de transcriptie van de videostream bij. De zoekstrategie voor raadsvoorstellen gebruikt uiteraard de volledige tekst van het voorstel zelf, maar benut daarnaast ook de tekst van alle bijlagen, de notulen en de transcriptie. Op deze manier worden raadsvoorstellen ook gevonden op zoektermen die niet in de tekst van het voorstel zelf staan. Dit kan bijvoorbeeld handig zijn als een voorstel/project in de loop van de tijd een andere naam heeft gekregen, maar nog wel onder de oude naam gevonden kan worden in historische stukken. Ook kan een relevant raadsvoorstel zo bijvoorbeeld gevonden worden via technisch jargon in een onderzoeksrapport, juridische termen in verordeningen of hoe er tijdens een raadsvergadering over is gesproken in notulen.

Gerelateerde bijlagen bij een raadsvoorstel.

Voorbeeld 3: de belangrijkste kenmerken het grootste gewicht geven

Zoekstrategieën stellen ons verder in staat om voor ieder kenmerk van een concept te bepalen hoe relevant het is voor de voorliggende zoekvraag en om hier overeenkomstig gewicht aan toe te kennen. Zo baseren we de relevantie van een raadsinstrument bijvoorbeeld niet op de tekst in z'n geheel, maar wegen we de titel en de tekst apart. Als een zoekterm in de titel voorkomt, krijgt een raadsvoorstel op deze manier een grotere relevantie dan als we de tekst in z'n geheel een gewicht zouden geven.

Iets vergelijkbaars doen we als we de context meewegen in de relevantie. We splitsen de gerelateerde documenten hierbij in drie categorieën (het raadsvoorstel zelf, het verslag en de bijlagen) die we ieder voor een ander percentage meewegen: 60%, 30% en 10%. Op deze manier wegen we het verslag en de bijlagen dus wel mee, maar wordt de relevantie vooral bepaald door de tekst van het raadsvoorstel zelf.

Het 'Mix' blok bepaalt welk gewicht het raadvoorstel, de bijlagen en het verslag krijgen (respectievelijk 0.6, 0.1 en 0.3).

Voorbeeld 4: meerdere kenmerken meewegen

Ook niet inhoudelijke kenmerken van een concept kunnen we in zoekstrategieën meewegen om de rangschikking van de zoekresultaten zo goed mogelijk aan te laten sluiten bij de behoeften van de gebruikers. Zo willen Almeerse raadsleden bijvoorbeeld als eerste recente raadsinstrumenten vinden en pas daarna meer gedateerde. Om dit te realiseren kennen we aan ieder raadsinstrument een score voor recentheid toe en passen we daarna de overige relevantie criteria toe. Iets vergelijkbaars kunnen we doen voor het belang van een raadsvoorstel, uitgedrukt in het aantal keer dat het op een agenda heeft gestaan of het aantal amendementen of moties dat erop is ingediend. Of voor de omstredenheid van een raadsvoorstel op basis van de stemverhouding.

Het begin van de zoekstrategie 'Search' die een score voor recentheid aan raadsinstrumenten toekent.

Dé zoekmachine voor raadsinformatie

Tijdens het ontwerpproces van Raadzaam hebben we veel kennis opgedaan van raadsleden, fractiemedewerkers en raadsadviseurs. Deze kennis hebben we vervolgens gebruikt om de zoekstrategieën aan te laten sluiten bij zoekvragen van de gebruikers. Op deze manier hebben wij een zoekmachine ontworpen die is toegesneden op het raadsdomein en die raadsleden in staat stelt om eenvoudig en snel de voor hen relevante informatie te vinden. En als in de praktijk blijkt dat de zoekresultaten nog beter aan kunnen sluiten bij de behoeften van de gebruikers, dan kunnen we de zoekstrategieën aanpassen en/of uitbreiden. Raadzaam blijft zo dé zoekmachine voor raadsinformatie.

Hoe Raadzaam precies toegang geeft tot de verschillende zoekstrategieën en de zoekresultaten presenteert, leggen we uit in een volgende blogpost waarin we laten zien hoe we samen met UX designers van gemeente Utrecht de interface hebben ontworpen.

Raadzaam is gebouwd op technologie van Spinque.