Hallo allemaal!
Ik heb een heel verhaal voor een eenvoudig probleem - denk ik.
Ik werk momenteel aan een programma dat zich met de Nederlandse taal bezig houdt. Een deel ervan scant teksten op woordpatronen. De woorden van de tekst worden een voor een uit de tekst geplukt en onderworpen aan de patronen. Bij een match worden de gevonden woorden verder verwerkt.
De woordpatronen wisselen voortdurend. Ik kreeg het advies om hiervoor reguliere expressies toe te passen, maar ik ben hier niet goed in. Wie kan mij helpen?
Ik programmeer in Visual Basic 6.0 en maak gebruik van Microsoft VBScript Regular Expressions 5.5. Ik zoek een patroon, dat mij mogelijk maakt om woorden te zoeken die op enig moment op een wisselend aantal plaatsen bepaalde letters bevatten.
Het patroon wordt dynamisch door het programma samengesteld en vervolgens in de reguliere expressie gebruikt: ‘objRegExp.Pattern = myPattern’.
Ter verduidelijking zal ik een (vereenvoudigd) voorbeeld geven. Stel ik heb een bestand genaamd ‘Lijst.txt’. Hierin bevinden zich honderd woorden. Het programma kan dan op enig moment besluiten:
Haal uit de woordenlijst alle woorden die:
- beginnen met een A, op de vierde positie een D hebben, op de achtste positie een E en op de elfde positie een L (hierop zou bijvoorbeeld AARDAPPELPLANT kunnen worden gevonden).
- op de tweede positie een P hebben, op de vijfde een R en op de zesde H (hierop zou bijvoorbeeld OPPERHOOFD kunnen worden gevonden).
- beginnen met een S, op de vierde positie een N hebben, op de achtste positie een M en op de elfde positie een S (hierop zou bijvoorbeeld SLANGENMENS kunnen worden gevonden).
- enz.
De posities waarop in een woord wordt gezocht, evenals de letter waarop wordt gezocht, wisselen dus voortdurend. Ook het aantal posities wisselt en soms sluiten posities op elkaar aan. Ter verduidelijking:
- de ene keer wordt op positie 3 gezocht, de andere keer op positie 5
- de ene keer wordt op positie 2 gezocht naar een A, de andere keer naar een N
- de ene keer wordt op 5 verschillende posities gezocht, de andere keer op 2
- soms wordt gezocht op posities 6 en 7, soms op 2, 3 en 4.
Hierbij zijn de genoemde getallen dus alleen voorbeelden. Ik kom er dus niet uit.
Welke tovermeester kan mij helpen?
Ik heb een heel verhaal voor een eenvoudig probleem - denk ik.

Ik werk momenteel aan een programma dat zich met de Nederlandse taal bezig houdt. Een deel ervan scant teksten op woordpatronen. De woorden van de tekst worden een voor een uit de tekst geplukt en onderworpen aan de patronen. Bij een match worden de gevonden woorden verder verwerkt.
De woordpatronen wisselen voortdurend. Ik kreeg het advies om hiervoor reguliere expressies toe te passen, maar ik ben hier niet goed in. Wie kan mij helpen?
Ik programmeer in Visual Basic 6.0 en maak gebruik van Microsoft VBScript Regular Expressions 5.5. Ik zoek een patroon, dat mij mogelijk maakt om woorden te zoeken die op enig moment op een wisselend aantal plaatsen bepaalde letters bevatten.
Het patroon wordt dynamisch door het programma samengesteld en vervolgens in de reguliere expressie gebruikt: ‘objRegExp.Pattern = myPattern’.
Ter verduidelijking zal ik een (vereenvoudigd) voorbeeld geven. Stel ik heb een bestand genaamd ‘Lijst.txt’. Hierin bevinden zich honderd woorden. Het programma kan dan op enig moment besluiten:
Haal uit de woordenlijst alle woorden die:
- beginnen met een A, op de vierde positie een D hebben, op de achtste positie een E en op de elfde positie een L (hierop zou bijvoorbeeld AARDAPPELPLANT kunnen worden gevonden).
- op de tweede positie een P hebben, op de vijfde een R en op de zesde H (hierop zou bijvoorbeeld OPPERHOOFD kunnen worden gevonden).
- beginnen met een S, op de vierde positie een N hebben, op de achtste positie een M en op de elfde positie een S (hierop zou bijvoorbeeld SLANGENMENS kunnen worden gevonden).
- enz.
De posities waarop in een woord wordt gezocht, evenals de letter waarop wordt gezocht, wisselen dus voortdurend. Ook het aantal posities wisselt en soms sluiten posities op elkaar aan. Ter verduidelijking:
- de ene keer wordt op positie 3 gezocht, de andere keer op positie 5
- de ene keer wordt op positie 2 gezocht naar een A, de andere keer naar een N
- de ene keer wordt op 5 verschillende posities gezocht, de andere keer op 2
- soms wordt gezocht op posities 6 en 7, soms op 2, 3 en 4.
Hierbij zijn de genoemde getallen dus alleen voorbeelden. Ik kom er dus niet uit.

Welke tovermeester kan mij helpen?
