Hallo,
Ben sinds kort aan het oefenen met reguliere expressies. Lukt aardit maar loop tegen ene probleem aan en weet eigenlijk niet of onderstaande mogelijk is.
Doormiddel van OCR wordt een pdf uitgelezen in raw tekst en op basis van deze tekst ga ik een template maken voor deze pdf(facturen) en wil deze uitlezen maar de regex moet dit als validatie afregelen .
Ik lees drie kolommen uit met tekst artikelcode- aantal -eenheid
11282 10 10 liter
11282 5 15 liter
Nu wil ik dat als ik deze drie kolommen in een kader zet een regex maken die uitsluitend afgeeft de artikelcode en eenheid
Deze beiden vormen namelijk een unieke code en die gebruik ik verderop ergens voor een koppeling.
Ik probeer via regex101 een regel te bedenken die dit kan maar lukt mij niet.
Het artikelcode bestaat altijd uit cijfers en 5 posities dus ^\d{5}
Dan zou er een stukje achter moeten komen die het aantal uitleest \d{1,9} maar dit er ook weer uitknipt
en als laatste iets als : \d{2}[liter]¤
Vraag: kan iemand mij een werkende regex laten zien die onderstaande uit bovenstaande tekst kan opleveren?
artikelcode eenheid
11282 10 liter
11282 15 liter
Alvast bedankt,
Jaap
Ben sinds kort aan het oefenen met reguliere expressies. Lukt aardit maar loop tegen ene probleem aan en weet eigenlijk niet of onderstaande mogelijk is.
Doormiddel van OCR wordt een pdf uitgelezen in raw tekst en op basis van deze tekst ga ik een template maken voor deze pdf(facturen) en wil deze uitlezen maar de regex moet dit als validatie afregelen .
Ik lees drie kolommen uit met tekst artikelcode- aantal -eenheid
11282 10 10 liter
11282 5 15 liter
Nu wil ik dat als ik deze drie kolommen in een kader zet een regex maken die uitsluitend afgeeft de artikelcode en eenheid
Deze beiden vormen namelijk een unieke code en die gebruik ik verderop ergens voor een koppeling.
Ik probeer via regex101 een regel te bedenken die dit kan maar lukt mij niet.
Het artikelcode bestaat altijd uit cijfers en 5 posities dus ^\d{5}
Dan zou er een stukje achter moeten komen die het aantal uitleest \d{1,9} maar dit er ook weer uitknipt
en als laatste iets als : \d{2}[liter]¤
Vraag: kan iemand mij een werkende regex laten zien die onderstaande uit bovenstaande tekst kan opleveren?
artikelcode eenheid
11282 10 liter
11282 15 liter
Alvast bedankt,
Jaap