Regular Expression

Status
Niet open voor verdere reacties.

Roy 1977

Gebruiker
Lid geworden
8 jun 2010
Berichten
158
Halllo,

ik ben totaal niet technisch, maar heb 2 regular expressions nodig om een verwijzing te doen naar een specifiek type pagina van een website. Ik hoop dat ik hier aan het goede adres ben en iemand kan helpen.

De structuur van de site is als volgt:

1. domein: ww.domein.nl
2. Categorie: ww.domein.nl/categorie.html waarbij er verschillende soorten categorieën zijn, heren, dames, kids om maar wat te noemen
3. Subcategorie: ww.domein.nl/categorie/subcategorie.html waarbij er weer verschillende soorten subcategorieën zijn. Truien, broeken etc

Ik zoek dus als eerste een regular expression waarmee ik alle pagina's "vang" bij 2 (op categorieniveau) EN alle pagina's bij 3 (subcategorieniveau). En dat indien mogelijk in 1 regular expression. Als dat onmogelijk is dan in 2.

En nog een niveau dieper is het als volgt:

4. Product dat direct onder de categorie hangt: ww.domein.nl/categorie/productnaam-roze.html
5. Product dat onder de subcategorie hangt: ww.domein.nl/categorie/subcategorie/productnaam-roze.html
Voor 4 en 5, dus alle productpagina's, zoek ik ook een regular expression. Maar dat kunnen dus honderden verschillende producten zijn met uiteenlopende namen zonder logica.

Ik hoop dat dit duidelijk is verwoord en dat iemand hierbij kan assisteren.

dank!
Roy
 
Laatst bewerkt:
Welke programmeer taal en hoe worden de resultaten verwerkt? Het vangen kan namelijk waarschijnlijk wel in een enkele expressie, maar dan moet de onderliggende programmalaag de logica verwerken.

Ook is er voor een regex natuurlijk geen enkel onderscheid tussen

test.com/cat/subcat.html
en
test.com/cat/artikel.html

Tenzij een categorie dus een specifiek onderscheid heeft moet ook dit via onderliggende software afgevangen worden. Ik vraag me dus af hoeveel je aan het gebruik van een regex gaat hebben tov een regelrechte "split" op "/"
 
Dank! Ik ben al iets verder in het begrijpen van de complexiteit. Voor alle duidelijkheid, ik programmeer niet(s) dus inhoudelijk is het mogelijk dat ik niet alles even snel begrijp.

Het is duidelijk dat ik het iets verder moet toelichten. Ik gebruik een webbased tool om bezoekersgedrag te kunnen analyseren. Ik wil 2 verschillende soorten pagina's analyseren. 1: een productverzamelpagina (voorbeeld: http://www.steppinout.nl/heren/truien.html) en 2. een productdetailpagina (voorbeeld http://www.steppinout.nl/heren/truien/cotton-cashmere-ronde-hals-00002840-11.html). Ik moet het als volgt ingeven: Screenshot_1.png

Dat ik mogelijk niet alles kan krijgen in 1 regex is dan geen drama, maar hoe meer hoe beter. Dit zijn de meest bezochte domein.nl/categorie/subcategorie.html en ik heb ongeveer 40 verschillende subcategorieën. Hoe meer ik er kan meenemen hoe sneller ik data heb. Belangijkste is dat binnen 1 regex niet EN een productverzamelpagina EN een productdetailpagina terecht kan komen.
 
Meld a.u.b. even als je het op meerdere forums zet:
https://www.phphulp.nl/php/forum/topic/regular-expression/101770/last/

Dat scheelt weer een hoop onnodige oplossingen in dit topic, terwijl het op het andere forum al opgelost is.

Goedemiddag, dank voor de reactie. Hoop niet dat dit als onwenselijk word ervaren, dat is in ieder geval niet zo bedoelt. Het is op het andere forum niet opgelost en ik kom er niet uit. Vandaar dat ik wat "breder" aan het shoppen ben met mijn vraag..
 
Het is zeker niet onwenselijk, als de mensen op beide forums maar in de op de hoogte houdt over de ontwikkelingen van je probleem.
 
Ah mooi! Doe ik zeker! Ik heb een beetje hulp gehad van Hotjar en ik schijn het in deze richting te moeten zoeken:

http:\/\/www.steppinout.nl\/.*\/truien.html

This would be the regex for your category pages. You would need to change "truien" for each category you want to make the Heatmap for.

Example: "boxershorts" would be targeted with "http:\/\/www.steppinout.nl\/.*\/boxershorts.html". The combo of ".*" means that anything can be there so "Women", "Men", "kids", etc.

Alleen dan moet ik voor elke subcategorie een aparte heatmap maken. IK moet dus nog op zoek naar een regex die mij of alle, maar anders zoveel mogelijk categoriepagina's geeft.


For the product pages something like this should work as well:
http:\/\/www.steppinout.nl\/heren\/truien\/.*$
 
Ok, stapje verder met behulp van https://regex101.com/ community .. het lijkt te werken:

- de heren categoriepagina's: \/heren\/[^\/]+\.html
- de heren productpagina's: \/heren\/(?:[^\/]+\/)+[^\/]+\.html
 
ik hoop je met volgende afbeelding te helpen
rewrite rull.png

als je het nog niet hebt gevonden laat je het maar weten
 
Status
Niet open voor verdere reacties.

Nieuwste berichten

Terug
Bovenaan Onderaan