data uit een webpagina opslaan in variabelen

Status
Niet open voor verdere reacties.

mariannevanh

Terugkerende gebruiker
Lid geworden
14 dec 2004
Berichten
2.085
Hoe kan ik data uit een webpagina automatisch laten ophalen en opslaan in variabelen?
Het gaat om een webpagina die gegeneerd wordt en waar twee keer
Code:
<div class="gedcom-data" dir="ltr">1 HUSB
in voorkomt en ook twee keer
Code:
<div class="gedcom-data" dir="ltr">1 WIFE
Ik zou graag de waarden die daarachter staan (10 tekens per keer) in 4 aparte variabelen willen opslaan en deze (via een macro?) willen plaatsen in een Excelsheet.

Vriendelijke groet,
Marianne
 
Kan je niet beter de XML-data van GEDCOM "GEnealogy Data COMmunciation" halen.
Dat is beter dan webscrapen.
 
Kan je niet beter de XML-data van GEDCOM "GEnealogy Data COMmunciation" halen.
Dat is beter dan webscrapen.

Dit is inderdaad veel beter. Straks passen ze hun HTML-structuur aan en pomp je allemaal rotzooi over in je Excel-sheet.
Bij XML is dat netjes gestructureerd.
 
Kan je niet beter de XML-data van GEDCOM "GEnealogy Data COMmunciation" halen.

De data is afkomstig van een gedcom-bestand, is ingelezen in een webbased stamboomprogramma. Een groot aantal persoons- of famlierecords moet worden samengevoegd (#1 met #3 en #2 met #4).
De gegevens zijn niet zo 1-2-3 uit de gedcom te lezen, maar worden door de stamboomapplicatie gegeven.

Hoe ik de XML-data moet uitlezen, weet ik niet...
 
Mijn excuses, ik vergis me in de vraagstelling: Hoe maak ik er een XML-bestand van?
 
De data is afkomstig van een gedcom-bestand
Open het gedcom-bestand eens met kladblok/notepad.
Ziet de eerste regel er zo uit
Code:
<?xml version="1.0" encoding="UTF-8"?>
Met scherpe haken aan het begin en het eind.
Grote kans dat het al een XML-bestand is.
 
Open het gedcom-bestand eens met kladblok/notepad.
Ziet de eerste regel er zo uit
Code:
<?xml version="1.0" encoding="UTF-8"?>
Met scherpe haken aan het begin en het eind.
Grote kans dat het al een XML-bestand is.

Het is een gedcom 5.5.1-bestand, geen gedcom-XML, dat is een ander dialect.
De vier variabelen die ik per record nodig heb, staan niet bij elkaar in één gedcom-record, die wordt echt gegenereerd door de webapplicatie (=stamboomprogramma).
 
Heb je een (geanonimiseerd) en compact voorbeeld van dat Gedcom bestand?
 
Status
Niet open voor verdere reacties.
Steun Ons

Nieuwste berichten

Terug
Bovenaan Onderaan