• Privacywetgeving
    Het is bij Helpmij.nl niet toegestaan om persoonsgegevens in een voorbeeld te plaatsen. Alle voorbeelden die persoonsgegevens bevatten zullen zonder opgaaf van reden verwijderd worden. In de vraag zal specifiek vermeld moeten worden dat het om fictieve namen gaat.

Scrapen/ ' schrapen' van data van een website met behulp van Excel

Status
Niet open voor verdere reacties.

ExcelGreenie

Gebruiker
Lid geworden
6 jun 2015
Berichten
24
Hallo,

Ik hou weleens statistieken en artikelen bij van sommige websites en dit doe ik handmatig. Omdat dit tijdrovend is heb ik gezocht naar alternatieve methoden. Het schijnt dat dit met Excel mogelijk is, maar ik zou niet weten hoe ik dat zou moeten doen. De tekst/cijfers die ik nodig heb staan altijd op dezelfde plek op de websites. De gegevens staan soms wel op verschillende urls ( bijvoorbeeld http://www.nu.nl/beurs, http://www.nu.nl/beurs/pagina2, http://www.nu.nl/beurs/pagina3 etc.) Mijn streven is nu om dmv een lijstje met urls/links de benodigde gegevens te onttrekken

Iemand een idee hoe ik dat kan doen? Een macro zou nog makkelijker zijn...

Bedankt alvast

ExcelGreenie
 
Laatst bewerkt:
Heeft nu.nl geen api waarin deze gegevens verstrekt worden.

Je kan namelijk via de Google API een afstand of route beschrijving maken in excl. Misschien heb wat aan het bestand in de bijlage.Bekijk bijlage 264039


Hallo Johannus,

bedankt voor het antwoord alleen weet ik niet echt wat ik ermee moet.. ( ik zie een onkostendeclaratie )

Het gaat niet alleen om nu.nl trouwens. Het gaat om meerdere websites waarvan ik soms wat wil scrapen. Ik zou dus graag het principe onder controle willen krijgen of via een macro die ik voortaan daarvoor kan gebruiken
 
Kijk eens naar het tabblad data/ webquery.
 
Op het icoon klikken ?


Hallo snb,

Ik snap hoe het werkt, maar ik heb alleen de mogelijkheid om slechts bepaalde delen te kopieren ( dmv de gele pijltjes) , maar juist net niet de delen die ik nodig heb. Hoe kopieer ik de delen die ik juist nodig heb?
 
Welke statistieken, welke artikelen.
Webscrapen is de moeilijke manier, veel (beurs) gegevens zijn op makkelijkere manieren te verkrijgen, zoals een online xml of json data-dump.
Waar denk jij dat nu.nl de gegevens vandaan haalt?
 
Laatst bewerkt:
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan