• Privacywetgeving
    Het is bij Helpmij.nl niet toegestaan om persoonsgegevens in een voorbeeld te plaatsen. Alle voorbeelden die persoonsgegevens bevatten zullen zonder opgaaf van reden verwijderd worden. In de vraag zal specifiek vermeld moeten worden dat het om fictieve namen gaat.

Hele nieuwsartikelen in Power Query weergeven

Status
Niet open voor verdere reacties.

Sanglan

Gebruiker
Lid geworden
28 okt 2018
Berichten
15
Hallo,

Ik wil graag een groot aantal nieuwsartikelen in een excelsheet importeren, waarbij de hoofdtekst zelf in een enkele cel terecht komt, en verder wat algemene gegevens zoals datum, naam krant, etc., maar loop tegen problemen op bij de Power Query. Ik kan geen manier vinden waarop alle gegevens van een artikel netjes naast elkaar weergegeven worden.

Het zijn word-bestanden, met bovenaan een aantal gegevens over het artikel, en dan onder "body" het artikel zelf. Soms staan er nog andere onderdelen onder het artikel, maar die heb ik verder niet nodig.

Wat ik tot nu toe geprobeerd heb: met een word-VBA alle line-breaks onder "body" verwijderen, en alle linebreaks erboven vervangen door een ; Dan alle andere tekens verwijderen waardoor de power query anders misloopt (, :) en opslaan als .txt bestand.
--> dit zou ik dan op de hele map toe willen passen, wat me eigenlijk ook al niet gelukt is.

Als ik dit handmatig bij een enkel txt-bestand doe, kom ik op iets dat ik zelf met Power Query kan verwerkten tot het gewenste resultaat, maar mijn VBA-skills zijn zo laag dat ik verschillende onderdelen niet geautomatiseerd krijg (map selecteren, alleen na "body" linebreaks verwijderen, opslaan als txt).

Ik ben heel benieuwd of ik hele andere opties over het hoofd zie.

Ik heb één van de nieuwsartikelen toegevoegd, en de anderen hebben exact dezelfde indeling.

Hartelijk dank voor de hulp!
 

Bijlagen

  • China houdt EU graag te vriend, maar heeft daar niet veel voor over(2).docx
    23,2 KB · Weergaven: 22
Hoi,
Je voegt een word bestand bij, dat is mooi.
Maar een voorbeeld bestand van excel zit er niet bij.
Dat is wel een voorwaarde voor de helpers.
 
Dank voor de reacties! Ik begrijp dat ik met mijn vraag net tussen twee forums in zit, wat niet helemaal handig is. Ik ben inmiddels zo ver dat ik met slecht in elkaar geknutselfde macro's en op zijn minst een heel beperkt aantal muisklikken, de wordbestanden heb teruggebracht tot grotendeels bruikbare .txt-bestanden. Dus inmiddels gaat mijn vraag echt alleen nog over excel:

Met power query importeer ik de txt-bestanden, met een zelfgekozen delimiter die ik (met die word-macro) op de juiste plek krijg. Maar nu blijkt toch dat er kleine variaties zijn in de structuur van de oorspronkelijke bestanden. Soms staat er bijvoorbeeld een 'byline' en soms een 'highlight', maar niet altijd.

Nu is het denk ik een voordeel dat die categorieen letterlijk opgenomen zijn in de tekst. Dus de 'body' begint met het woord 'body'. Is het bijvoorbeeld mogelijk om in power query data te sorteren gebaseerd op de eerste paar characters in die cell? Dus als de tekst in de cell begint met "body" dat het dan automatisch terecht komt in de kolom genaamd "body"?

Ik heb het excelbestand bijgevoegd, weet niet of de power query automatisch meegaat, dus heb ook een printscreen daarvan bijgevoegd.

Verder ben ik nog steeds benieuwd of ik niet veel te omslachtig bezig ben geweest, en er een mogelijkheid is om redelijk strak gestructureerde word-bestanden makkelijker in excel te krijgen.
 

Bijlagen

  • powerquery.PNG
    powerquery.PNG
    57,6 KB · Weergaven: 40
  • Trouw.xlsx
    219 KB · Weergaven: 11
Je kunt een voorwaardelijke kolom toevoegen die alleen een waarde overneemt als de inhoud van een kolom begint met "body".
 
Status
Niet open voor verdere reacties.
Steun Ons

Nieuwste berichten

Terug
Bovenaan Onderaan