• Privacywetgeving
    Het is bij Helpmij.nl niet toegestaan om persoonsgegevens in een voorbeeld te plaatsen. Alle voorbeelden die persoonsgegevens bevatten zullen zonder opgaaf van reden verwijderd worden. In de vraag zal specifiek vermeld moeten worden dat het om fictieve namen gaat.

Kan Power Query zelf 2 verschillende bestanden vergelijken?

  • Onderwerp starter Onderwerp starter itje
  • Startdatum Startdatum
Status
Niet open voor verdere reacties.

itje

Gebruiker
Lid geworden
4 sep 2013
Berichten
15
Hallo,

Ik heb een Excel-bestand in .xlsx formaat van een leverancier die ik elke morgen download. Dit bestand bevat productwijzigingen zoals andere prijzen en levertijden.

Met de Power Query editor heb ik regels opgesteld zoals als er in kolom 1 dit staat dan moet er in kolom 2 dat komen staan etc.
Dit laat ik dus iedere dag los op het .xlsx bestand en vervolgens sla ik dit bestand op als een .csv-bestand en upload ik deze in onze webshops. Daarna zijn onze producten weer up-to-date met de juiste prijzen en levertijden.

Het probleem is nu dat dit .csv-bestand steeds groter wordt, er komen steeds meer producten bij en het verwerken van deze upload in de webshops duurt steeds langer en langer. Het kan zo een uur duren.

In het Excel-bestand van de leverancier staat niet welke producten daadwerkelijk een wijziging hebben gekregen, dus ik kan hier niet op filteren, zodat het .csv-bestand alleen gewijzigde producten bevat en daarmee korter wordt en het uploaden/werken dus sneller gaat.

Is er een snelle manier in de Power Query om dit te doen? Dus dat Power Query op de een of andere manier misschien het .xlsx bestand van vandaag dat deze ophaalt via een weblink bij de leverancier vergelijkt met het .csv-bestand dat ik gisteren heb opgeslagen en dan alleen de rijen die gewijzigd zijn door laat?
Dit zodat rijen met producten die geen wijziging hebben vergeleken met gisteren ook niet getoond worden?

Ik verneem het graag!
 
Ja dat kan hoor
 
Zoals JEC al aangaf, ja.
Maar een voorbeeld bestandje zegt meer als 1000 woorden.
Gelieve geen voorbeeldje te uploaden als foto.
 
Waarom plaats je dat document niet hier?
Die kan je gewoon vanuit de Verkenner in je bericht slepen.
Als hij verdwijnt waar hij nu staat klopt deze draad niet meer.
Daarnaast denk ik dat peter59 het betreffende xlsx bestand bedoelt.
 

Bijlagen

Ja, het is maar 1 bestandje met 1 tabblad dus is er geen vergelijking mogelijk.
 
Sorry, ik wist niet dat dat kon...
Hierbij dan het .xlsx bestand.
 

Bijlagen

Mooi, en waar moet dat bestandje mee vergeleken worden?
 
Met het 1e testbestandje zie het bericht van edmoor
 
Ik weet absoluut niet of je zoiets bedoelt maar ik heb toch maar een hele kleine poging ondernomen.
 

Bijlagen

Bedankt voor je poging!
Ik zie dat sheet 1 nu dubbele kolommen bevat.

Rijen 3-4-5-6-7 bevatten in de kolommen: Meta: in_stock en Meta: _in_stock_status andere gegevens dan Meta: in_stock.1 en Meta: _in_stock_status.1.
Dit is dus een voorbeeld van een verschil. Er kan ook een verschil zijn in de overige kolommen zoals de prijs.

Nu wil ik graag 1 bestand of sheet krijgen zonder de dubbele kolommen en met alleen die regels die van elkaar verschillen.
Rij 1 heeft geen verschillen dus moet deze rij moet niet getoond worden in het uiteindelijke bestand/sheet.
Rijen 3-4-5-6-7 hebben wel verschillen en die moeten wel getoond worden in het uiteindelijke bestand/sheet.
 
Nogmaals een poging gewaagd.
Ik hoop dat ik het nu beter heb begrepen.
Tabblad "Upload-Testfeed" is bedoelt om deze te uploaden naar de betreffende website.
Als dat niet zo is, tja, dan ben ik het spoor helemaal bijster.
 

Bijlagen

Nogmaals bedankt!
Maar tabblad "Upload-Testfeed" is hetzelfde als tabblad "Upload"...
Rij 1 bevat Aberdeen 3-seater - fabric Eden 20 graphite, met Levertijd? Mail of bel ons, deze rij is in alle bestanden hetzelfde en heeft geen verschillen/wijzigingen en deze mag dus niet in tabblad "Upload-Testfeed" zichtbaar zijn.

Daarnaast bevatten de kolommen: Meta: in_stock en Meta: _in_stock_status nu verschillende waardes. Dit mag niet.
Cel F2 moet hetzelfde bevatten als cel G2.
Cel F3 moet hetzelfde bevatten als cel G3.
Cel F4 moet hetzelfde bevatten als cel G4.
Etc.
 
Laatst bewerkt:
Rij 1 heeft geen verschillen dus moet deze rij moet niet getoond worden in het uiteindelijke bestand/sheet.
Rijen 3-4-5-6-7 hebben wel verschillen en die moeten wel getoond worden in het uiteindelijke bestand/sheet.
Daarnaast bevatten de kolommen: Meta: in_stock en Meta: _in_stock_status nu verschillende waardes. Dit mag niet.
Cel F2 moet hetzelfde bevatten als cel G2.
Cel F3 moet hetzelfde bevatten als cel G3.
Cel F4 moet hetzelfde bevatten als cel G4.
Etc.
Ik kan het nu helemaal niet meer volgen. Eerst schrijf je dat de verschillen wel getoond moeten worden, en vervolgens weer niet.
Voor jou is alles natuurlijk helder, aangezien je dagelijks met deze voor jou bekende materie bezig bent, maar voor de helpers, voor mij in elk geval, niet.
Graag dus nog wat meer informatie met bijvoorbeeld een bestandje zoals je het wilt zien dus met de verschillen.
 
Sorry voor mijn onduidelijk!
Ik heb je testfeed v2 (PV) aangepast, ook de tabbladnamen.

Tabblad:
xlsx originele feed = van vandaag is de feed zoals ik hem download van de leverancier.

.csv feed van gisteren = nadat ik gisteren de xlsx originele feed bewerkt heb met Power Query en heb op geslagen heb als .csv en gisteren heb geüpload in de webwinkels.

Feed van vandaag voor upload = de lijst met alleen de producten/rijen die een wijziging hebben gehad en die ik kan exporten naar .csv en vandaag kan uploaden in de webwinkels.
Dit is hoe het eruit moet komen te zien.

Nogmaals sorry voor mijn onduidelijk!
 

Bijlagen

Kijk eens of deze nu voldoet?
In de query's wordt er met datums gewerkt.
Bestudeer deze eens.
 

Bijlagen

Oke, nu moest ik deze nog aanpassen voor de complete lijst met producten van de leverancier en dan loop ik toch weer vast. Waarschijnlijk heb ik wat verkeerd gedaan. Maar we zijn er bijna, bedankt voor je geduld!

Ik heb je bestand weer aangepast.
Alleen de 1e 25 rijen/producten in tabblad: CSV gisteren verschillen van tabblad: XLSX Vandaag.
In tabblad: Feed van vandaag voor upload, staan nu die correcte 25 rijen in het rood aangegeven.
Maar alle overige producten die in de CSV gisteren en XLSX Vandaag, precies hetzelfde zijn, staan nog vermeld in Feed van vandaag. In het zwart aangegeven. Omdat deze niet gewijzigd zijn, moeten ze ook niet getoond worden in Feed van vandaag.
 

Bijlagen

Dit komt in de buurt, denk ik.
Ik heb je bijlage "Tower Living Feed gisteren" gekopieerd en als waarden in tabblad van mijn bijlage ".csv van gisteren" als waarden geplakt.
Dit ook zo voor "1. Tower Living zonder banken-Feed Power Query" naar tabblad "xlsx origineel van vandaag".
 

Bijlagen

Je 'Feed van vandaag voor upload' heeft meer dan 25 producten en dit klopt niet want de rest van de producten zijn niet gewijzigd.
Plus ik moet het werkzaam krijgen met mijn laatste bestandje 'Testfeed v3 (PV) aangepast' aangezien daar al mijn normale Query instellingen al in zitten met de feed de leverancier.
Ik weet niet hoe ik je huidige instellingen anders moet overzetten in mijn bestandje.
 
Tja, en ik weet niet waar ik deze moet in passen in jou query's.
Voor mij houd het helaas hierbij op, sorry.

1727452368614.png
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan