• Privacywetgeving
    Het is bij Helpmij.nl niet toegestaan om persoonsgegevens in een voorbeeld te plaatsen. Alle voorbeelden die persoonsgegevens bevatten zullen zonder opgaaf van reden verwijderd worden. In de vraag zal specifiek vermeld moeten worden dat het om fictieve namen gaat.

Duplicaten uit kolom verwijderen met behoud gegevens

Status
Niet open voor verdere reacties.

Nootgeval

Gebruiker
Lid geworden
16 mei 2014
Berichten
11
Hallo iedereen,

Ik zoek een formule (of macro) om duplicaten in kolom B te verwijderen maar de gegevens in kolom A die horen bij het duplicaat in kolom B, vanaf het eerste voorkomen, te plaatsen in de kolommen C en verder. Omdat het om een bestand gaat met enige duizenden rijen met honderden duplicaten is het onbegonnen werk iedere term apart in te voeren en de gegevens naast de eerst voorkomende in kolom C te zetten.

Het voorbeeldbestand:
In het bovenste deel "Duplicaten in groente en fruit, verschillende kleuren": kiwi's zijn er in de kleur geel en groen, paprika's in de kleuren geel, groen en rood etc. In kolom B komen kiwi's dus 2x voor, paprika's 3x etc.
Als ik duplicaten in kolom B verwijder, kan ik niet meer zien dat er ook groene kiwi's zijn, en groene en rode paprika's.

Waar ik naartoe wil is het onderste deel "Duplicaten verwijderd, kleuren behouden". Kiwi's zijn er dus in geel en groen; paprika's in geel, groen en rood etc..

Ik ben al bezig geweest met als, en aantal.als formules, maar ik kom er helaas niet uit.

Alvast bedankt voor de hulp!
 

Bijlagen

Hallo AlexCEL,

Bedankt voor je voorzet, het is hem helaas nog niet, maar dat kan ook aan mijn poging er een algemeen voorbeeld van te maken liggen. In het bovenste deel heb ik alleen de eerste twee kolommen. De andere lichtgrijze geven aan welke kleuren voorkomen, maar die zitten in werkelijkheid dus niet in mijn tabel.
Ik heb in je voorzet een stukje van het echte bestand genomen met pdf's in kolom B. Ik heb in het onderste deel nu cursief aangegeven wat de bedoeling is (kolom A en B bevatten zoals gezegd een paar duizend bestanden). In totaal heb ik nu in het overzicht 6 unieke pdf's in Kolom B, bestand 0002135role.pdf en 0001848.pdf komen 2x voor. De dubbelingen in kolom B zijn eruit, maar ik weet nog steeds welke termen voorkomen in het bestand (namelijk bij 0002135role.pdf: "afromen van baten" (kolom C)en "aankoop van grond" (kolom D); en voor 0001848.pdf "baat afromen" en "belastingheffing"). De pdf's zijn naar voren gekomen als resultaat van een zoekactie met de termen in kolom A in een database.

Aan de hand van het aantal kolommen met zoektermen kan ik vervolgens inschatten hoe relevant het de pdf is (hoe meer zoektermen een pdf scoort, hoe beter).

Alvast dank voor verdere hulp!
 

Bijlagen

Mogelijke oplossing in de bijlage. In het kort: kolom A en B omgedraaid, gesorteerd op alfabet en dan bepaald hoeveel zoektermen er zijn per PDF en deze weergegeven.

Bekijk bijlage Duplicaten 3.1.1.xlsx

Voldoet dit wellicht?
 
Zie macro in bijlage. Resultaten komen op blad2.
 

Bijlagen

AlexCEL en Warme bakkertje, bedankt, met jullie beider hulp is het gelukt.
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan