• Privacywetgeving
    Het is bij Helpmij.nl niet toegestaan om persoonsgegevens in een voorbeeld te plaatsen. Alle voorbeelden die persoonsgegevens bevatten zullen zonder opgaaf van reden verwijderd worden. In de vraag zal specifiek vermeld moeten worden dat het om fictieve namen gaat.

Dubbele namen filteren

Status
Niet open voor verdere reacties.

marcp

Gebruiker
Lid geworden
28 aug 2008
Berichten
16
Ik heb in excel een lijst van 4000 clienten, waarvan er een heleboel dubbel staan.
Er staan dus eigenlijk maar maximaal 3000 verschillende clienten in.

Dit probleem is gekomen omdat dit eerst niet digitaal was en alles op papier stond, dit werd gedigitaliseerd en als iemand "zijn" client niet snel genoeg kon vinden voerde hij de client nogmaals in. Er kwam zo dus een niet werkbare situatie met veel dubbele clienten.

Voorbeeld:
Cel 100: Aalst, TH.HM. van der
Cel 230: Aalst, THHM van der
Cel 231: Aalst, T.H.H.M van der

Mijn vraag aan jullie is dus hoe kan ik in excel de verschillende clienten sorteren dat de dubbele clienten eruitgegooit kunnen worden. De sorteerfunctie van excel werkt namelijk alleen maar als de namen identiek zijn wat niet altijd het geval is.
 
Ik heb in excel een lijst van 4000 clienten, waarvan er een heleboel dubbel staan.
Er staan dus eigenlijk maar maximaal 3000 verschillende clienten in.

Dit probleem is gekomen omdat dit eerst niet digitaal was en alles op papier stond, dit werd gedigitaliseerd en als iemand "zijn" client niet snel genoeg kon vinden voerde hij de client nogmaals in. Er kwam zo dus een niet werkbare situatie met veel dubbele clienten.

Voorbeeld:
Cel 100: Aalst, TH.HM. van der
Cel 230: Aalst, THHM van der
Cel 231: Aalst, T.H.H.M van der

Mijn vraag aan jullie is dus hoe kan ik in excel de verschillende clienten sorteren dat de dubbele clienten eruitgegooit kunnen worden. De sorteerfunctie van excel werkt namelijk alleen maar als de namen identiek zijn wat niet altijd het geval is.

Als het zo is dat er alleen extra 'punten' voorkomen in de dubbele namen dan zou ik het volgende doen.
In de hele kolom de 'punt' door niets vervangen. Dan heb je dezelfde namen. Sorteren en de dubbele er met de hand uitgooien.

Succes
Wim
 
Je zou een kolom bij kunnen maken waarin je de formule =(deel) gebruikt.
Je zegt dan eigenlijk tegen die cel dat hij een deel moet laten zien van de oorspronkelijke cel, waarbij je aangeeft bij welke karakter hij moet beginnen en hoeveel karakters hij moet laten zien, vervolgens kun je hier op sorteren.
In jou voorbeeld dus =DEEL(A1;1;5)
Dit houdt in dat hij van Cel A1 het eerste t/m het 5e karakter laat zien.

gr.
Jac
 
Bedankt voor de reacties. Ik heb al een heleboel namen kunnen filteren met de sorteerfunctie van excel.

Maar bij sommige clienten staan de voorletters voor de achternaam en bij andere clienten staan de voorletters weer achter de achternaam, dit is dus best lastig te filteren.

Ik ga nu een kolom erbij maken met de formule (deel). Hopen dat ik er hier nog meer mee kan filteren.

gr marc
 
Beste marcp ;)

Heb een bestandje gemaakt met daarin een voorbeeldje dat je aanhaalde.

- Eerst de punten verwijderen in de tekst door formule (D2)
- Kolom D selecteren kopiëren en speciaal plakken en waarden aanvinken en OK. (F2)
- Zorg ervoor dat er boven de namen een veldnaam staat.
- Zet een uitgebreide filter op kolom F en vink unieke records aan.
- deze lijst kan je dan kopiëren en op een ander tabblad plaatsen.

Groetjes Danny. :thumb:
 

Bijlagen

Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan