• Privacywetgeving
    Het is bij Helpmij.nl niet toegestaan om persoonsgegevens in een voorbeeld te plaatsen. Alle voorbeelden die persoonsgegevens bevatten zullen zonder opgaaf van reden verwijderd worden. In de vraag zal specifiek vermeld moeten worden dat het om fictieve namen gaat.

Hoe vergelijk ik tekstwaarden in kolommen in excel

Status
Niet open voor verdere reacties.

vrerom

Gebruiker
Lid geworden
17 dec 2016
Berichten
5
Ik wil in excel (2007) een vergelijk maken van tekstwaarden in kolommen. Ik besef dat het mogelijk is duplicaten te filteren, maar indien er maar een spatie verkeerd staat herkent excel de dubbele waarde(n) niet.
Is er een mogelijkheid in excel of een andere software om deze waarden in te stellen (bijv. 75%)? En zo ja, hoe?
 
Welkom bij Helpmij.nl

Ik heb je vraag maar verplaatst naar de excel sectie.
Daar heb je meer kans op antwoorden dan in de member chat.
 
Wat bedoel je met 75%
graag een voorbeeldbestandje in Excel en geen plaatjes
 
Voorbeeld kolommen

Plongske. Bedankt voor de reactie.

Kolom A is mijn eigen bestand. Kolom B is een bestand dat ik aangeboden krijg en de duplicaten er uit moet halen. Mits de schrijfwijze exact gelijk is geen probleem in excel.
Maar indien een spatie of punt anders staat of een letter weggelaten is herkent excel dit niet als duplicaat, terwijl dit wel het geval is.
Ergo, is er een mogelijkheid in excel (of met een andere software) om de herkenning in te stellen op bijv. 75% of 80%, zodat de (bijna) gelijke waarden wel aangeduid worden?
 

Bijlagen

Door 'probleemtekens' te vervangen door "" kan je een redelijk betrouwbare vergelijking maken.
 

Bijlagen

Deze kende ik nog niet. Dank.
Echter, in mijn voorbeeld staan de waarden in de kolommen naast elkaar.
Echter, in de praktijk is het probleem is dat de lengte van de kolommen niet gelijk zijn.
Bijv. kolom A kent 5.300 tekstwaarden en kolom B 4.300 tekstwaarden.
 
Als je weet wat de knelpunten zijn dan kan je een macro gebruiken om de lijsten te vergelijken.

Klik op de blauwe knop en je krijgt het resultaat in kolom E.
 

Bijlagen

Wegens andere activiteiten moest ik dit even laten lopen.
Ik heb de macro geprobeerd met twee lijsten van circa 5.500 titels elk (verdeeld over twee kolommen).
Het enige wat er gebeurt is een crash van excel.
Wellicht is de hoeveelheid hier debet aan?
 

Bijlagen

Mij lijkt eerder de kwaliteit van de nummers waarnaar verwezen wordt hieraan debet te zijn ;)
 
Ik heb bestand getest. Macro doet het prima. Wel effe geduld hebben.

Greetz/Excelbat
 
Sorry, het duurde inderdaad (heel) lang.
Echter, de doublerende liedjes laat hij inderdaad niet zien in kolom E, maar ik heb een aantal in kolom B er bij gezet met een kleine schrijffout (rood gearceerd onderaan de kolom) die ook in kolom A staan. Helaas herkent de makro ze niet als dubbele.
Is er een mogelijkheid om dit procentueel aan te passen (bijv. 75% gelijkwaardig), zodat ze wél als dubbel gezien worden?
 

Bijlagen

@Excelbat, bedankt voor het testen en dat het even duurt is denk ik wel logisch. Meer dan 9 miljoen mogelijke vergelijkingen waarvan het aantal nog een beetje gereduceerd wordt door het lusje te stoppen. Scheelt in het bestandje toch zo'n 500k aan lusjes.;)

Is er een mogelijkheid om dit procentueel aan te passen (bijv. 75% gelijkwaardig), zodat ze wél als dubbel gezien worden?

Nee, tenzij je een supercomputer hebt waarin je de ruim 9 miljoen vergelijkingen die je nu al hebt nog eens letter voor letter wilt vergelijken en daar een % aan wilt hangen. Met een snel rekensommetje kom ik tot zo'n 7,60694E+16 vergelijkingen.
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan