• Privacywetgeving
    Het is bij Helpmij.nl niet toegestaan om persoonsgegevens in een voorbeeld te plaatsen. Alle voorbeelden die persoonsgegevens bevatten zullen zonder opgaaf van reden verwijderd worden. In de vraag zal specifiek vermeld moeten worden dat het om fictieve namen gaat.

Teksten vergelijken tussen 2 verschillende cellen met percentuele match?

Status
Niet open voor verdere reacties.
De Volgorde van woorden is bij mij ook niet relevant. Als ik weet hoeveel procent van de woorden overeenkomen (zonder de volgorde) is dat voor mij genoeg. Dat patroon tussen de teksten zoek ik daarna zelf wel maar dat heeft niet met de vergelijking te maken. Dus dan zou zoiets als hier boven toch wel kunnen werken of begrijp ik het nu niet:P
 
Met de huidige macro heeft de voorbeeld tekst een score van 25,4. Dat betekend dat 25 woorden of deelwoorden van 5 letters of meer voorkomen in kolom C in vergelijking met de zin in kolom A. Gezien er maar 27 relevante woorden in kolom C staan klinkt dat wel aardig hoog ;)
 
Dat is idd heel hoog, dat is ook precies het soort overeenkomst dat ik zoek, zeker als dat dan dus ook meteen in procenten uitgedrukt kan worden en er meerdere tegelijk ingevoerd kunnen worden. Maar hoe werkt dit dan, voer je de formule in in een bepaalde cel en de tekst in de formules? Sorry heb dit nog nooit eerder gedaan.

Bedankt voor je tijd!
 
De huidige macro selecteert de tekst met de hoogste score en plakt die achter kolom A. Er is dus 1 antwoord uit kolom C voor elke regel in kolom A.

wat ook kan (maar wel nog meer rekenkracht kost natuurlijk) is een top 10 maken van de hoogste scores voor elke regel in kolom A.

Wat de huidige macro doet (stap voor stap):

Voor elke regel in kolom A:
door elke regel in kolom C lopen
woord voor woord kijken of er overeenkomsten zijn en score toekennen
score opslaan en vergelijken met bekende scores
hoogste score achter de huidige regel A plakken en doorgaan met de volgende regel A

Als je een wat uitgebreider voorbeeld hebt (met bijvoorbeeld 10 regels, hoeft niet exotisch) en een idee van hoe je het wil hebben dan kan ik wel kijken of ik de huidige oplossing aan kan passen aan je wensen.
 
Als ik het dus goed begrijp pakt de macro de hoogste score van iedere zin, vandaar ook die 25,4 en niet een totaal score van de hele tekst? Want als ik gewoon kijk komen er geen 25 woorden van die 27 overeen. Ik zal nog een voorbeeld maken maar dan dus 10 tekstjes in kolom C zetten. Wat bedoel je dan met niet exotisch, want het voorbeeld dat ik gebruikte zijn 2 van de tekstjes waar het om gaat?
En waar voer je die macro dan bijvoorbeeld in zodat ik zelf ook is kan checken hoe het gaat?
Bedankt.
 
Ik bedoelde met niet exotisch: geen voorbeeld met 1000 regels ;) een klein voorbeeld waar makkelijk mee te werken is.
 
Oke , in de bijlage zit een voorbeeld met in kolom A, 1 tekst en in kolom C 11 teksten Bekijk bijlage excell met 10 voorbeelden.xlsx. Ik zou nou dus graag willen weten hoeveel procent van de woorden in bijvoorbeeld cel C2 overeenkomen met de woorden die in cel A2 staan en dit dan dus voor alle cellen in kolom C. Als ik er zo naar kijk is het percentage natuurlijk hoger als cel A1 meer woorden heeft dan de C cel omdat de kans dan veel groter is dat de woorden erin zitten. Is dit bijvoorbeeld te compenseren? Met als het percentage lager is, dat die een gemiddelde pakt misschien?

Zou het ook mogelijk zijn om de percentage te berekenen van bijvoorbeel C2 in C3, en C3 in C4, enz of kost dat teveel rekenkracht?

Ik hoor het graag ook als ik onmogelijke dingen vraag;) Bedankt!
 
ik ben toch benieud
moeten de dubble woorden uit C2 ook metellen voor het percentage of tel je die maar 1 keer (dan tellen ze (na een keer )ook niet meer mee bij het totaal aantal woorden uit C2)
en wat met de kleine woordjes?
en welke leestekens gebruik je in het document? Ik ken er best veel maan vast niet allemaal.
groet sylvester
 
Laatst bewerkt:
De dubbele woorden zouden denk ik dan 2 keer moeten tellen als ze er 2 keer in staan want ze kunnen ook 2 keer voorkomen in A2. De kleine woordjes worden door de formule weggelaten als ze minder dan 5 tekens waren dacht ik en dat is opzich prima. Welke leestekens ik gebruik of welke Wampier gebruikt, want ik gebruik geen bijzondere en die tellen verder ook niet mee in de berekening.
De leestekens die er in staan stonden al in die tekstjes.
groet
 
Ik zou zeggen dat ze dan nog wel mee moeten tellen met het aantal woorden omdat ze wel 2 keer in C2 staan ookal komen ze maar 1 keer overeen. Maar dat is van ondergeschikt belang:P
 
Bedankt! Dat is idd de kant die ik eventueel op zou willen. Vraagje als ik een van de tekstjes die ook in C kolom staat invoer in de A2 dan krijg ik geen 100% score hoe is dat mogelijk?

groetjes
 
dat betekend dat =PercentageHeleWoorden(A$2;C11;5) die 5 een nul wordt? Want ik heb er echt geen verstand van:P maar dan komt die nog niet altijd op 100% maar op bijvoorbeeld 96%.

bedankt
 
100% wil niet zeggen dat de teksten identiek zijn
maar dat alle woorden (van een specifike tekst) in een andere tekst voorkomen.
groet
 
Ohh oke, maar ik heb even naar de verbeterde versie gekeken, maar staan de macros daar wel aan? want als ik het stukje tekst in A2 vervang voor een ander stukje komt er in de procenten kolom #NAAM? of doe ik nu iet fout want bij die eerste kon ik wel zo de tekst veranderen.

Ps is het ook mogelijk om de andere teksten onderling te laten vergelijken of is dat een enorm ingewikkelde macro?

Alvast bedankt
 
Nee hoor, je hoeft alleen een iteratie te doen. Het is dan wel belangrijk om te bepalen hoe de uitslag er dan uit moet zien omdat je natuurlijk een flinke hoeveelheid uitslagen gaat krijgen.

Ik kan zelf momenteel niet naar de macro's van sylvester kijken, maar ik ben ook wel benieuwd ;)
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan