• Privacywetgeving
    Het is bij Helpmij.nl niet toegestaan om persoonsgegevens in een voorbeeld te plaatsen. Alle voorbeelden die persoonsgegevens bevatten zullen zonder opgaaf van reden verwijderd worden. In de vraag zal specifiek vermeld moeten worden dat het om fictieve namen gaat.

Tellen hoeveel keer elk woord voorkomt in een tekst

Status
Niet open voor verdere reacties.

Jeroen1000

Gebruiker
Lid geworden
15 jan 2008
Berichten
40
Ik probeer de woordfrequentie te tellen van een tekst in Excel maar eerlijk gezegd weet ik niet goed hoe en wat ik hiervoor moet doen.

Dit is al een eind op de goede weg: AANTAL.ALS(A1:A13;"a"). Hierbij moet ik jammer genoeg zelf nog het woord ingeven en bovendien werkt het niet als er 2x hetzelfde woord in een cel staat.

Alle tips zijn welkom!
 
Jeroen1000, Je kan in deze functie ook gebruik maken van een celverwijzing.
Code:
AANTAL.ALS(A1:A13;B1)
Stel dat je in cel B1 het woord 'Jeroen' opgeeft dan wordt er netjes gezocht.

Groet, Leo
 
Jeroen1000, Je kan in deze functie ook gebruik maken van een celverwijzing.
Code:
AANTAL.ALS(A1:A13;B1)
Stel dat je in cel B1 het woord 'Jeroen' opgeeft dan wordt er netjes gezocht.

Groet, Leo

Hallo Leo, bedankt voor je reactie. Maar het zou moeten kunnen zonder een woord op te geven. Het is een Excel file met zinnen en de frequentie van elk woord moet getelt worden. In een programmeertaal zou dit erg simpel te realiseren zijn, maar jammer genoeg moet het met Excel:confused:

Hier een linkje naar het bestand. http://rapidshare.com/files/85757055/voorbeeld.xls.html

Het eerste woord van de eerste zin is 'Here'. Dat woord zou ik graag (automatisch) naar B1 willen kopieren, en in C1 komt dan een getal(namelijk hoeveel keer er hier staat in alle zinnen samen. Een onmogelijk opgave in Excel lijkt me. Ik raak er helemaal niet uit.
 
Laatst bewerkt:
Jeroen1000, Dus als ik je goed begrijp wil je eigenlijk een lijst met alle unieke woorden die voorkomen in het 'boek' om deze daarna te tellen?
Dat lijkt me inderdaad een programmeeropgave!
Mag ik vragen waarom je het aantal van elk uniek woord wilt weten?

Groet, Leo
 
Jeroen1000, Dus als ik je goed begrijp wil je eigenlijk een lijst met alle unieke woorden die voorkomen in het 'boek' om deze daarna te tellen?
Dat lijkt me inderdaad een programmeeropgave!
Mag ik vragen waarom je het aantal van elk uniek woord wilt weten?

Groet, Leo

Om te gebruiken in een statistische formule i.v.m taalonderzoek (frequentieverdeling) en als
aanzet tot een taalcorpus.

Ik vrees er ook voor dat dit niet binnen de mogelijkheden van Excel ligt maar tergelijkertijd realiseer ik me ook dat mijn Excel kennis eerder matig is:-).

En idd, mijn doel heb je prima begrepen!
 
Je zal dan elk elk woord uit die cellen halen, dan kan in VBA via de split functie.
De eenvoudigste manier om dan verder te gaan is gewoon een draaitabel gebruiken, die kan filtert naar unieke waarden, en kan het aantal tellen.
Wil je het moeilijke maken kan je ze in een collectie gooien binnen VBA, en dan een aantal.als formule gebruiken.
 
Je zal dan elk elk woord uit die cellen halen, dan kan in VBA via de split functie.
De eenvoudigste manier om dan verder te gaan is gewoon een draaitabel gebruiken, die kan filtert naar unieke waarden, en kan het aantal tellen.
Wil je het moeilijke maken kan je ze in een collectie gooien binnen VBA, en dan een aantal.als formule gebruiken.

Dit alles heb ik al eens gedaan, en er zelfs een hele pagina tekst over geschreven op mijn site. Zie http://www.wimgielis.be, dan naar Excel, dan VBA-code, dan "Collectie & array".

Helemaal onderaan op die pagina schrijf ik:

Het spreekt voor zich dat de SOM-functie ook eender welke andere functie kan zijn.

Dat zal jij moeten doen en klaar is kees.

Wigi
 
Nou Wim... Da's leuk! Zit ik me daar een groot deel van m'n avond te zweten op dit stuk code, kom jij ff om de hoek zeilen met een oplossing... :D:D:D:thumb:

Maar goed, om niet al te teleurgesteld te raken zal ik het workbook toch plaatsen (tenminste... als de moderators zo vriendelijk willen zijn om mijn bestandje hierbij te plakken. 't Is namelijk iets groter dan de maximale 100kb :confused::o)
Het bestaat uit 4 sheets
  1. dit zijn de orginele regels van de TS
  2. hier heb ik via een macro alle 'overige leestekens' verwijderd (het woord 'hallo,' is wat anders dan 'hallo' (dus zonder komma))
  3. hier heb ik de regels uit blad 2 via een macro en een array op unieke woorden gesplitst en daar ook een countif bij gedaan. Let wel op de opmerking!!!
  4. als laatste voor het idee van Finch. Alle woorden uit 1 regel zijn uitgesplitst per cel

Groet, Leo
 
Wow jullie zijn echt super! Omdat ik niet vertrouwd ben met de Syntax van VBA heb ik dit vannacht geprogrammeerd in PERL.

Ik ga jullie code eens aandachtig bestuderen want eigelijk wil ik dit ook wel kunnen:o

Omdat hier zo'n goede sfeer heerst zal ik mijzelf ook is nuttig maken met het helpen van anderen:-)
 
@Huijb, dank voor je (mail)antwoord.

@Jeroen1000, Je programmeert in 'PERL'? Wat is dat voor taal? Is je vraag hiermee trouwens afgesloten?

@Iedereen, Het was dus helaas niet mogelijk om het workbook in 1 geheel te plaatsen. In de plaats daarvan heb ik maar per sheet een workbook gemaakt (kan óók natuurlijk...:rolleyes:). Hierbij dus mijn beloofde oplossing(en).

Groet, Leo

Inhoud van de 4 bestanden zei:
  1. dit zijn de orginele regels van de TS
  2. hier heb ik via een macro alle 'overige leestekens' verwijderd (het woord 'hallo,' is wat anders dan 'hallo' (dus zonder komma))
  3. hier heb ik de regels uit blad 2 via een macro en een array op unieke woorden gesplitst en daar ook een countif bij gedaan. Let wel op de opmerking!!!
  4. als laatste voor het idee van Finch. Alle woorden uit 1 regel zijn uitgesplitst per cel
 

Bijlagen

Laatst bewerkt:
@Huijb, dank voor je (mail)antwoord.

@Jeroen1000, Je programmeert in 'PERL'? Wat is dat voor taal? Is je vraag hiermee trouwens afgesloten?

@Iedereen, Het was dus helaas niet mogelijk om het workbook in 1 geheel te plaatsen. In de plaats daarvan heb ik maar per sheet een workbook gemaakt (kan óók natuurlijk...:rolleyes:). Hierbij dus mijn beloofde oplossing(en).

Groet, Leo

'PERL' en 'PYTHON' gebruik ik voornamelijk voor tekstinvoer te manipuleren. Je hebt er ook dingen zoals arrays en functies hashmaps met alle toeters en bellen. Het wordt ook veel gebruik voor admin. taken enzovoorts. Het is niet zo geadvanceerd als Java maar daar ben ik net blij om:-). Het beste eraan vind ik het CPAN archief: Duizenden modules voor PERL die je gwn kan gebruiken voor het leven makkerlijker te maken (de schrikeljaar module heeft me al eens wat tijd bespaart) Al hebben ze nu object oriented PERL ook:rolleyes:

Redelijk makkelijk om op je eentje te leren als je af en toe een vraag kan stellen. Je kan PERL trouwens een Excel sheet laten generen:D.

M'n vraag is meer dan opgelost:thumb: maar men baas heeft besloten wat extra werk te verzinnen dus ben ik niet meer aan Excel toegekomen :(
 
Jeroen1000, Dank voor je uitleg. Ik zal 'ns wat extra info gaan zoeken op internet. Zou je deze topic nog op op gelost willen zetten (knop rechts onderin).

Groet, Leo
 
Jeroen1000, Dank voor je uitleg. Ik zal 'ns wat extra info gaan zoeken op internet. Zou je deze topic nog op op gelost willen zetten (knop rechts onderin).

Groet, Leo

Je mag met altijd PM'n met vragen:-). Je hulpt wordt erg geapprecieerd!
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan