Patricia8091
Gebruiker
- Lid geworden
- 24 jun 2022
- Berichten
- 10
Ik heb een dataset bestaande uit: verschillende symptomen i.c.m. een uniek persoonsnummer(ID). 1 persoon heeft vrijwel altijd meerdere symptomen. Ik wil een analyse maken van de meest voorkomende combinatie van symptomen. Het gaat om een vrij grote dataset (ong. 25000 rijen) dus ik ben opzoek naar een handige manier om dit te kunnen onderzoeken, hopelijk met Excel.
In de bijlage een verkort voorbeeld van de data.
De data wordt geëxporteerd uit een systeem waardoor ieder symptoom van de persoon in een nieuwe rij staat. Niet elk persoon heeft het zelfde aantal symptomen.
Ik wil dus graag iets kunnen zeggen over welke symptomen het meest in combinatie voor komen, heeft iemand hiervoor een idee? Alvast bedankt voor het meedenken!
(De ID-nummers kunnen niet herleid worden, de data in voorbeeld bestand is fictief)
In de bijlage een verkort voorbeeld van de data.
De data wordt geëxporteerd uit een systeem waardoor ieder symptoom van de persoon in een nieuwe rij staat. Niet elk persoon heeft het zelfde aantal symptomen.
Ik wil dus graag iets kunnen zeggen over welke symptomen het meest in combinatie voor komen, heeft iemand hiervoor een idee? Alvast bedankt voor het meedenken!
(De ID-nummers kunnen niet herleid worden, de data in voorbeeld bestand is fictief)