Hallo,
Ik ben bezig met een dataset waarbij ik het volgende probleem heb. Ik wil graag uitrekenen hoeveel verschillende bedrijven er gedurende ieder onderzoeksjaar staan vermeld. Normaal moet dit geen probleem zijn, maar het is in mijn geval zeer vaak het geval dat een bedrijf meerdere malen wordt vermeld gedurende een jaar. Dit wordt gekenmerkt door het betreffende bedrijf tweemaal als regels te vermelden met het zelfde jaartal.
Is er een bepaalde methode hoe ik vanuit een draaital unieke waarden kan filteren, per jaar? Ik heb als bijlage een voorbeeld bijgesloten. De gegeven draaitabel vermeldt bijvoorbeeld voor het jaar 1990, vier bedrijven. Echter, als men krijgt naar de bronlijst dan is te zien dat het slechts twee unieke waarden/bedrijven betreft.
Iemand die hiervoor een oplossing heeft? Mijn daadwerkelijke dataset is enorm groot, dus denk dat een draaitabel het makkelijkst werkt. Andere toepasbare ideeen zijn uiteraard welkom.
Alvast bedankt.
Ik ben bezig met een dataset waarbij ik het volgende probleem heb. Ik wil graag uitrekenen hoeveel verschillende bedrijven er gedurende ieder onderzoeksjaar staan vermeld. Normaal moet dit geen probleem zijn, maar het is in mijn geval zeer vaak het geval dat een bedrijf meerdere malen wordt vermeld gedurende een jaar. Dit wordt gekenmerkt door het betreffende bedrijf tweemaal als regels te vermelden met het zelfde jaartal.
Is er een bepaalde methode hoe ik vanuit een draaital unieke waarden kan filteren, per jaar? Ik heb als bijlage een voorbeeld bijgesloten. De gegeven draaitabel vermeldt bijvoorbeeld voor het jaar 1990, vier bedrijven. Echter, als men krijgt naar de bronlijst dan is te zien dat het slechts twee unieke waarden/bedrijven betreft.
Iemand die hiervoor een oplossing heeft? Mijn daadwerkelijke dataset is enorm groot, dus denk dat een draaitabel het makkelijkst werkt. Andere toepasbare ideeen zijn uiteraard welkom.
Alvast bedankt.