Access relaties tussen meerdere datasets

Status
Niet open voor verdere reacties.

Question123

Nieuwe gebruiker
Lid geworden
5 mei 2017
Berichten
2
Beste mensen,

Alvorens ik mijn vraag stel een korte toelichting over mijn dataset, zodat het begrijpbaar is wat ik wil bereiken met de functie 'relaties' in access. Het bestand "Pat_76" bevat een enorme hoeveelheid informatie over patenten van bedrijven. Ik moet het dus filteren voor een lijst van bedrijven uit mijn eigen onderzoek. Voor mij van belang zijn: appyear(jaar van aangifte), patent nummer en pdpass. Nu wil ik een link leggen tussen de patenten in de grote database met een X aantal bedrijven uit mijn sample. De centrale vraag is dus: hoeveel patenten heeft bedrijf A in jaar X aangevraagd?

Om mijn kernvraag te beantwoorden moet ik een pivot table maken met de volgende waarden: appyear, pdpco (identificatie nummer voor een bedrijf) en patent counts als in waarden die geteld moeten worden. Nu is het zo dat ik allereerst relaties moet leggen tussen deze variabelen, maar ik heb geen enkel idee hoe ik dit moet doen. Ik heb meerdere dingen geprobeerd, maar ik loop telkens vast.

Een bedrijf wordt in Pat_76 geïdentificeerd a.d.v. een ''pdpass". Dus elk patent is gelinkt aan een pdpass. Echter, nu is het zo dat een bedrijf meerdere pdpasses kan hebben. De pdpass is om die reden weer gelinkt aan een ''pdpco''. Aan de hand van dit nummer kan ik een bedrijf herkennen. Deze is wel slechts één enkele waarde. Bijvoorbeeld: De pdpco van bedrijf A is 123456 en pdpasses 1234 en 5678. In het kort: patenten -> pdpass (een of meer) -> pdpco (één).

Met andere woorden: ik wil dus uit een grote dataset (pat_76) waarin patenten en pdpass codes staan vermeld alleen degenen eruit halen van de bedrijven uit mijn sample. Ik heb enkel het aantal patenten nodig.

Mijn vraag is dus: hoe zorg ik er op een juiste manier er voor dat relaties worden gelegd in dit model? Het probleem is dus dat het grote bestand enorm veel waardes heeft en het aantal bedrijven dat ik heb slechts 190 is. Bijgevoegd enkele screenshots om mijn dataset te weergeven en de relaties die ik heb geprobeerd.


Alvast bedankt!
 

Bijlagen

  • pdpco bedrijven.png
    pdpco bedrijven.png
    15,4 KB · Weergaven: 43
  • pat_76.png
    pat_76.png
    44,7 KB · Weergaven: 46
  • relaties.png
    relaties.png
    37,3 KB · Weergaven: 49
Ik snap weinig van je plaatjes, want volgens mij zijn ze onvolledig. Je bent ook niet helemaal duidelijk over waar je de info vandaan haalt, en wat er nu precies in de verschillende tabellen staat. In beginsel is je vraag vrij simpel op te lossen, als je een tabel hebt met de juiste gegevens.
[Pat_76] is een (externe) tabel? en daarin staan dan de Bedrijfscode ([pdpco]), de Aanvraagdatum ([appyear]) en het Patentnummer ([pdpco])?
Dan is je kruistabel inderdaad heel simpel: gebruik [pdpco] als Rijveld, [appyear] als kolomveld en [pdpco] twee keer: eenmaal als Waardeveld met de functie Aantal, en eenmaal als Rijveld met de functie Aantal om het totaal aantal patenten per bedrijf (per jaar opgeteld dus) te zien.
Dan zie je dus een kruistabel met alle bedrijven. Dat wil je niet: je hebt een eigen selectie gemaakt en die staat zo te zien in de tabel [pdpco sample]. Om nu de kruistabel te filteren op jouw selectie, hoef je alleen maar de Sample tabel toe te voegen aan het query raster, en de tabel [pdpco sample] te linken aan de tabel [Pat_76]. Dat doe je uiteraard op het koppelveld [pdpco]. Hiermee heb je de complete tabel teruggebracht tot een tabel waarin alleen die bedrijven voorkomen die in jouw sample tabel zitten.
 
Ik snap weinig van je plaatjes, want volgens mij zijn ze onvolledig. Je bent ook niet helemaal duidelijk over waar je de info vandaan haalt, en wat er nu precies in de verschillende tabellen staat. In beginsel is je vraag vrij simpel op te lossen, als je een tabel hebt met de juiste gegevens.
[Pat_76] is een (externe) tabel? en daarin staan dan de Bedrijfscode ([pdpco]), de Aanvraagdatum ([appyear]) en het Patentnummer ([pdpco])?
Dan is je kruistabel inderdaad heel simpel: gebruik [pdpco] als Rijveld, [appyear] als kolomveld en [pdpco] twee keer: eenmaal als Waardeveld met de functie Aantal, en eenmaal als Rijveld met de functie Aantal om het totaal aantal patenten per bedrijf (per jaar opgeteld dus) te zien.
Dan zie je dus een kruistabel met alle bedrijven. Dat wil je niet: je hebt een eigen selectie gemaakt en die staat zo te zien in de tabel [pdpco sample]. Om nu de kruistabel te filteren op jouw selectie, hoef je alleen maar de Sample tabel toe te voegen aan het query raster, en de tabel [pdpco sample] te linken aan de tabel [Pat_76]. Dat doe je uiteraard op het koppelveld [pdpco]. Hiermee heb je de complete tabel teruggebracht tot een tabel waarin alleen die bedrijven voorkomen die in jouw sample tabel zitten.

Pat_76 is inderdaad één grote externe database. De patenten in de database is niet gekoppeld aan een ''pdpco'', maar aan een ''pdpass". Dus één bedrijf kan meerdere pdpasses hebben. Daarom heb ik een apart excel gemaakt van alle "pdpass" van en "pdpco" variabelen uit mijn desbetreffende sample.

Het probleem zit dus hier: een patent is in de Pat_76 database gelinked aan een pdpass en een pdpass op zijn beurt is gelinked aan een pdpco (daarmee is dus een bedrijf te identificeren), maar één bedrijf kan meerdere ''pdpass'' waardes hebben.

Voorbeeld:
Bedrijfsnaam: ABBOTT LABORATORIES
PDPCO: 1078
PDPASS: 10334594
10652336
11412252
12855856



Om die reden kan ik dus niet simpel alleen de database filteren op mijn pdpco waarden, maar moet ik dus alle pdpco waarden ''koppelen'' aan de desbetreffende pdpasses? Daarom neem ik aan dat ik allereerst dmv ''relaties'' in access dit moet doen. Maar dit lukt mij niet. Pas als ik de relaties gelegd heb, kan ik dus de draaitabellen uitdraaien voor het aantal patenten per bedrijf.

Ik hoop dat mijn vraag zo duidelijker is, want ik kom er nog steeds niet uit. Alle hulp wordt gewaardeerd!
 
Omdat het zonder db er lastig is om te zien wat er allemaal aan tabellen te koppelen is, blijft het een lastige vraag om te beantwoorden. Een certificaat dat is gekoppeld aan een PDPASS kun je namelijk prima uitdraaien op basis van de koppeltabel waarin de PDPCO is gekoppeld aan de PDPASS. Dus ik zie nog steeds het probleem niet.
Relaties spelen overigens in het hele verhaal geen enkele rol. Die zorgen er alleen maar voor dat je geen ongeldige records toe kan voegen.
 
Status
Niet open voor verdere reacties.
Steun Ons

Nieuwste berichten

Terug
Bovenaan Onderaan