data / tabel van text

Status
Niet open voor verdere reacties.

evora

Gebruiker
Lid geworden
9 jun 2005
Berichten
31
Ik heb uit een catalogus een txt bestand van diverse titels gedownload. Nu wil ik eigenlijk een tabel ervan maken zodat ik een database heb van alle die titels en betreffende auteurs en jaar enz, enz. (zie bijlage)

Ik heb van een collega gehoord dat ik Microsoft Access moet voor gebruiken maar daarover heb ik geen verstand van, en ook niet van VBA. Kan iemand mij advies geven? En wat is het best manier om het te leren?
 

Bijlagen

  • RLK Bae.18-2-2014.txt
    62,7 KB · Weergaven: 26
Access is daar inderdaad prima voor geschikt maar veel moeilijker te leren dan Excel. Als je het met Access wilt doen zal je ook eerst een datamodel moet maken voor de betreffende informatie om de database netjes en genormaliseerd in te richten. In Excel is het wat eenvoudiger en kan je middels een stukje VBA die informatie in 1 tabblad inlezen en er dan een Userform op maken.

E.e.a. is afhankelijk van wat je uiteindelijk met die informatie wilt gaan doen. Als je dat nog wilt vertellen kan er beter geadviseerd worden. Wat Excel betreft kan ik dat wel voor je doen. Voor Access is Helpmij collega Octafish de aangewezen persoon om je daarin bij te staan. Wil je er zelf in Access mee aan de slag dan heeft hij een mooie Access cursus online gezet:
http://handleiding.helpmij.nl/
 
Laatst bewerkt:
Wat ik wil is een mogelijkheid van selectie op annotatie of editie. Deze velden zijn niet in een gewone catalogus geïndexeerd, dus daarmee kan ik geen selectie van maken. Echter staat hierin belangrijk informatie voor mijn werk.
Daarom wil ik graag een tabel van deze bestand hebben, van tekst naar data. In Excel is nog beter voor mij. Dat vind ik een fijne programma maar ik kan ook geen VBA.
Ik ben heel dankbaar als iemand mij helpt om het voor elkaar te krijgen. Tevens wil ik ook het leren. Dit soort dingen zal ik vaker tegen komen en dan kan ik zelf doen.
 
Als ik er vanavond tijd voor krijg zal ik een opzetje maken. Anders wordt het in het weekend.
 
Laatst bewerkt:
Met welk programma maak je dat tekstbestand? In Word is het niet gelijk goed in te lezen, en in Notepad++ gaat het iets beter, maar er zitten een hoop overbodige spaties in die gebruikt worden om items uit te lijnen. Dus zomaar inlezen is nog behoorlijk lastig. Met name het veld [Titel] is zo nauwelijks goed in te lezen. Is de output dus beter te krijgen? Of moet alles vanuit dit format gebeuren? Want dan moet je redelijk ingewikkeld gaan inlezen.
Overigens is dat inlezen in Excel dan wellicht nog iets simpeler te doen dan in Access, maar om er een beetje fatsoenlijke functionaliteit van te maken, moet er behoorlijk gesleuteld worden aan het bestand.
 
Ik ben er zover mee dat het bestand BIJNA zonder fouten wordt ingelezen in een Excel blad. Als dat klaar is kan er eenvoudig worden gefilterd en zou ik er ook een userform bij kunnen maken voor invullen nieuwe gegevens, bijwerken bestaande gegevens en of het verwijderen van gegevens.

Helaas heb ik een flinke lekkage gehad en moet ik eerst een nieuwe vloer leggen :(
 
Omdat ik 's avonds liever met andere dingen bezig ben dan het leggen van een vloer ben ik nog even voor je bezig geweest. Dit is het resultaat tot nu toe.

De VBA macro is inmiddels zover dat hij, voor zover ik kan zien, je voorbeeld bestand zonder fouten inleest. Het bestand bevat informatie over 76 boeken die per boek de volgende 23 verschillende informatiesoorten kan bevatten.
Code:
Titel
Auteurs
Medewerkers
Organisatie
Jaar
Nummering
Editie
Uitgever
Reeks
Annotatie
Annotatie editie
Omvang
Illustratie
Formaat
ISBN
ISSN
Nummer
GOO trefwoord
Library of Congress trefwoord
Onderwerp
Aanvraagnummer
Locatie
Aanwezig

Klopt het aantal boeken en de informatiesoorten?

Het document sluit ik alvast bij zodat je kunt zien wat het resultaat is. Omdat sommige informatiesoorten veel gegevens bevatten die ook nog over meerdere regels verdeeld kunnen zijn (Titel, Annotatie) die nu per informatiesoort in 1 cel zijn geplaatst, is het niet echt overzichtelijk. Daarvoor zou er dan een Userform bij moeten komen waarin je o.a. makkelijk kunt zoeken en dan per boek de informatie in 1 oogopslag kunt bekijken.

In het bijgevoegde document kun je al wel filteren per informatiesoort. Je kunt dan ook zien of de informatie correct is. Dubbelklik op een cel om de volledige inhoud van die cel in een berichtenschermpje te zien.
Bekijk bijlage RLK Bae.18-2-2014.xlsm
 
Laatst bewerkt:
Beste Edmoor,

Ik hoop dat je probleem van lekkage al opgelost is. En dat je al een mooie vloer hebt:)

Want dit is perfect voor mij. Heel erg dank!!
Hiermee kan ik al verder met mijn werk.

Ik heb ook bij de macro's de stuk VBA gezien. Kan ik deze script iedere keer gebruiken? Ik moet nog veel boeken "scannen"
 
Het kan allemaal nog wel wat fraaier, als je ook de accenttekens nog goed wilt inlezen. Deze procedure maakt van woorden als 'Syrië & Jordanië' een kleine puinhoop. Maar daar wil ik uiteraard pas (meer) tijd in steken als dat handig is. Bovendien zou ik alles in een database zetten, waarbij je de waarden ook gelijk splitst. Een veld met auteurs als Elżbieta Lisowscy; Andrzej Lisowscy moet natuurlijk gescheiden worden en dat wordt erg lastig in Excel. Dat zou ik toch echt in een database doen.
 
Hallo Evora,

Die macro kan wel telkens worden gebruikt maar zal de nieuwe gegevens niet aan de bestaande toevoegen maar deze overschrijven. Dat kan desgewenst nog wel worden aangepast. Naar de tekst heb ik verder niet gekeken. Ik heb me alleen met het inlezen bezig gehouden. Dat kan wat betreft de diakrieten zeker beter zoals Octafish zegt.
 
Laatst bewerkt:
Hallo Evora,

Nog even bezig geweest n.a.v. de terechte opmerking van Octafish.
Bij deze hetzelfde document met dezelfde macro maar dan met UTF-8 ondersteuning.
Hierdoor worden de diakritische tekens wel goed weergegeven.
Bekijk bijlage RLK Bae.18-2-2014.xlsm
 
Yep. Dat is de code die je nodig had :). Waar Google al niet goed voor is :)
 
En ik had er direct aan moeten denken omdat ik het al eerder heb gebruikt :eek:
Maar ik heb me zoals ik al zei, meer bezig gehouden met de structuur van dat bestand dan met de inhoud.
 
Laatst bewerkt:
Heel erg dank edmoor en OctaFish

Ik heb al uit deze bestand belangrijke informatie uitgehaald.

Zoals ik zei wil ik nog veel boeken scannen. Ik heb een nieuwe bestand in txt (notepad). Ik probeer de macro toe te passen in Excel maar iets gaat niet goed. Ik krijg een foutmelding Ik vrees dat ik nog veel moet leren :-(...

Tevens heb ik gezien dat ik ipv van UTF-8 kan ik formaat ISO-8859-1 downloaden. Is dit beter?
 
UTF-8 of ISO hangt een beetje van je output af. Ik zou zeggen: kijk welke het beste resultaat oplevert. Bij mij was UTF ook niet niet helemaal perfect, dus wellicht dat ISO beter is. Uitproberen dus! De reden dat je nieuwe bestand niet werkt, kunnen we zo natuurlijk niet zeggen. Moeten we het bestand zien.
 
Daarnaast is het altijd handig om, als je zegt een fout te krijgen, deze hier dan ook volledig te vermelden.
 
Status
Niet open voor verdere reacties.
Steun Ons

Nieuwste berichten

Terug
Bovenaan Onderaan