Gegevens opvragen uit een site via Java

Status
Niet open voor verdere reacties.

fuchsia

Nieuwe gebruiker
Lid geworden
18 aug 2011
Berichten
4
Beste,

Ik probeer gegevens op te vragen uit google en kan voorlopig alleen nog maar (een beetje) programmeren in java. Ik wou nu eenvoudige gegevens opvragen,vb: Ik typ in google ' groene appel ', nu zou ik graag het aantal hits die deze opzoeking in google geeft terugkrijgen.. (op dit moment is dit blijkbaar 1 460 000)
Kan er iemand mij helpen dit te verwezenlijken?

Een vriend van mij heeft het geprobeerd met java, maar kreeg de verkeerde waarden terug..

Een andere vriend van mij wou het via php programmeren, maar hij kreeg ook de verkeerde waarden terug, ik ken niets van php, maar als je weet hoe het met php moet, dan zou ik ook al verder kunnen.

mvg,

fuchsia
 
Laatst bewerkt:
Je zou de html kunnen ophalen van de site, waarna je met een regex de waarde uitzoekt.

Neem een kijkje bij de volgende onderdelen: URL klasse, de tutorial van oracle genaamd "Reading from and Writing to a URLConnection" en regex.

Hier de links:
de URL klasse: http://download.oracle.com/javase/1.4.2/docs/api/java/net/URL.html
reading and writing from an url: http://download.oracle.com/javase/tutorial/networking/urls/readingWriting.html
regex: http://download.oracle.com/javase/tutorial/essential/regex/

Dit is wat in mij op kwam.
Indien vragen, meld ze maar :)

Met vriendelijke groet,
Bram
 
Laatst bewerkt:
Beste,

erg bedankt voor je antwoord.

Een nadeel van wat je zegt is volgens mij echter wel -(het is een redelijk serieus nadeel vind ik) - dat je telkens wanneer je google zijn html code verandert (bijvoorbeeld wanneer ze een nieuwe layout invoegen ofzo) dat de regex in het programma daar ook aan aangepast moet worden... Daarom is het leuker om een API te kunnen gebruiken (zoals wat we in eerste pogingen deden). Helaas geeft die API dus niet dezelfde resultaten als rechtstreeks opvragen via Google...

mvg,

fuchsia
 
Beste,

Het verandert weinig, de regex opstellen is niet zo moeilijk aangezien je inderdaad enkel de div met id="resultatStats" eruit moet halen. Maar het blijft zo dat als google ooit dit id eens verandert, dat dan het programma ook moet aangepast worden. Dat is niet de bedoeling...

toch bedankt & mvg,

fuchsia
 
dus als u het onderstaande heeft bekeken zal je merken dat je het van een propertie file kan laten komen
http://download.oracle.com/javase/1.4.2/docs/api/java/util/ResourceBundle.html

als je dan een exception werpt bij niet gevonden met duidelijke uitleg hoe het moet worden aangepast.

ps hieronder vindt je bij mijn avatar een link naar javamylibs moet je eens uitchecken(svn) hierna moet je eens kijken in presrc de code die ik aanmaak is nog in underconstruction je zou me er zeer mee helpen er staat er streamreplacer in die snel stukken uit een file, datastream kan oppikken en opslaan uitvoeren aanpassen verwijderen. bekijk de tests eens Bij ontbreken van stukken check ik deze wel in. Als je iets bouwt hiermee zou ik de code graag ook op de repos hebben dus als je mee wil meewerken aan dit geheel kan. Maar dan moet je het maar vermelden maak ik een accound aan.
 
Laatst bewerkt:
Beste,

@kenikavanbis, ik kijk later nr de link en als ik eerlijk mag zijn versta ik niet veel van wat je daar in je laatste allinea zegt. Ik moet toegeven dat ik voor die andere links ook wat hulp heb gevraagd.

In ieder geval ga ik mij nu een paar weken op herexamens concentreren.

nogmaals bedankt,

fuchsia
 
Succes met de herexamens. Als je nog vragen hebt na je herexamens, zien we ze wel verschijnen.


Met vriendelijke groet,
Bram
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan