HTML Inlezen

Status
Niet open voor verdere reacties.

dejobse

Gebruiker
Lid geworden
7 jul 2008
Berichten
722
Beste mensen

Mijn vraag is dus hoe ik de html-code(dus bijvoorbeeld: <html><body>alle text en elementen die er in staan </body></html> kan inlezen in een string.

Ik heb hiervoor het hele web afgezocht maar kan enkel oplossingen in c# of niet werkende oplossingen voor de site waarbij ik het nodig heb(http://www.ip-adress.com/proxy_list)

Ik zou dit ook liever zonder een webbrowser element doen al betwijfel ik of dat dit gaat.
Dus als iemand me hier mee zou kunnen helpen, heel graag.

Met vriendelijke groet
Dejobse
 
Je bedoeld hoe je de HTML code van een website kan lezen?

Welke webbrowser heb je is dan de eerste vraag.
 
Dankje voor de snelle reactie

En ja dat bedoel ik, dus de code die er achter de pagina zit in een string zetten.

ik gebruik het meeste firefox, maar opera, ie9, chrome heb ik ook. of bedoel je een zelfgemaakte browser?, die heb ik niet ik zou dit juist graag zonder een webbrowserelement doen al betwijfel ik of dit mogelijk is.
 
Laatst bewerkt:
In engelse Firefox heb je een optie genaamd: View page source, in nederlandse is dat: Broncode weergeven ofzo, kun je gewoon kiezen uit het menutje dat komt als je rechtermuisknop in de browser klikt.

Maar zonder webbrowser kan dat (denk ik) niet.
 
Dat weet ik maar aangezien dit in het forum VB.NET staat zou ik dit in een string in vb.net willen inlezen! dit is niet gewoon de bron weergeven.
 
HTML inlezen via webbrowser

Je kunt gewoon de webbrowser van VB gebruiken.
In je Toolbox sleep je webbrowser naar je windows form.

Public Class FrmWebbrowser

Private Sub FrmWebbrowser_Load(ByVal sender As Object, ByVal e As System.EventArgs) Handles Me.Load
Dim httpadres As String
Dim HTTPstring as string
httpadres = "http://www......"
Me.WindowState = FormWindowState.Maximized / minimized
WebBrowser1.Navigate(httpadres)
HTTPstring = WebBrowser1.DocumentText
End sub

End Class
 
hiermee heb ik de volledige srccode in deze string staan?

Dan is deze vraag opgelost, bedankt!
(welkom op helpmij.nl)
 
Volgens mij heb je dan de volledige sourcecode.

Ik heb trouwens de code iets teveel ingekort.

1 regel teveel weggelaten na webbrowser navigate kiomt de end sub

Je moet even wachten tot de pagina is ingelezen via:

Private Sub WebBrowser1_DocumentCompleted ....
Dan plaats je HTTPstring = Webbrowser1.Document.text
en kun je verder met deze string aan de gang.
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan