tekst uit html-pagina

Status
Niet open voor verdere reacties.

luigiano

Nieuwe gebruiker
Lid geworden
10 okt 2004
Berichten
1
Hellow,

ik heb hier al wat zoekwerk verricht over hoe ik een html-pagina in mijn java-programma kan inlezen. Het is hierbij niet de bedoeling dat ik de html-code heb (met tags). Alleen de tekst zoals je die ziet via browser dus. Het is ook niet zo dat ik de pagina gewoon wil "tonen" aan gebruiker (met JEditorPane dus). Ik moet die tekst kunnen verwerken in mijn programma...
Er is genoeg te vinden op het internet over hoe java aan die html-code kan geraken, maar ik vind gelijk niets over hoe men enkel aan de tekst binnen webpagina kan geraken...
Zal ik dat dan zelf moeten schrijven ofzow? Lijkt mij kostbare bezigheid :( : Tags wegfilteren maar vooral rekening houdend met de frames en tabellen binnen webpagina...


Merci.
 
De iexplore en andere browsers vertalen in principe ook de HTML in wat je dus daadwerkelijk op het scherm ziet. de HTML codes worden daarom ook alleen voor de layout e.d. gebruikt.

Als je van html plain tekstbestand wilt maken zul je toch moeten gaan filteren en bepaalde html tags moeten vertalen in einde regels zoals bv. </p>
 
Status
Niet open voor verdere reacties.
Steun Ons

Nieuwste berichten

Terug
Bovenaan Onderaan