webscraping met cpan: template::extract, betere methode?

Status
Niet open voor verdere reacties.

dennismayflower

Nieuwe gebruiker
Lid geworden
17 dec 2007
Berichten
1
doel : webscrapen van www.woningnet.nl

ik krijg op mijn script met de volgende template als resultaat 'undef', ook het template versimpelen door veel [% ... %] (greedy regexp) in te voegen levert nog steeds geen resultaat op. wat zou hier het handigst zijn.

ook wel handig voor het scrapen van dergelijke sites zou een text comparison zijn van een X aantal records zodat het meest minimiale record gevonden zou worden (ie sommige records (van apartemente) voegen html code voor bijvoorbeeld een 'cv' of bij andere vermeldingen. (volg u mij nog?)

ook heb ik al enkele trailing space, newlines weggehaald in het begin van het script.

$template = template
$docu = HTML van een rsultpagina zoeken op www.woningnet.nl

omdat het template uit de htmlcode komt zou hij toch ook een keer moeten matchen...

bij voorbaat dank,

dan

Code:
#!/usr/bin/perl -w

#     my $homedir = (getpwuid($>))[7];
#     my $n_inc = scalar @INC;
#     for (my $i = 0; $i < $n_inc; $i++ ) {
#	  if (-d $homedir . '/perl' . $INC[$i]) {
#	      unshift(@INC,$homedir . '/perl' . $INC[$i]);
#	      $n_inc++;
#	      $i++;
#	  }
#     }


use Template::Extract;

#because active$tate doesn't support basic modules
#use Data::Dumper;
#use Data::Denter;
use Data::Dump qw(dump);
 

my $x = Template::Extract->new;

#my $template = << '.';
#<span class="zoek_huur" [% ... %]>
#[% FOREACH record %]
#	<a class="unevenrow" href="#" onclick="[% onclick %]">
#		<div class="td1">
#		<h1>[% adres %]</h1>
#		<p>[% stad %] / 
#		<span class="zoek_wijk">[% wijk %]</span> 
#	<span class="aanbieder"><b>Aanbieder</b>:<br />[% aanbieder %]</span>
#		[% ... %]
#		<div class="td3">[% woningtypeetage %]</div>
#		<div class="td4">[% oppervlakte %] m²</div>
#		<div class="td5">&euro; [% huurprijs %]</div>[% ... %]
#</span>
#.

my $template = << '.';
<span class="zoek_huur" type="0" id="[% ... %]">
[% FOREACH record %][% ... %]getDetails('[% getdetails %]');"><div class="td1">[% pp_td1 %]<h4>Jongerenwoning</h4><h1>[% adres %]</h1><p>[% stad %] / <span class="zoek_wijk">[% wijk %]</span><span class="aanbieder"><b>Aanbieder</b>:<br />Woonmaatschappij</span></p></div><div class="td2">
		<div class="digitaal"></div>
	&nbsp;
		</div>
		<div class="td3">1k Portiekflat<br />3e etage</div>
		<div class="td4">34 m²</div>
		<div class="td5">&euro; 253,44</div>
<div class="status">
[% pp_status %]
</div>

	</a>
</span>
[% END %]
.

my $docu = << '.';
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />
<title>WoningNet Regio Amsterdam</title>
<link href="css/woningnet/layout.css" rel="stylesheet" type="text/css" />
<link href="css/woningnet/basis.css" rel="stylesheet" type="text/css" />
<link href="css/woningnet/content_breed.css" rel="stylesheet" type="text/css" />
<link href="css/woningnet/form.css" rel="stylesheet" type="text/css" />
<link href="css/woningnet/zoekresultaat.css" rel="stylesheet" type="text/css" />
<script src="inc/js/common.js" type="text/javascript"></script>
<script src="inc/js/prototype-1.4.0.js" type="text/javascript"></script>
<script src="inc/js/deepmetrix.js" type="text/javascript"></script>
<script src="inc/js/webads_smarttag.js" type="text/javascript"></script>
<script src="inc/js/helptip.js" type="text/javascript"></script>
<script type="text/javascript">
//<![CDATA[
var objForm;

var paginghelp = "Er worden 10 advertenties per pagina getoond, u kunt onderaan het overzicht doorgaan naar de volgende pagina's.";

function initPage(){
	objForm = document.contentForm;
	setURL('5', 'Hide38996241FE482ED00067E491D47BCC5DC6881A1196CE8C7D5536D6F3FEE4EFCA40F9042BD3', 'H');
	return showSec('overzicht');
}
function submitBack(){
	objForm.action = 'digizine_3.asp';
	objForm.submit();
}
function submitToPage(strPageNr, strSort){
	objForm.pag.value = strPageNr;
	objForm.sort.value = strSort;
	objForm.action = 'zoekresultaat.asp';
	objForm.submit();
}
function getModus(strModus){
	objForm.zoekmodus.value = strModus;
	objForm.action = 'zoekresultaat.asp';
	objForm.submit();
}
function showSec(strTab) { 
	hideSec(); 
	try {
		document.getElementById('tab_'+strTab).className = 'activetab';
	} catch (e) {}
}
function hideSec() { 
	try {
		document.getElementById('overzicht').style.visibility = 'hidden'; 
		document.getElementById('tab_overzicht').className = '';
		document.getElementById('kaart').style.visibility = 'hidden'; 
		document.getElementById('tab_kaart').className = '';
	} catch (e) {}
}
function saveZoekOpdracht(objForm){
	if(confirm('U staat op het punt uw zoekcriteria op te slaan.\nReeds eerder opgeslagen zoekcriteria worden\nmet deze handeling overschreven.\n\nWeet u zeker dat u door wilt gaan?')!=0){
		objForm.save.value = 'J';
		objForm.action = 'zoekresultaat.asp';
		objForm.submit();
	}else{
		return false;
	}
}
function getDetails(strAdvertentieNr){
	objForm.id.value = strAdvertentieNr;
	objForm.action = 'woningdetails.asp';
	objForm.submit();
}
function submitForm(objForm){
	objForm.action = 'mijn_woningnet.asp'; objForm.aantal.value = ''; objForm.sort.value = ''; objForm.pag.value = '';
	objForm.submit();
}
//]]>
</script>
</head>
<body>
<iframe src="http://images.webads.nl/stir/woningnet_stir.htm" width="0" height="0" frameborder="0"></iframe>
<div id="center">
	<div id="container">
		<div id="kolom_navigatie">
			<div id="navigatie">
				<p><a href="/"><img src="img/woningnet/lg_woningnet.gif" alt="WoningNet logo"  width="159" height="115" border="0" title="home" class="logo" /></a></p>
				<p><a href="/"><img src="img/woningnet/nav_home.gif" alt="home" title="" width="159" height="27" border="0" /></a></p>
				<p><a href="afmelden.asp"><img src="img/woningnet/nav_uitloggen.gif" alt="Uitloggen" width="159" height="27" border="0" title="" /></a></p>
				<p><a href="regio_subhome_h.asp"><img src="img/woningnet/nav_woningzoeken.gif" alt="een sociale huur woning zoeken" width="159" height="50" border="0" title="" /></a></p>
				<div class="navsub">
					<a href="mijn_woningnet.asp"><img src="img/woningnet/navsub_mijnwoningnet.gif" alt="mijn woningnet" title="" width="139" height="32" border="0" /></a>
				<ul>
						<li><a href="inschrijven/inschrijven_03/inschrijving_overzicht.asp?mode=e&IID=5&menuid=2" target="">Mijn inschrijfgegevens</a></li>
						<li><a href="zoekprofiel.asp?IID=5&menuid=2" target="">Zoekopdracht</a></li>
						<li><a href="woningmandje.asp?IID=5&menuid=2" target="">Bewaarde woningen</a></li>
						<li><a href="actuele_reacties.asp?IID=5&menuid=2" target="">Actuele reacties</a></li>
						<li><a href="lopende_reacties.asp?IID=5&menuid=2" target="">Actuele aanbiedingen</a></li>
						<li><a href="digitale_aanbiedingen.asp?IID=5&menuid=2" target="">Digitale aanbiedingen</a></li>
						<li><a href="historische_reacties.asp?IID=5&menuid=2" target="">Historische reacties</a></li>
						<li><a href="afmelden.asp?IID=5&menuid=2" target="">Uitloggen</a></li>
				</ul>
				</div>
				<p><a href="over_woningnet.asp"><img src="img/woningnet/nav_overwn.gif" alt="over woningnet" title="" width="159" height="50" border="0" /></a></p>
				<p>&nbsp;</p>
			</div>
		</div>
		<div id="kolom_content" class="sb">
			<div id="header" style="background-image: url(img/woningnet/top/HLK_fotografie_1.jpg);">
				<h1>Zoekresultaat</h1>
			</div>
			<div id="content">
				<form name="contentForm" action="" method="post">
  <p class="bulletlink">
		<a href="#" onclick="submitBack();">Zoekopdracht aanpassen</a>
  </p>
	<br clear="all" />
					<div class="tabs">						<a href="#" id="tab_overzicht" onClick="getModus('OZ','overzicht');">overzicht</a>						<a href="#" id="tab_kaart" onClick="getModus('KZ','kaart');">kaart</a>						<div id="notab"></div>
					</div>
<div class="vlak_grijs_kader">
<div>
<b>U heeft gezocht op : </b>mijn aanbod.
  </div>
  <div>
    <p class="formbuttons"><input onClick="saveZoekOpdracht(document.contentForm);" type="button" name="opslaan" value="Zoekcriteria opslaan" /></p>
  </div>
</div>
<br clear="all" />
				<p>Er zijn <b>67</b> advertenties gevonden.				U ziet pagina <b>1</b> van <b>7</b>. <span class="formvraag" onmouseover="this.style.cursor='help';showHelpTip(event, paginghelp, false); return false" onmouseout="hideHelpTip(event, paginghelp, false); return false">&nbsp;</span><br />				Sorteer resultaten op:
				</p>
				<p>&nbsp;</p>
				<div id="labelcontainer">
<div id="labelgroup"><div class="label_td1"><a href="#" class="lokatie" onclick="submitToPage('1', 'LA');">adres</a><a href="#" class="plaats" onclick="submitToPage('1', 'GA');">plaats</a><a href="#" class="wijk active_up" onclick="submitToPage('1', 'WD');">wijk</a></div></div><div class="label_td2">&nbsp;</div><div id="labelgroup"><div class="label_td3"><a href="#" onclick="submitToPage('1', 'TA');">type</a></div></div><div id="labelgroup"><div class="label_td4"><a href="#" onclick="submitToPage('1', 'OA');">M<sup>2</sup></a></div></div><div id="labelgroup"><div class="label_td5"><a href="#" onclick="submitToPage('1', 'PA');">prijs</a></div></div>
				</div>
<div class="zoekresultaten">
<span class="zoek_huur" type="0" id="5">
	<a class="unevenrow" href="#" onclick="getDetails('HideF94F058129607A68E888D69C6D7EEB5445A68128647668');">
		<div class="td1">
		<h1>1e Laurierdwarsstraat 91</h1>
		<p>Amsterdam / 
		<span class="zoek_wijk">Binnenstad</span> 
	<span class="aanbieder"><b>Aanbieder</b>:<br />Eigen Haard</span>
		</p></div>
		<div class="td2">
		<div class="digitaal"></div>
	&nbsp;
		</div>
		<div class="td3">4k Benedenwoning</div>
		<div class="td4">62 m²</div>
		<div class="td5">&euro; 551,20</div>
<div class="status">
<img class="icon" src="img/woningnet/icons/berging.gif" alt="Berging" border="0" /><img class="icon" src="img/woningnet/icons/cv_ketel.gif" alt="C.V. combiketel" border="0" /><img class="icon" src="img/woningnet/icons/dubbele_beglazing.gif" alt="Dubbele beglazing" border="0" />
<span class="aanbieder">Aangeboden door: <strong>Eigen Haard</strong></span>
</div>

	</a>
</span>
<span class="zoek_huur" type="0" id="5">
	<a class="" href="#" onclick="getDetails('HideF94F058129677364EE88D69C6D7EEB5445A6832D6A756A');">
		<div class="td1">
		<h1>3e Weteringdwarsstraat 6 -B</h1>
		<p>Amsterdam / 
		<span class="zoek_wijk">Binnenstad</span> 
	<span class="aanbieder"><b>Aanbieder</b>:<br />de Alliantie Amsterdam</span>
		</p></div>
		<div class="td2">
		<div class="digitaal"></div>
	&nbsp;
		</div>
		<div class="td3">2k Bovenwoning<br />2e etage</div>
		<div class="td4">45 m²</div>
		<div class="td5">&euro; 398,32</div>
<div class="status">
<img class="icon" src="img/woningnet/icons/berging.gif" alt="Berging" border="0" /><img class="icon" src="img/woningnet/icons/cv_ketel.gif" alt="C.V. combiketel" border="0" /><img class="icon" src="img/woningnet/icons/dubbele_beglazing.gif" alt="Dubbele beglazing" border="0" />
<span class="aanbieder">Aangeboden door: <strong>de Alliantie Amsterdam</strong></span>
</div>

	</a>
</span>
<span class="zoek_huur" type="0" id="5">
	<a class="unevenrow" href="#" onclick="getDetails('HideF94F05812967726AEB88D69C6D7EEB5445A6812F6B716E');">
		<div class="td1">
		<h1>Binnenkadijk 405</h1>
		<p>Amsterdam / 
		<span class="zoek_wijk">Binnenstad</span> 
	<span class="aanbieder"><b>Aanbieder</b>:<br />de Alliantie Amsterdam</span>
		</p></div>
		<div class="td2">
		<div class="digitaal"></div>
	&nbsp;
		</div>
		<div class="td3">3k Portiekflat<br />3e etage</div>
		<div class="td4">64 m²</div>
		<div class="td5">&euro; 706,33</div>
<div class="status">
<img class="icon" src="img/woningnet/icons/cv_ketel.gif" alt="C.V. combiketel" border="0" /><img class="icon" src="img/woningnet/icons/dubbele_beglazing.gif" alt="Dubbele beglazing" border="0" /><img class="icon" src="img/woningnet/icons/lift.gif" alt="Lift" border="0" />
<span class="aanbieder">Aangeboden door: <strong>de Alliantie Amsterdam</strong></span>
</div>

	</a>
</span>
<span class="zoek_huur" type="0" id="5">
	<a class="" href="#" onclick="getDetails('HideF94F058129607A69EF88D69C6D7EEB5445A68122607A6E');">
		<div class="td1">
		<h1>Blankenstraat 107 -1A</h1>
		<p>Amsterdam / 
		<span class="zoek_wijk">Binnenstad</span> 
	<span class="aanbieder"><b>Aanbieder</b>:<br />Eigen Haard</span>
		</p></div>
		<div class="td2">
		<div class="digitaal"></div>
	&nbsp;
		</div>
		<div class="td3">1k Portiekflat<br />1e etage</div>
		<div class="td4">28 m²</div>
		<div class="td5">&euro; 208,66</div>
<div class="status">
<img class="icon" src="img/woningnet/icons/dichtbij_ov.gif" alt="Nabij openbaar vervoer" border="0" /><img class="icon" src="img/woningnet/icons/zolder.gif" alt="Zolder/berging" border="0" />
<span class="aanbieder">Aangeboden door: <strong>Eigen Haard</strong></span>
</div>

	</a>
</span>
</div>
<div class="vlak_banner_liggend">
			<script type="text/javascript" language="javascript">
			//<![CDATA[
			wbds_target = 'http://adserver.webads.nl/jserver/SITE=WONINGNET/AREA=WONINGNET_SOCIALEHUURWONINGEN.RESULTAAT';
			wbds_writeTag('468X60','TOP');
			wbds_firstdone=true;
			//]]>
			</script>
</div>		
<div class="zoekresultaten">
<span class="zoek_huur" type="0" id="5">
	<a class="unevenrow" href="#" onclick="getDetails('HideF94F058129677269E188D69C6D7EEB5445A6832264736B');">
		<div class="td1">
			<h4>Jongerenwoning</h4>
		<h1>Elandsstraat 197 C</h1>
		<p>Amsterdam / 
		<span class="zoek_wijk">Binnenstad</span> 
	<span class="aanbieder"><b>Aanbieder</b>:<br />Ymere Wonen Binnenstad</span>
		</p></div>
		<div class="td2">
		<div class="digitaal"></div>
	&nbsp;
		</div>
		<div class="td3">1k Bovenwoning<br />3e etage</div>
		<div class="td4">27 m²</div>
		<div class="td5">&euro; 246,78</div>
<div class="status">
<span class="aanbieder">Aangeboden door: <strong>Ymere Wonen Binnenstad</strong></span>
</div>

	</a>
</span>
<span class="zoek_huur" type="0" id="5">
	<a class="" href="#" onclick="getDetails('HideF94F058129607A68EC88D69C6D7EEB5445A6812F6B756B');">
		<div class="td1">
		<h1>Goudsbloemstraat 80 E</h1>
		<p>Amsterdam / 
		<span class="zoek_wijk">Binnenstad</span> 
	<span class="aanbieder"><b>Aanbieder</b>:<br />Woonmaatschappij</span>
		</p></div>
		<div class="td2">
		<div class="digitaal"></div>
	&nbsp;
		</div>
		<div class="td3">3k Portiekflat<br />2e etage</div>
		<div class="td4">54 m²</div>
		<div class="td5">&euro; 482,16</div>
<div class="status">
<img class="icon" src="img/woningnet/icons/balkon.gif" alt="Balkon" border="0" /><img class="icon" src="img/woningnet/icons/berging.gif" alt="Berging" border="0" /><img class="icon" src="img/woningnet/icons/centrale_verwarming.gif" alt="C.V." border="0" />
<span class="aanbieder">Aangeboden door: <strong>Woonmaatschappij</strong></span>
</div>

	</a>
</span>
<span class="zoek_huur" type="0" id="5">
	<a class="unevenrow" href="#" onclick="getDetails('HideF94F058129607A68EB88D69C6D7EEB5445A6812E6A7464');">
		<div class="td1">
			<h4>Jongerenwoning</h4>
		<h1>Goudsbloemstraat 133-3-A</h1>
		<p>Amsterdam / 
		<span class="zoek_wijk">Binnenstad</span> 
	<span class="aanbieder"><b>Aanbieder</b>:<br />Woonmaatschappij</span>
		</p></div>
		<div class="td2">
		<div class="digitaal"></div>
	&nbsp;
		</div>
		<div class="td3">1k Portiekflat<br />3e etage</div>
		<div class="td4">34 m²</div>
		<div class="td5">&euro; 253,44</div>
<div class="status">
<img class="icon" src="img/woningnet/icons/zolder.gif" alt="Zolder/berging" border="0" />
<span class="aanbieder">Aangeboden door: <strong>Woonmaatschappij</strong></span>
</div>

	</a>
</span>
<span class="zoek_huur" type="0" id="5">
	<a class="" href="#" onclick="getDetails('HideF94F058129617364EB88D69C6D7EEB5445A68122627664');">
		<div class="td1">
		<h1>Goudsbloemstraat 135-3-A</h1>
		<p>Amsterdam / 
		<span class="zoek_wijk">Binnenstad</span> 
	<span class="aanbieder"><b>Aanbieder</b>:<br />Woonmaatschappij</span>
		</p></div>
		<div class="td2">
		<div class="digitaal"></div>
	&nbsp;
		</div>
		<div class="td3">2k Portiekflat</div>
		<div class="td4">31 m²</div>
		<div class="td5">&euro; 228,24</div>
<div class="status">
<img class="icon" src="img/woningnet/icons/balkon.gif" alt="Balkon" border="0" /><img class="icon" src="img/woningnet/icons/zolder.gif" alt="Zolder met vaste trap" border="0" />
<span class="aanbieder">Aangeboden door: <strong>Woonmaatschappij</strong></span>
</div>

	</a>
</span>
<span class="zoek_huur" type="0" id="5">
	<a class="unevenrow" href="#" onclick="getDetails('HideF94F058129607768EB88D69C6D7EEB5445A6822A67716A');">
		<div class="td1">
		<h1>Henri Polaklaan 6 A</h1>
		<p>Amsterdam / 
		<span class="zoek_wijk">Binnenstad</span> 
	<span class="aanbieder"><b>Aanbieder</b>:<br />Woonzorg Nederland</span>
		</p></div>
		<div class="td2">
	&nbsp;
		</div>
		<div class="td3">1k Benedenwoning<br />Begane grond</div>
		<div class="td4">19 m²</div>
		<div class="td5">&euro; 205,83</div>
<div class="status">
<img class="icon" src="img/woningnet/icons/dichtbij_ov.gif" alt="Nabij openbaar vervoer" border="0" />
<span class="aanbieder">Aangeboden door: <strong>Woonzorg Nederland</strong></span>
</div>

	</a>
</span>
<span class="zoek_huur" type="0" id="5">
	<a class="" href="#" onclick="getDetails('HideF94F058129607765EC88D69C6D7EEB5445A68128677B6A');">
		<div class="td1">
			<h4>Jongerenwoning</h4>
		<h1>Henri Polaklaan 6 W</h1>
		<p>Amsterdam / 
		<span class="zoek_wijk">Binnenstad</span> 
	<span class="aanbieder"><b>Aanbieder</b>:<br />Woonzorg Nederland</span>
		</p></div>
		<div class="td2">
	&nbsp;
		</div>
		<div class="td3">1k Portiekflat<br />1e etage</div>
		<div class="td4">23 m²</div>
		<div class="td5">&euro; 205,43</div>
<div class="status">
<img class="icon" src="img/woningnet/icons/dubbele_beglazing.gif" alt="Dubbele beglazing" border="0" />
<span class="aanbieder">Aangeboden door: <strong>Woonzorg Nederland</strong></span>
</div>

	</a>
</span>
</div>

				<br/>
<div id="paginateller">
<div id="paginateller_container" style="width:415px;">
	<div id="eerste"><span class="clsInactive">Eerste</span></div>
	<div id="vorige"><span class="clsInactive">Vorige</span></div>
	<div id="numbers">
		<div id="paginatellerActive"><a href="#" onclick="submitToPage('1','WA');return false;">1</a></div>
		<a href="#" onclick="submitToPage('2','WA');return false;">2</a>
		<a href="#" onclick="submitToPage('3','WA');return false;">3</a>
		<a href="#" onclick="submitToPage('4','WA');return false;">4</a>
		<a href="#" onclick="submitToPage('5','WA');return false;">5</a>
		<a href="#" onclick="submitToPage('6','WA');return false;">6</a>
		<a href="#" onclick="submitToPage('7','WA');return false;">7</a>
	</div>
	<div id="volgende"><a href="#" onclick="submitToPage('2','WA');return false;">Volgende</a></div>
	<div id="laatste"><a href="#" onclick="submitToPage('7','WA');return false;">Laatste</a></div>
</div>
</div>

				<input type="hidden" name="IID" value="5" />
				<input type="hidden" name="rgnr" value="Hide38996241FE482ED00067E491D47BCC5DC6881A1196CE8C7D5536D6F3FEE4EFCA40F9042BD3" />
				<input type="hidden" name="msrt" value="H" />
				<input type="hidden" name="gsrt" value="A" />
				<input type="hidden" name="pag" value="1" />
				<input type="hidden" name="sort" value="WA" />
				<input type="hidden" name="aantal" value="67" />
				<input type="hidden" name="aantalregels" value="10" />
				<input type="hidden" name="txtFormValues" value="IID=5|sort=|aantal=|txtFormValues=|txtLwgNr=|txtZoekType=|rgnr=Hide38996241FE482ED00067E491D47BCC5DC6881A1196CE8C7D5536D6F3FEE4EFCA40F9042BD3|txtAdvertentieRegio=|txtAdvertentieIID=|msrt=H|zpf=J|gsrt=|zoekmodus=|pag=|aantalregels=|id=|inschr=|txtHiddenExtra=|txtFromPage=digizine_3.asp|menuid=2|slideshow=|type=|mid=" />
				<input type="hidden" name="txtLwgNr" value="" />
				<input type="hidden" name="id" value="" />
				<input type="hidden" name="txtAdvertentieRegio" value="" />
				<input type="hidden" name="txtAdvertentieIID" value="" />
				<input type="hidden" name="inschr" value="" />
				<input type="hidden" name="txtHiddenExtra" value="" />
				<input type="hidden" name="type" value="" />
				<input type="hidden" name="txtFromPage" value="digizine_3.asp" />
				<input type="hidden" name="txtZoekType" value="Z" />
				<input type="hidden" name="menuid" value="2" />
				<input type="hidden" name="mid" value="" />
				<input type="hidden" name="slideshow" value="HideF94F058129607A68E888D69C6D7EEB5445A68128647668|HideF94F058129677364EE88D69C6D7EEB5445A6832D6A756A|HideF94F05812967726AEB88D69C6D7EEB5445A6812F6B716E|HideF94F058129607A69EF88D69C6D7EEB5445A68122607A6E|HideF94F058129677269E188D69C6D7EEB5445A6832264736B|HideF94F058129607A68EC88D69C6D7EEB5445A6812F6B756B|HideF94F058129607A68EB88D69C6D7EEB5445A6812E6A7464|HideF94F058129617364EB88D69C6D7EEB5445A68122627664|HideF94F058129607768EB88D69C6D7EEB5445A6822A67716A|HideF94F058129607765EC88D69C6D7EEB5445A68128677B6A" />
				<input type="hidden" name="zoekmodus" value="OZ" />
 				<input type="hidden" name="save" />
			</form>
			</div>
		</div>
		<div id="kolom_context">
			&nbsp;
		</div>
		<div id="kolom_banner">
			<p id="bannertop">&nbsp;</p>
			<p id="banner">
			<script type="text/javascript" language="javascript">
			//<![CDATA[
			wbds_target = 'http://adserver.webads.nl/jserver/SITE=WONINGNET/AREA=WONINGNET_SOCIALEHUURWONINGEN.RESULTAAT';
			wbds_writeTag('120X600','RIGHT');
			//]]>
			</script>
</p>
		</div>
	</div>
</div>
<script defer type="text/javascript" language="Javascript">
//<![CDATA[
initPage();
//]]>
</script>
</body>
</html>
.

$docu = join "\n", grep { /\S/ } split /\n/, $docu;
$docu =~ s/\r//g;
$docu =~ s/^\s+//g;

print $docu;

my $data = $x->extract($template, $docuproc);

#print Data::Denter->Indent($data);
print dump($data);
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan