Ik probeer nu een script te maken die alle urls van een pagina af kan halen, en vervolgens kan verwerken. Ik ben nu bij het gedeelte waarbij het content van de pagina moet worden doorzocht door preg_match(), alleen heb ik totaal geen verstand van reguliere expressies 
scriptje:
Uitkomst:
Failed
Waarschijnlijk ligt het aan de reguliere expressie, want als ik alleen de url in $content gooi, en niet die html dingen erbij, dan geeft ie de url wel terug. Heeft iemand een idee wat er fout is?

scriptje:
PHP:
<?php
// File finder
$content = '<html><head></head><body><img src="http://computertotaal.nl/upload/1028119_610_1193841865355-photoshop30-2.png" /></body></html>';
$find = preg_match('|^http(s)?://[a-z0-9-]+(.[a-z0-9-]+)*(:[0-9]+)?(/.*)?$|i', $content, $matches);
if($find) {
foreach($matches as $match) {
if(preg_match('|^http(s)?://[a-z0-9-]+(.[a-z0-9-]+)*(:[0-9]+)?(/.*)?$|i', $match)) {
$found[] = $match;
}
}
foreach($found as $current) {
echo $current . '<br />';
}
} else {
echo 'Failed';
}
?>
Uitkomst:
Failed
Waarschijnlijk ligt het aan de reguliere expressie, want als ik alleen de url in $content gooi, en niet die html dingen erbij, dan geeft ie de url wel terug. Heeft iemand een idee wat er fout is?