Dat gaat moeilijk worden om een aantal redenen:
Je zou kunnen kijken naar de last-modified header. Helaas is het zo dat niet elke webserver/site zo'n header meestuurt.
Andere optie is om de pagina in zijn geheel op te slaan (of desnoods een md5 ervan te maken) in een database en dit later te vergelijken met de live website. Probleem hierbij is dat veel dynamische websites content hebben die bij elke refresh anders is (leden online, een teller, reclame, etc) dus ook deze methode zal niet werken.
Als laatste kun je website strippen en alleen de belangrijke stukken opslaan en vergelijken. Dit is veel werk en moet opnieuw aangepast worden voor elke website die je wilt vergelijken.