Teksten uit een website halen.
23 mei 2008 - 18:53   
geplaatst door: Lizard
Ik ben op zoek naar een programma dat de inhoud van een volledige site kan inlezen.
De meeste programma's die ik gevonden heb lezen de volledige site structuur (HTML files, afbeeldingen, enz...) in en zetten die op de harde schijf. Ik zou echter de teksten uit de site zelf nodig hebben, ook deze die dynamisch gegenereerd zijn.
Iemand enig idee?

Alvast bedankt.

Teksten uit een website halen.
23 mei 2008 - 19:10    reactie #1
geplaatst door: karel apple
Automator heeft een actie die dat doet. Maar niet van ene hele website maar uit een enkele webpagina.
Dus is de simpelste (en goedkoopste) oplossing waarschijnlijk om de website met SiteSucker in een map op je HD te zetten en met Automator alle html files in die map met de tekst extractor te laten bewerken. En dan heb je in twee stappen een 'geautomatiseerd' proces.
Teksten uit een website halen.
23 mei 2008 - 19:32    reactie #2
geplaatst door: Gottfried Julius
Denken "we" wel even aan de copyrights? Bij ander gebruik dan privé.

Juul

http://www.norderney.nl
Mac gebruiker sinds 1986 alweer
Teksten uit een website halen.
23 mei 2008 - 19:40    reactie #3
geplaatst door: Lizard
Copyright is geen probleem hoor. Heb dit nodig voor een klant.
Kan mij wel voorstellen dat je dit niet zomaar voor gelijk welke site moet gaan doen...

SiteSucker had ik al toegepast. Nu nog even Automator proberen en zien waar ik uitkom.

Thanks voor de tips!