$ch = curl_init("http://www.meine-seite.de");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$output = curl_exec($ch);
curl_close($ch);
preg_match($pattern,$output,$treffer);
print_r($treffer);
| 2 |
Für einfaches "Quelltext-Laden" könnte auch die Funktion "file_get_contents()", die auch den Aufruf von URLs unterstützt, benutzt werden. Ansonsten hätte ich ebenfalls den Einsatz regulärer Ausdrücke vorgeschlagen.
– Blauesocke 02.11.09
|
|
|
curl hat den vorteil, daß es alle protokolle (http(s), ftp(s) usw.) kann und auch eine cookie und sessionverwaltung hat, also geeignet für Seiten auf denen erst eine Anmeldung erfolgen muß.
Ich nutze es ausserdem für einen crawler mit curl_multiexec um mehrere Siten gleichzeitig zu bearbeiten. Das biete file_get_contents() leider nicht. Aber bei "einfachen" Seiten ist file_get_contents sicher die richtige Wahl. – MiW 03.11.09
|
| 1 |
Ich habe bereits die Erlaubnis, muss aber mit der von dir oben erwähnten Einschränkung leben das wenn der Besitzer die Homepage verändert ich die Struktur entsprechend auch in meinem Code abändern muss.
Die Idee mit dem WebService habe ich aber noch nicht gehabt, evtl. kann ich Ihn ja dazu bewegen sich einen von mir Programmieren zu lassen. Ich hätte dann mein benötigtes DataSet und er wiederum ein weiteres Feature. – The_Holy_One 02.11.09
|
|
| 4 |
Mir kommen aber etliche Sachen in den Sinn wo man das brauchen kann ohne das es Content-Klau ist.
– GENiALi 02.11.09
|
|
|
@Geniali: Ein Beispiel: Du schließt als Firma X einen Vertrag mit einer Firma Y ab. Diese soll dir zum Beispiel Börsen-Informationen für dein System bereitstellen. Nun ist die Firma Y aber nicht in der Lage (magels kopetenten Mitarbeiten, technischer Schwirigkeiten, etc) die Informationen direkt in einem maschinenlesbaren Format darzubieten. Ergo baust du dir einen Parser der die Informationen in eine maschinenlesbares Format zur weiteren Verarbeitung überführt. Da du einen Vertrag hast ist es erlaubt un KEIN Content-Klau! (Btw. das ist ein Beispiel aus der Praxis)
– Floyd 01.03.10
|