NEWS
Webseite/HTML parsen
-
Hallo zusammen,
da die Stadtwerke bei uns leider keine API oder andere Schnittstelle zu den Müllabfuhr-Terminen bietet habe ich mir das ehrgeizige Ziel gesetzt die nötigen Daten aus der Webseite des Unternehmens zu holen.
Dabei stehen die Daten für das gesamte Kalenderjahr auf der Seite recht ordentlich in einer Tabelle. Jetzt wollte ich Euch mal fragen ob jemand etwas ähnliches schonmal versucht hat?
Meine ersten Idee war mir die URL in einer Funktion zusammen zu baseln (Jahr, Straße, Hausnummer etc. sind direkt in der URL enthalten), dann per http request die html zu holen und dann per Funktion (oder einem anderen node?) irgendwie zu parsen.
Ich habe dann noch das "html" node entdeckt wo ich zB alle td der Webseite als multiple MSG bekomme. Danach komme ich aber schon nicht weiter. Wie kann ich ein solches multiple msg weiter verarbeiten? Ist das ein Array der Art msg__??__ _
Hat von Euch jemand einen Tipp für mich oder eine andere Idee wie ich der Sache näher kommen könnte?
Viele Grüße,
easyhoo_
-
Mache es jetzt via indexOf und split per Funktion das klappt ganz gut.