NEWS
Parser Adapter liefert kein Ergebniss
-
Morgen zusammen,
ich habe mir gerade ein regex zusammengebaut, welches auch in regex101 funktioniert.
/(<h3>Wetterbericht für Köln*)\b[^>]*>(.*?)<\/p>/gms
für die URL https://www.meteoblue.com/de/wetter/woche/köln_deutschland_2886242
Dabei bekomme ich als Group 2 den Text...
Was muss ich jetzt in dem Parser eintragen, damit ich den Text als String weiterverarbeiten kann?
Viele Grüße,
Dirki
-
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
welches auch in regex101 funktioniert.
ist das aus dem echten Quellcode oder aus der aufgearbeiteten HTML-Seite?
Bitte mal den vollständigen Quellcode der Seite (Rechtsklick -> Quellcode anzeigen) und was du daraus haben willst posten
-
Den Quellcode kann ich leider nicht einfügen, da er zu lang ist
Vielleicht kannst Du über den Link oben die Seite aufrufen und dir den Quellcode herunterladen.
Ich benötige den Inhalt von Zeile 1157 (das p Tag)
<div class="col-12 report no-top-padding"> <h3>Wetterbericht für Köln</h3> <p>Am Donnerstag bleibt das Wetter klar. Es ist ein sonniger Tag. Es werden Temperaturen mit einem Tageshöchstwert bis zu 15 °C erwartet. In der Nacht zum Donnerstag weht eine leichte Brise (7 bis 12 km/h). Während des Tages weht eine schwache Brise (12 bis 20 km/h). Vereinzelt treten Böen mit bis zu 32 km/h auf. Der Wind kommt aus Süd-Ost. Die Wettervorhersage in Köln für Donnerstag ist sehr stabil und es wird eine hohe Treffsicherheit angenommen.</p> </div>
-
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
ch benötige den Inhalt von Zeile 1157
und wo sind die 1157+ Zeilen?
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
Vielleicht kannst Du über den Link oben die Seite aufrufen und dir den Quellcode herunterladen.
nicht am Handy.
deswegen bat ich um diese Daten -
@homoran
ich hab das am PC gemacht, aber ich kann nicht so viele Daten hier im Post einfügen. Der Quelltext hat 2153 Zeilen -
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
aber ich kann nicht so viele Daten hier im Post einfügen.
dann bitte als Anhang im .txt-Format
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
ich hab das am PC gemacht
das geht ja auch, aber ich bin nur am Handy/Tablet
-
-
probier mal
<h3>Wetterbericht für Köln*<\/h3>\s+<p>([^<]+)
du hattest 2 capture groups drin (das mit den klammern drum rum)
das kann der parser adapter nicht
auch die optionen (bei dir gms) dar man nicht angeben. das will der adapter selber ausrechnen -
@dirk_1930
col-12 repo[^>]+>[^>]+>[^>]+>[^>]+>(.+)<
-
@oliverio sagte in Parser Adapter liefert kein Ergebniss:
probier mal
nutzt nix!
wenn dann<h3>Wetterbericht für Köln</h3>
zumindest nach dem gleiferten Quelltext -
@homoran
das war kein UTF8 vermute ich -
@homoran
na bei mir funktionierts
-
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
das war kein UTF8 vermute ich
mit WIN-Editor gespeichert?
-
@oliverio super, dann war der gelieferte Quelltext wahrscheinlich von WIN verseucht
-
@homoran
... ertappt. Hatte kein notepad++ auf dem Rechner.Es funktioniert!!!! Vielen Dank für Eure Unterstützung.
Jetzt hätte ich noch eine Verständnisfrage.
Wie bist du auf col-12 repo[^>]+>[^>]+>[^>]+>[^>]+>(.+)< gekommen?
-
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
Wie bist du auf col-12 repo[^>]+>[^>]+>[^>]+>[^>]+>(.+)< gekommen?
ich hatte die letzte brauchbare Textpassage genommen, die unabhängig vom Sprachtreiber sein müsste.
Dann hangele ich mich über die Zeichen>
bis zu dem gesuchten Text (beliebig viele beliebige Zeichen hinter dem noch ein<
kommt -
@oliverio said in Parser Adapter liefert kein Ergebniss:
probier mal
<h3>Wetterbericht für Köln*<\/h3>\s+<p>([^<]+)
du hattest 2 capture groups drin (das mit den klammern drum rum)
das kann der parser adapter nicht
auch die optionen (bei dir gms) dar man nicht angeben. das will der adapter selber ausrechnenDann kann ich das aber in regex101 nicht konfigurieren - oder?
*** Korrektur - habe es jetzt in Regex101 hinbekommen. Trotzdem ergibt das ja eine Capture Group. Kann der Adapter mit einer Gruppe umgehen?
-
@dirk_1930
ja, mit genau einer -
@oliverio
OK, dann muss ich mich mal etwas intensiver mit regex auseinandersetzten. In Teilen verstehe ich es, aber offensichtlich nicht wirklich -
Darf ich noch einmal um Hilfe bitten... ich habe jetzt versucht noch zusätzlich das p Tag ab Zeile 1171 zu laden, aber ich scheitere kläglich.
Kennt ihr ein gutes Tutorial für regex?