NEWS
Parser Adapter liefert kein Ergebniss
-
@oliverio sagte in Parser Adapter liefert kein Ergebniss:
probier mal
nutzt nix!
wenn dann<h3>Wetterbericht für Köln</h3>
zumindest nach dem gleiferten Quelltext -
@homoran
das war kein UTF8 vermute ich -
@homoran
na bei mir funktionierts
-
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
das war kein UTF8 vermute ich
mit WIN-Editor gespeichert?
-
@oliverio super, dann war der gelieferte Quelltext wahrscheinlich von WIN verseucht
-
@homoran
... ertappt. Hatte kein notepad++ auf dem Rechner.Es funktioniert!!!! Vielen Dank für Eure Unterstützung.
Jetzt hätte ich noch eine Verständnisfrage.
Wie bist du auf col-12 repo[^>]+>[^>]+>[^>]+>[^>]+>(.+)< gekommen?
-
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
Wie bist du auf col-12 repo[^>]+>[^>]+>[^>]+>[^>]+>(.+)< gekommen?
ich hatte die letzte brauchbare Textpassage genommen, die unabhängig vom Sprachtreiber sein müsste.
Dann hangele ich mich über die Zeichen>
bis zu dem gesuchten Text (beliebig viele beliebige Zeichen hinter dem noch ein<
kommt -
@oliverio said in Parser Adapter liefert kein Ergebniss:
probier mal
<h3>Wetterbericht für Köln*<\/h3>\s+<p>([^<]+)
du hattest 2 capture groups drin (das mit den klammern drum rum)
das kann der parser adapter nicht
auch die optionen (bei dir gms) dar man nicht angeben. das will der adapter selber ausrechnenDann kann ich das aber in regex101 nicht konfigurieren - oder?
*** Korrektur - habe es jetzt in Regex101 hinbekommen. Trotzdem ergibt das ja eine Capture Group. Kann der Adapter mit einer Gruppe umgehen?
-
@dirk_1930
ja, mit genau einer -
@oliverio
OK, dann muss ich mich mal etwas intensiver mit regex auseinandersetzten. In Teilen verstehe ich es, aber offensichtlich nicht wirklich -
Darf ich noch einmal um Hilfe bitten... ich habe jetzt versucht noch zusätzlich das p Tag ab Zeile 1171 zu laden, aber ich scheitere kläglich.
Kennt ihr ein gutes Tutorial für regex? -
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
Kennt ihr ein gutes Tutorial für regex?
die Seite regex101.com hat im Prinzip alles hervorragend erklärt.
Jeden einzelnen RegEx Befehl unten rechts, und das gerade aktive "GesamtRegEx" wird nochmal rechts oben schrittweise zerlegt@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
das p Tag ab Zeile 1171 zu laden
was steht darin?
Habe hier keine Zeilennummern und zählen wollte ich eigentlich nicht -
@homoran
zählen wäre blöd<h2 id="weather-report">Wetterbericht und Warnungen</h2> <div class="col-12"> <p><strong>Hoher Luftdruck bestimmt längerfristig das Wettergeschehen in Nordrhein-Westfalen. Dabei fließt mit südöstlicher Strömung zunehmend mildere Luft ein.<br /> FROST:<br /> Heute zunächst gebietsweise leichter Frost zwischen 0 und -4 Grad, in Bodennähe vereinzelt bis -8 Grad.<br /> Auch in der der Nacht zu Freitag muss vor allem im Bergland und seinen Tallagen mit leichten Frost zwischen 0 und -3 Grad gerechnet werden. <br /> WIND:<br /> In der Nacht zu Freitag frischt der Wind auf den Kammlagen böig auf, zeitweise werden hier starke, vereinzelt auch stürmische Böen zwischen 55 und 70 km/h (BFT 7-8) aus Südost erwartet.</strong></p><p>Heute Vormittag sowie im weiteren Tagesverlauf oft strahlender Sonnenschein und trocken. Sehr mild bei Höchstwerten zwischen 14 und 17 Grad, im höheren Bergland um 10 Grad. Im Verlauf des Tages mäßig auffrischender und leicht böiger Südost- bis Südwind.<br /> In der Nacht zum Freitag klar. Tiefstwerte 4 bis 2 Grad, in Tallagen des Berglands bis -3 Grad. Im Bergland starke, in Kammlagen stürmische Böen aus Süd bis Südost.</p><p>Am Freitag sonnig und trocken, im Tagesverlauf vor allem in der Westhälfte Durchzug von Schleierwolken. Höchsttemperaturen 12 bis 16 Grad, im Bergland 8 bis 12 Grad. Mäßiger, zeitweise auch frischer und stark böiger Südostwind.<br /> In der Nacht zum Samstag im Osten meist gering bewölkt, im Westen dichtere Wolkenfelder aber allenfalls westlich des Rheins ein paar Tropfen Regen. Sonst niederschlagsfrei. Tiefsttemperaturen zwischen 7 Grad am Rhein und 2 Grad in Ostwestfalen, in Tallagen des Sauerlandes leichter Frost bis -3 Grad. Im Bergland weiterhin stark böiger Südostwind.</p><p>Am Samstag in Ostwestfalen oft sonnig, am Niederrhein hingegen zeitweise stärker bewölkt. Dort weiterhin ein paar Regentropfen nicht ausgeschlossen, sonst aber weiterhin trocken. Erwärmung auf 12 bis 15 Grad, im höheren Bergland 7 bis 10 Grad. Mäßiger, in Böen teils frischer Wind um Süd. <br /> In der Nacht zum Sonntag in der Westhälfte wechselnd bewölkt, in der Osthälfte gering bewölkt oder klar. Niederschlagsfrei. Abkühlung auf 6 bis 1 Grad, im Bergland bis -3 Grad.</p><p>Letzte Aktualisierung: 10.03.2022, 06.58 Uhr Lokalzeit. Textquelle: Deutscher Wetterdienst</p>
-
@dirk_1930
col-12">[^>]+>[^>]+>([\w\W]+)<\/p><
allerdings ohne Gewähr, da immer noch kein UTF-8 -
@homoran
Hab es jetzt mal als .html abgespeichert.
col-12 wählt zu viel aus. Wäre da die <h2 id="weather-report">Wetterbericht und Warnungen</h2> besser geeignet? -
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
col-12 wählt zu viel aus.
habs gerade auch gesehen:
letzter Stand:
und Warnungen[^>]+>[^>]+>[^>]+>[^>]+>([\w\W]+)<\/p><
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
Quelltext_als_Html.html
nutzt nix, der macht die Seite auf
-
@homoran
SUPER!!! ja... das geht jetzt.Ich verstehe trotzdem noch nicht, wie du dich da durchhangelst...
Du fängst bei "und Warnungen" an und gehst von da aus jedes schließende Element durch bis du zu dem Text kommst? -
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
Du fängst bei "und Warnungen" an und gehst von da aus jedes schließende Element durch bis du zu dem Text kommst?
jepp
und hier die Infos, die du dazu bei regex101.com bekommst:
unten rechts gibt es die Quick reference und oben rechts wird der RegEx zerlegt
-
verstehe ich das richtig...?
und Warnungen</h2><div class="col-12"><><strong>
Also 4 X [^>]
-
@dirk_1930 sagte in Parser Adapter liefert kein Ergebniss:
Also 4 X [^>]
jepp, aber mit zusätzlichem
+
für beliebig viele Zeichen, die nicht > sind und dann ein>
, da dieses Zeichen ja im Befehl davor ausgeschlossen istdie roten Markierungen betreffen aber die schließende Spitze Klammer, oder?