NEWS
Parsen einer Seite
-
@deralff sagte in Parsen einer Seite:
wenn ich nur 01/02/2022,
telle[^"]+[^>]+>([\d\/]+)
@deralff sagte in Parsen einer Seite:
1,2607 u
telle[^"]+[^<]+[^>]+>[^>]+>([\d\,]+)
@deralff sagte in Parsen einer Seite:
und 1,475 aus der Tabelle
telle[^"]+[^\,]+[^>]+[^\d]+([\d\,]+)
NUM=0Quick and dirty
-
@homoran ja cool
Ich glaube, die regulären Ausdrücke werde ich nie verstehen. Da ahbe ich wirklich respekt vor den Leuten, die das können.
Die Tabelle ist nun für Dieselkraftstoff... in den anderen Tabellen auf der Seite existiert das Tag
<p>Tankstelle</p>
jetzt zum Glück nicht. Wie sieht das denn aus, wenn ich das von dem Tag<h3><strong>Dieselkraftstoff (/l)</strong></h3>
abhängig machen möchte?EDIT: Hat sich erledigt. Einfach "telle" durch "stoff" ersetzen, dann wird alles berücksichtigt
-
@deralff sagte in Parsen einer Seite:
in den anderen Tabellen auf der Seite existiert das Tag <p>Tankstelle</p> jetzt zum Glück nicht
warum meinst du habe ich das genommen
deswegen brauche ich auch immer den gesamten Quelltext einer Seiteund wenn du beim zweiten Preis (oder überall) noch
ks
voransetzt hast du dort auch nur einen Trefferauch EDIT:
Da hast du aber unheimliches Glück gehabt.
Der Kraftstoff liegt einige Zeilen über der Tankstelle.Dass dann die nächste Sprungmarke
"
dabei nicht noch einmal aufgetreten ist, ist schon fast ein Wunder -
@homoran du musst wissen, ich kann RegEx einfach nicht. Das Interesse wurde eig. nur durch den ioBroker geweckt
... bzw. viel mehr durch diesen Topic hier.
Versuche mich momentan in RegEx einzuarbeiten... das ist allerdings recht mühsam
Ich bin dir jedenfalls sehr sehr dankbar, dass du mir hierbei geholfen hast.
Jetzt muss ich das nurnoch verstehen. Dafür ist das hier allerdings der falsche Topic -
@deralff sagte in Parsen einer Seite:
ich kann RegEx einfach nicht. Das Interesse wurde eig. nur durch den ioBroker geweckt
ging mir genauso
Aber im Gegensatz zu Javascript, wo ich zwar weiß was ich will, oft auch Skripte nachvollziehen kann, aber die Syntax einfach nicht hinbekomme, schaffe ich es hier, weil es keine komplexe Syntax gibt.
@deralff sagte in Parsen einer Seite:
Jetzt muss ich das nurnoch verstehen. Dafür ist das hier allerdings der falsche Topic
Das mit dem verstehen ist das einfachste, aber du musst auch zusehen, dass du die Preise als Nummer mit Komma einpflegst und was du mit dem Datum machst weiß ich gar nicht
Versteh mal
:
- Ankerpunkt (möglichst eindeutig und möglichst diccht an dem gesuchten Wert) suchen:
kstelle
- den Weg zum gewünschten Wert irgendwie eindeutig definieren, erschwerend kommt dazu, dass der ioBroker Parser Zeilenumbrüche (\n) nicht kennt. Also Haltepunkte finden die nicht so häufig vorkommen, hier
"
, also das erste Auftreten finden:[^"]+
(wörtlich: suche Zeichen dass nicht ([^]
) das genannte ("
) ist - beliebig oft (+
) ) - solange mit diesen Haltepunkten weiterhangeln:
[^\,]+[^>]
- bis man an die Zahlen kommt, die man will:
+[^\d]+
- und diese dann als Gruppe deklarieren:
([\d\,]+)
wobei die Zahlen hier aus Ziffern und Komma bestehen
- Ankerpunkt (möglichst eindeutig und möglichst diccht an dem gesuchten Wert) suchen:
-
@homoran hehe, danke für die Erklärung.
Ich versuche dann mal sebstständig an den Steuersatz heran zu kommen.
Zu dem Datum: In Luxemburg sind die Preise an allen Tankstellen gleich, und werden einen Tag vor Preisänderung auf dieser Webseite aktualisiert. Ich reagieren dann einfach auf das Datum und lasse mir das anzeigen bzw. sende mir dann mit meinem signal-cmb Adapter eine Signal Nachricht zu
-
@deralff sagte in Parsen einer Seite:
Ich versuche dann mal sebstständig an den Steuersatz heran zu kommen.
Lass dich nicht veräppeln, das ist wirklich viel einfacher
aber das schaffst du!
-
@homoran said in Parsen einer Seite:
kstelle[^p]+p[^+p]+..(\d+)
Hehe, mein RexEx ist doppelt so lang
Aaaaaaber ich bin dahin gekommen wo ich hin wollte
-
@deralff sagte in Parsen einer Seite:
Hehe, mein RexEx ist doppelt so lang
das hatte ich mir gedacht
Aaaaaaber ich bin dahin gekommen wo ich hin wollte
das auch!
Und das ist das wichtigste. Finetuning kommt mit der ZeitSuper!
-
cih glaube ich hatte mal so eine grundlegende anleitung geschrieben, wie jeder das richtige regex pattern finden kann.
- bei regex101.com die datenquelle bei test eintragen
- möglichst kurzen aber eindeutigen string aus der datenquelle suchen
- den variablen anteil, den man am ende haben möchte eine Klammer setzen ()
- dann diesen Anteil mit Tokens ersetzen. dazu sollte man sich erstmal an die folgenden Tokens halten
a) Meta sequenzen wie bspw \d=digit \w=word \s=whitespace
b) Quantifier: die angeben, wie oft ein Zeichen/Squenz sich wiederholen darf +*?
c) common tokens: wie auswahllisten [a-z] oder alternativen a|b
oder ausschlüsse [^a-z]
damit kommt man schon extrem weit. regex101 hat auch den vorteil, das er die sequenz sprachlich aufteilt und genauer erklärt
Nur bei der übernahme nach iobroker hapert es manchmal, da man im iobroker die optionen nicht genau so übernehmen kann und die interne logik zu den optionen nicht immer ganz einleuchtend ist
-
-
ich muss mich da wieder mal an euch wenden, ich bin fürs Parsen leider echt zu d***.
Vor allem das Skript von @liv-in-sky wäre da wahrscheinlich interessant zu erweitern.
Ich hätte gern von folgender Page link text die ersten 5 Ergebnisse von mir aus als Object in einem Datenpunkt zb so{'id': 'Jet-Hornerstrasse xy', 'Diesel':'1,999|15.03|07:05', 'Benzin:1,899|15:03|07:05'}
Dann könnte ich damit arbeiten. Gibts da was einfaches? vor allem mitn Parser möcht ich das nicht unbedingt machen, da ichs gern per Scheduler dann allo 0,30 Minuten einer Stunde holen möchte.
Danke glg
-
kennst du tankerkönig adapter ?
-
@liv-in-sky said in Parsen einer Seite:
kennst du tankerkönig adapter ?
jaaa, ist der auch für Österreich?
-
@homecineplexx sagte in Parsen einer Seite:
für Österreich?
das hatte ich bei den Preisen schon befürchtet
-
@homoran said in Parsen einer Seite:
@homecineplexx sagte in Parsen einer Seite:
für Österreich?
das hatte ich bei den Preisen schon befürchtet
ist ja auch legitim
-
frag doch mal da nach, ob das noch aktuell ist https://forum.iobroker.net/topic/20314/skripten-des-e-control-spritpreisrechners/281 da sind die österreicher unter sich
bevor wir hier alles neu erfinden
-
@liv-in-sky said in Parsen einer Seite:
frag doch mal da nach, ob das noch aktuell ist https://forum.iobroker.net/topic/20314/skripten-des-e-control-spritpreisrechners/281 da sind die österreicher unter sich
bevor wir hier alles neu erfinden
super, dankeschön...mach ich doch glatt!
-
-
@liv-in-sky said in Parsen einer Seite:
ODER
habe leider noch ein problem mit den umlauten
na das sieht schon sehr fein aus