NEWS
Parsen einer Seite
-
cih glaube ich hatte mal so eine grundlegende anleitung geschrieben, wie jeder das richtige regex pattern finden kann.
- bei regex101.com die datenquelle bei test eintragen
- möglichst kurzen aber eindeutigen string aus der datenquelle suchen
- den variablen anteil, den man am ende haben möchte eine Klammer setzen ()
- dann diesen Anteil mit Tokens ersetzen. dazu sollte man sich erstmal an die folgenden Tokens halten
a) Meta sequenzen wie bspw \d=digit \w=word \s=whitespace
b) Quantifier: die angeben, wie oft ein Zeichen/Squenz sich wiederholen darf +*?
c) common tokens: wie auswahllisten [a-z] oder alternativen a|b
oder ausschlüsse [^a-z]
damit kommt man schon extrem weit. regex101 hat auch den vorteil, das er die sequenz sprachlich aufteilt und genauer erklärt
Nur bei der übernahme nach iobroker hapert es manchmal, da man im iobroker die optionen nicht genau so übernehmen kann und die interne logik zu den optionen nicht immer ganz einleuchtend ist
-
-
ich muss mich da wieder mal an euch wenden, ich bin fürs Parsen leider echt zu d***.
Vor allem das Skript von @liv-in-sky wäre da wahrscheinlich interessant zu erweitern.
Ich hätte gern von folgender Page link text die ersten 5 Ergebnisse von mir aus als Object in einem Datenpunkt zb so{'id': 'Jet-Hornerstrasse xy', 'Diesel':'1,999|15.03|07:05', 'Benzin:1,899|15:03|07:05'}
Dann könnte ich damit arbeiten. Gibts da was einfaches? vor allem mitn Parser möcht ich das nicht unbedingt machen, da ichs gern per Scheduler dann allo 0,30 Minuten einer Stunde holen möchte.
Danke glg
-
kennst du tankerkönig adapter ?
-
@liv-in-sky said in Parsen einer Seite:
kennst du tankerkönig adapter ?
jaaa, ist der auch für Österreich?
-
@homecineplexx sagte in Parsen einer Seite:
für Österreich?
das hatte ich bei den Preisen schon befürchtet
-
@homoran said in Parsen einer Seite:
@homecineplexx sagte in Parsen einer Seite:
für Österreich?
das hatte ich bei den Preisen schon befürchtet
ist ja auch legitim
-
frag doch mal da nach, ob das noch aktuell ist https://forum.iobroker.net/topic/20314/skripten-des-e-control-spritpreisrechners/281 da sind die österreicher unter sich
bevor wir hier alles neu erfinden
-
@liv-in-sky said in Parsen einer Seite:
frag doch mal da nach, ob das noch aktuell ist https://forum.iobroker.net/topic/20314/skripten-des-e-control-spritpreisrechners/281 da sind die österreicher unter sich
bevor wir hier alles neu erfinden
super, dankeschön...mach ich doch glatt!
-
-
@liv-in-sky said in Parsen einer Seite:
ODER
habe leider noch ein problem mit den umlauten
na das sieht schon sehr fein aus
-
mit richtigen umlauten - vergiß nicht, du musst axios und cheerio unter zusätzlichen npm modulen in der javascript instanz haben - und mache die abfragen nicht zu oft - manche seiten mögen das nicht !
widget:
script:
-
Habe ebenfalls eine interne Website, von der ich gerne ein paar Werte parsen möchte. Leider steige ich bei Regex immer noch nicht voll durch. Sorry!
Bräuchte die markierten Werte als Zahl/String:
Der HTML Body
Ich hoffe, ihr habt einen Plan
Danke euch!