Navigation

    Logo
    • Register
    • Login
    • Search
    • Recent
    • Tags
    • Unread
    • Categories
    • Unreplied
    • Popular
    • GitHub
    • Docu
    • Hilfe
    1. Home
    2. Deutsch
    3. Skripten / Logik
    4. Blockly
    5. [gelöst] Funktion gibt kein result aus und JS erweitern

    NEWS

    • Wir empfehlen: Node.js 22.x

    • Neuer Blog: Fotos und Eindrücke aus Solingen

    • ioBroker goes Matter ... Matter Adapter in Stable

    [gelöst] Funktion gibt kein result aus und JS erweitern

    This topic has been deleted. Only users with topic management privileges can see it.
    • OliverIO
      OliverIO @David G. last edited by

      @david-g
      Mir cheerio warst schon mal gut unterwegs.
      Leider muss man da etwas tüfteln. Auch reicht der Ausschnitt einer Seite nicht aus. Das muss man auf Basis der ganzen Seite analysieren.

      Cheerio ist ja die Nachbildung von jquery für den Server (also nodejs)
      Grund Funktion basiert auf den css selektoren.
      https://wiki.selfhtml.org/wiki/CSS/Selektoren
      Darüber kann man mit relativ kurzen Anweisungen irgend ein Element in einer html Seite adressieren und dann auch den Wert auslesen.

      Bin allerdings gerade im Urlaub. Kann erst nächste Woche wieder schauen.
      Ich benötige die url bzw. Einmal den vollständigen Quelltext
      Und die Auflistung welche Tele du genau haben willst

      David G. 1 Reply Last reply Reply Quote 0
      • David G.
        David G. @OliverIO last edited by David G.

        @oliverio

        Cool,

        danke.

        Dann mach jetzt erstmal schön Urlaub.
        Und dann erstmal ganz gemach in den Alltag kommen ^^.


        Die URL ist
        https://www.57trauer.de/traueranzeigen-suche/letzte-14-Tage/seite-1

        Was das aktuelle Skript macht:

        • Den Link zum Bild (Traueranzeige) auslesen und den Fehlenden Teil vor den Pfad setzen.
        • Den title="Traueranzeige von Gertrud Cimander von Siegener Zeitung" auslesen und nur den Text zwischen den beiden "von" nehmen.
        • Am Seitenende die Gesamtseiten mit Ergebnissen erfassen und für die Folgeseiten auch die Daten abrufen (idr um die 30 Seiten).
        • Das alles in eine JSON schreiben

        Was mir fehlt: Die Geburts- und Todesdaten auslesen. * 21.07.1933 - † 04.09.2023. Gerne auch so am Stück als String

        Als Ausschnitt sieht eine Todesanzeige so aus:

        <div class="col-12 d-flex align-items-stretch" >
        
        
        
        <div class="c-blockitem text-center c-blockitem-noborder c-blockitem-nobg c-blockitem-noshadow c-blockitem-heading-center" id="gertrud-cimander">
            
            <div class="c-blockitem-heading"><h2 class="c-blockitem-title"><a href="https://www.57trauer.de/traueranzeige/gertrud-cimander" class="" title="Anzeige Gertrud Cimander geb. Weber"  >Anzeige Gertrud Cimander geb. Weber</a></h2><div  class="c-blockitem-subtitle">* 21.07.1933 - † 04.09.2023</div></div>
        
        
            <div class="mt-3 row">
                            <div class="col-12">
                                   <a href="https://www.57trauer.de/traueranzeige/gertrud-cimander" class="" title="Traueranzeige von Gertrud Cimander von Siegener Zeitung" >
                                        <img src="/MEDIASERVER/content/LH186/obi_new/2023_9/gertrud-cimander-traueranzeige-7f9a6160-32e6-4bee-bdec-faf7b6e08f73.jpg" loading="lazy" class="img-fluid  mb-1 h-auto" title="Traueranzeige von Gertrud Cimander von Siegener Zeitung" alt="Traueranzeige von Gertrud Cimander von Siegener Zeitung"  />
                                    </a>   
                            </div>
                            <div class="col-12 mt-0 pt-0 mb-3">
                                <span class="text-muted"><i class="c-icon c-icon-calendar"></i> veröffentlicht am <strong>06.09.2023</strong> in <strong>Siegener Zeitung</strong></span>
                            </div> 
            </div>
        

        Das ist der ganze Quellcode:
        code.txt

        Und hier mein aktuelles Script:

        const axios = require('axios');
        const cheerio = require('cheerio');
        
        // Die URL-Basis der Webseite
        const baseUrl = 'https://www.57trauer.de/traueranzeigen-suche/letzte-14-Tage/seite-';
        
        // Eine Funktion, um die Anzahl der verfügbaren Seiten zu ermitteln
        async function ermittleAnzahlDerSeiten() {
          try {
            // Die Webseite mit Axios abrufen
            const response = await axios.get(baseUrl + '1');
        
            // Den HTML-Inhalt mit Cheerio analysieren
            const $ = cheerio.load(response.data);
        
            // Das Element mit der Anzahl der Seiten finden und die Anzahl extrahieren
            const anzahlDerSeiten = parseInt($('.pagination li').last().prev().text());
        
            return anzahlDerSeiten;
          } catch (error) {
            console.error('Fehler beim Abrufen der Anzahl der Seiten:', error);
            return 0;
          }
        }
        
        // Eine Funktion, um die Informationen von einer bestimmten Seite zu extrahieren
        async function extrahiereInformationenVonSeite(seite) {
          try {
            // Die Webseite mit Axios abrufen
            const response = await axios.get(baseUrl + seite);
        
            // Den HTML-Inhalt mit Cheerio analysieren
            const $ = cheerio.load(response.data);
        
            // Eine leere Liste für die Ergebnisse
            const ergebnisse = [];
        
            // Alle div-Elemente mit der Klasse "mt-3 row" finden und durch sie iterieren
            $('div.mt-3.row').each((index, div) => {
              const aTag = $(div).find('a');
              if (aTag.length > 0) {
                const titleFull = aTag.attr('title');
                // Den relevanten Text zwischen "Traueranzeige von" und "von Siegener Zeitung" extrahieren
                const match = titleFull.match(/Traueranzeige von (.*?) von Siegener Zeitung/);
                if (match) {
                  const relevantText = match[1];
                  // Den Link zum Bild vor "https://www.57trauer.de" setzen
                  const imgSrc = 'https://www.57trauer.de' + aTag.find('img').attr('src');
                  // Die Informationen in ein Objekt speichern und zur Liste hinzufügen
                  const ergebnis = { title: relevantText, jpg: imgSrc };
                  ergebnisse.push(ergebnis);
                }
              }
            });
        
            return ergebnisse;
          } catch (error) {
            console.error('Fehler beim Extrahieren von Informationen von Seite ' + seite + ':', error);
            return [];
          }
        }
        // Die Anzahl der verfügbaren Seiten ermitteln
        ermittleAnzahlDerSeiten()
          .then(async (anzahlDerSeiten) => {
            if (anzahlDerSeiten > 0) {
              // Eine leere Liste für alle Ergebnisse
              const alleErgebnisse = [];
        
              // Durch alle Seiten iterieren und die Informationen extrahieren
              for (let seite = 1; seite <= anzahlDerSeiten; seite++) {
                const ergebnisseVonSeite = await extrahiereInformationenVonSeite(seite);
                alleErgebnisse.push(...ergebnisseVonSeite);
              }
        
              // Die gesamten Ergebnisse in die Variable "result" speichern
        
              result = JSON.stringify(alleErgebnisse, null, 2);
        
              // Die Informationen aus der Variable "result" über die Konsole ausgeben
              console.log(result);
              setState("0_userdata.0.trauer"/*trauer*/, result, true);
        
            } else {
              console.log('Keine Seiten gefunden.');
            }
          })
          .catch((error) => {
            console.error('Fehler:', error);
          });
        return result
        
        OliverIO 1 Reply Last reply Reply Quote 0
        • OliverIO
          OliverIO @David G. last edited by

          @david-g sagte in Funktion gibt kein result aus und JS Funktion erweitern:

          ah etwas pikante informationen

          du warst schon auf einem guten weg.
          ich habe die einzelnen aufgaben in einzelne funktionen gepackt
          und noch einen useragent-header hinzugefügt, so das der abruf auch so aussieht wie von einem browser
          darüber hinaus habe ich noch geburts und sterbedatum mit in die infos mit reingepackt.
          die bilder habe ich zu einem array gemacht, da es manchmal auch mehrere anzeigen zu einem namen gibt
          den namen habe ich nicht aus dem bild genommen, da es nicht immer ein bild gibt

          const axios = require('axios');
          const cheerio = require('cheerio');
           
          const domain = 'https://www.57trauer.de';   // domain für die bilder
          const baseUrl = 'https://www.57trauer.de/traueranzeigen-suche/letzte-14-Tage/seite-'; //abruf url
          const userAgent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36"; //user agent, so das der abruf wie von einem browser aussieht, ansonsten verwendet axios seinen eigenen ua-string
          let info=[]; //array in dem  alle infos gesammelt werden
          
          async function main() {
          
              let p1 = await readPage(1); //lesen der ersten seite
              let px = await countPages(p1); // ermitteln wieviele seiten
              let p=p1;
              for (var i=2;i<=px;i++) {
                  getInformations(p,info); //informationen je seite einsammeln
                  p=await readPage(i); //nächste seite lesen
                  console.log("page "+i); 
              }
          console.log(info);  //ausgabe aller ergebnisse
          }
          
          //alle informationen einer seite einsammeln
          async function getInformations(data,info) {
              const $ = cheerio.load(data);
              //alle anzeigen einer seite ermitteln und abklappern
              $('.col-12.d-flex.align-items-stretch').each((index, el) => {
                  let obj=[]; //objekt zum einsammeln der informationen zu einer anzeige erzeugen
                  obj.images=getImages(el)||[]; //alle bilder einer anzeige lesen
                  obj.title = getTitle(el)||""; //den namen einer anzeige lesen
                  obj.birth = getBirth(el)||""; //geburtsdatum
                  obj.death = getDeath(el)||""; //sterbedatum
                  info.push(obj);  //alle infos einer anzeige dem array hinzufügen
              });
          }
          //geburtsdatum ermitteln
          function getBirth(data) {
              const $ = cheerio.load(data);
              let match = $(".c-blockitem-subtitle").html().match(/\* ([\d\.]+) - † ([\d\.]+)/);
              if (match) {
                  return match[1];
              } else {
                  return "";
              }
          }
          //sterbedatum ermitteln
          function getDeath(data) {
              const $ = cheerio.load(data);
              let match = $(".c-blockitem-subtitle").html().match(/\* ([\d\.]+) - † ([\d\.]+)/);
              if (match) {
                  return match[2];
              } else {
                  return "";
              }
          }
          //alle anzeigenbilder ermitteln und als array zurückgeben
          function getImages(data) {
              const $ = cheerio.load(data);
              return $("img").map((i,el)=>domain+$(el).attr("src")).toArray();
          }
          //den namen ermitteln und zurückgeben
          function getTitle(data) {
              const $ = cheerio.load(data);
              let title = $("a:first").attr("title").match(/Anzeige (.+)/);
              if (title) {
                  return title[1];
              } else {
                  return "";
              }
          
          }
          //die anzahl aller seiten ermitteln
          async function countPages(data) {
              const $ = cheerio.load(data);
              return parseInt($(".pagination:first .page-item a").eq(-2).html());
          }
          //eine seite mit der angegebenen seitennummer abrufen
          async function readPage(page) {
            try {
              const response = await axios.get(baseUrl + page,{
                  headers: {
                      userAgent: userAgent
                  }
              });
           
              return response.data;
            } catch (error) {
              console.error('Fehler Abruf Seite: '+page, error);
              return 0;
            }
          
          }
          
          main();
          
          
          
          David G. 2 Replies Last reply Reply Quote 1
          • David G.
            David G. @OliverIO last edited by

            @oliverio

            Danke, morgen Abend kann ich es bei mir testen.
            Den ganzen Tag auf Messe.

            1 Reply Last reply Reply Quote 0
            • David G.
              David G. @OliverIO last edited by

              @oliverio

              Hab es jetzt mal in Blockly in einen Funktiobsbaustein gepackt.
              Im Log erhalte ich dann nur ein:

              07:33:26.892	info	javascript.0 (23527) script.js.Eigene_Scripte.Test: []
              

              Ist es möglich das JSON mit den Daten in einen DP zu schreiben oder in die Variable "result" (Die Variable darf aber wie ich weiter oben gelesen habe nicht definiert sein, damit mir der Blockly Block diese zurückgeben kann).

              Die JSON kann ich dann schön in Blockly weiterverarbeiten.
              47cdb9a5-5c45-4c49-873a-4e0127e20d98-image.png

              OliverIO 1 Reply Last reply Reply Quote 0
              • OliverIO
                OliverIO @David G. last edited by

                @david-g
                Mit blockly kenne ich mich nicht so aus.
                Am besten du schreibst das in ein JavaScript script

                In einen datenpunkt Schreiben kannst du es mit setState in Zeile 19
                Dein blockly trigger dann am besten auf Änderung dieses datenpunktes

                David G. 1 Reply Last reply Reply Quote 0
                • David G.
                  David G. @OliverIO last edited by

                  @oliverio

                  Wenn ich es in ein JS Skript einfüge bekomme ich auch kein Ergebnis:

                  07:23:34.119	info	javascript.0 (23527) Start javascript script.js.Eigene_Scripte.trauertest
                  07:23:34.129	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: registered 0 subscriptions, 0 schedules, 0 messages, 0 logs and 0 file subscriptions
                  07:23:35.589	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: []
                  
                  OliverIO 1 Reply Last reply Reply Quote 0
                  • OliverIO
                    OliverIO @David G. last edited by OliverIO

                    @david-g

                    wenn du in das script gegangen bist und es laufen lassen hast, sind da keine Meldungen gekommen?

                    Leider können die Variationen in der Ausgabe relativ vielfältig sein. Wenn die nicht berücksichtigt werden, dann führt das zu fehlern, die behoben werden müssen.

                    Bei den aktuellen Anzeigen, waren welche ohne Geburtsdatum oder gar komplett ohne Daten dabei.
                    Das ist jetzt in der folgenden Version berücksichtigt.

                    Ausserdem hab ich noch einen Fehler korrigiert, bei dem sich der Lauf des Skriptes in vscode zu iobroker unterscheidet

                    const axios = require('axios');
                    const cheerio = require('cheerio');
                     
                    const domain = 'https://www.57trauer.de';   // domain für die bilder
                    const baseUrl = 'https://www.57trauer.de/traueranzeigen-suche/letzte-14-Tage/seite-'; //abruf url
                    const userAgent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36"; //user agent, so das der abruf wie von einem browser aussieht, ansonsten verwendet axios seinen eigenen ua-string
                    let info=[]; //array in dem  alle infos gesammelt werden
                    
                    async function main() {
                    
                        let p1 = await readPage(1); //lesen der ersten seite
                        let px = await countPages(p1); // ermitteln wieviele seiten
                        console.log("Anzahl Seiten "+px)
                        let p=p1;
                        for (var i=2;i<=px;i++) {
                            getInformations(p,info); //informationen je seite einsammeln
                            p=await readPage(i); //nächste seite lesen
                        }
                    console.log(info);  //ausgabe aller ergebnisse
                    }
                    
                    //alle informationen einer seite einsammeln
                    async function getInformations(data,info) {
                        const $ = cheerio.load(data);
                        //alle anzeigen einer seite ermitteln und abklappern
                        $('.col-12.d-flex.align-items-stretch').each((index, el) => {
                            let obj={}; //objekt zum einsammeln der informationen zu einer anzeige erzeugen
                            obj.images=getImages(el)||[]; //alle bilder einer anzeige lesen
                            obj.title = getTitle(el)||""; //den namen einer anzeige lesen
                            obj.birth = getBirth(el)||""; //geburtsdatum
                            obj.death = getDeath(el)||""; //sterbedatum
                            info.push(obj);  //alle infos einer anzeige dem array hinzufügen
                        });
                    }
                    //geburtsdatum ermitteln
                    function getBirth(data) {
                        const $ = cheerio.load(data);
                        let html=$(".c-blockitem-subtitle").html();
                        if (!html) return "";
                        let match = html.match(/\* ([\d\.]+)/);
                        if (match) {
                            return match[1];
                        } else {
                            return "";
                        }
                    }
                    //sterbedatum ermitteln
                    function getDeath(data) {
                        const $ = cheerio.load(data);
                        let html=$(".c-blockitem-subtitle").html();
                        if (!html) return "";
                        let match = html.match(/ - † ([\d\.]+)/);
                        if (match) {
                            return match[1];
                        } else {
                            return "";
                        }
                    }
                    //alle anzeigenbilder ermitteln und als array zurückgeben
                    function getImages(data) {
                        const $ = cheerio.load(data);
                        return $("img").map((i,el)=>domain+$(el).attr("src")).toArray();
                    }
                    //den namen ermitteln und zurückgeben
                    function getTitle(data) {
                        const $ = cheerio.load(data);
                        let title = $("a:first").attr("title").match(/Anzeige (.+)/);
                        if (title) {
                            return title[1];
                        } else {
                            return "";
                        }
                    
                    }
                    //die anzahl aller seiten ermitteln
                    async function countPages(data) {
                        const $ = cheerio.load(data);
                        return parseInt($(".pagination:first .page-item a").eq(-2).html());
                    }
                    //eine seite mit der angegebenen seitennummer abrufen
                    async function readPage(page) {
                      try {
                        const response = await axios.get(baseUrl + page,{
                            headers: {
                                userAgent: userAgent
                            }
                        });
                    console.log("page "+page); 
                    console.log("status "+response.status); 
                     
                        return response.data;
                      } catch (error) {
                        console.error('Fehler Abruf Seite: '+page, error);
                        return 0;
                      }
                    
                    }
                    
                    main();
                    
                    
                    David G. 1 Reply Last reply Reply Quote 0
                    • David G.
                      David G. @OliverIO last edited by

                      @oliverio

                      Das möchte auch nicht.
                      Am Stück in ein JS Skript kopiert und wie es ist abgespeichert.

                      Mehr kommt nicht:

                      14:32:14.564	info	javascript.0 (23527) Stop script script.js.Eigene_Scripte.trauertest
                      14:32:14.569	info	javascript.0 (23527) Start javascript script.js.Eigene_Scripte.trauertest
                      14:32:14.579	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: registered 0 subscriptions, 0 schedules, 0 messages, 0 logs and 0 file subscriptions
                      14:32:14.959	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: []
                      
                      OliverIO 1 Reply Last reply Reply Quote 0
                      • OliverIO
                        OliverIO @David G. last edited by OliverIO

                        @david-g

                        das was du da kopierst, sieht immer so aus, als ob du es aus dem iobroker-log nimmst.
                        kannst du bitte mal hier schauen?
                        www_screencapture_com_2023-9-14_14_49.mp4

                        mit dem original skript wird dann am ende in dem log, das array ausgegeben.

                        ich habe oben mal noch eine debug-zeile eingefügt, bitte script nochmal aktualisieren

                        David G. 1 Reply Last reply Reply Quote 0
                        • David G.
                          David G. @OliverIO last edited by

                          @oliverio

                          So ist es bei mir:

                          drop.gif

                          OliverIO 1 Reply Last reply Reply Quote 0
                          • OliverIO
                            OliverIO @David G. last edited by OliverIO

                            @david-g

                            ok,
                            und axios und cheerio ist auch in den Einstellungen des javascript adapters als zusätzliche module eingetragen?

                            es sieht so aus, wie wenn der seitenabruf von axios nicht geht, allerdings ohne eine fehlermeldung zu werfen.
                            ich habe hier nochmal ein paar mehr debug outputs reingemacht.

                            const axios = require('axios');
                            const cheerio = require('cheerio');
                             
                            const domain = 'https://www.57trauer.de';   // domain für die bilder
                            const baseUrl = 'https://www.57trauer.de/traueranzeigen-suche/letzte-14-Tage/seite-'; //abruf url
                            const userAgent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36"; //user agent, so das der abruf wie von einem browser aussieht, ansonsten verwendet axios seinen eigenen ua-string
                            let info=[]; //array in dem  alle infos gesammelt werden
                            
                            async function main() {
                            console.log("F main "); 
                            
                                let p1 = await readPage(1); //lesen der ersten seite
                            console.log(p1);  //ausgabe aller ergebnisse
                                let px = await countPages(p1); // ermitteln wieviele seiten
                                console.log("Anzahl Seiten "+px)
                                let p=p1;
                                for (var i=2;i<=px;i++) {
                                    getInformations(p,info); //informationen je seite einsammeln
                                    p=await readPage(i); //nächste seite lesen
                                }
                            console.log(info);  //ausgabe aller ergebnisse
                            }
                            
                            //alle informationen einer seite einsammeln
                            async function getInformations(data,info) {
                                const $ = cheerio.load(data);
                                //alle anzeigen einer seite ermitteln und abklappern
                                $('.col-12.d-flex.align-items-stretch').each((index, el) => {
                                    let obj={}; //objekt zum einsammeln der informationen zu einer anzeige erzeugen
                                    obj.images=getImages(el)||[]; //alle bilder einer anzeige lesen
                                    obj.title = getTitle(el)||""; //den namen einer anzeige lesen
                                    obj.birth = getBirth(el)||""; //geburtsdatum
                                    obj.death = getDeath(el)||""; //sterbedatum
                                    info.push(obj);  //alle infos einer anzeige dem array hinzufügen
                                });
                            }
                            //geburtsdatum ermitteln
                            function getBirth(data) {
                                const $ = cheerio.load(data);
                                let html=$(".c-blockitem-subtitle").html();
                                if (!html) return "";
                                let match = html.match(/\* ([\d\.]+)/);
                                if (match) {
                                    return match[1];
                                } else {
                                    return "";
                                }
                            }
                            //sterbedatum ermitteln
                            function getDeath(data) {
                                const $ = cheerio.load(data);
                                let html=$(".c-blockitem-subtitle").html();
                                if (!html) return "";
                                let match = html.match(/ - † ([\d\.]+)/);
                                if (match) {
                                    return match[1];
                                } else {
                                    return "";
                                }
                            }
                            //alle anzeigenbilder ermitteln und als array zurückgeben
                            function getImages(data) {
                                const $ = cheerio.load(data);
                                return $("img").map((i,el)=>domain+$(el).attr("src")).toArray();
                            }
                            //den namen ermitteln und zurückgeben
                            function getTitle(data) {
                                const $ = cheerio.load(data);
                                let title = $("a:first").attr("title").match(/Anzeige (.+)/);
                                if (title) {
                                    return title[1];
                                } else {
                                    return "";
                                }
                            
                            }
                            //die anzahl aller seiten ermitteln
                            async function countPages(data) {
                                const $ = cheerio.load(data);
                                return parseInt($(".pagination:first .page-item a").eq(-2).html());
                            }
                            //eine seite mit der angegebenen seitennummer abrufen
                            async function readPage(page) {
                            console.log("F readPage "); 
                              try {
                                const response = await axios.get(baseUrl + page,{
                                    headers: {
                                        userAgent: userAgent
                                    }
                                });
                            console.log("page "+page); 
                            console.log("status "+response.status); 
                             
                                return response.data;
                              } catch (error) {
                                console.error('Fehler Abruf Seite: '+page, error);
                                return 0;
                              }
                            
                            }
                            
                            main();
                            
                            
                            David G. 1 Reply Last reply Reply Quote 0
                            • David G.
                              David G. @OliverIO last edited by David G.

                              @oliverio

                              Jetzt kommt im Log:

                              9:51:07.191	info	javascript.0 (23527) Stop script script.js.Eigene_Scripte.trauertest
                              09:51:07.243	info	javascript.0 (23527) Start javascript script.js.Eigene_Scripte.trauertest
                              09:51:07.252	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: F main
                              09:51:07.252	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: F readPage
                              09:51:07.254	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: registered 0 subscriptions, 0 schedules, 0 messages, 0 logs and 0 file subscriptions
                              09:51:08.633	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: page 1
                              09:51:08.633	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: status 200
                              09:51:08.633	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: <!DOCTYPE html> <html lang="de" dir="ltr"> <head> <meta charset="utf-8" /> <meta http-equiv="X-UA-Compatible" content="IE=edge" /> <meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no" /> <meta name="description" content="Lesen Sie aktuelle Traueranzeigen und Todesanzeigen der letzten 14 Tage aus Ihrer Tageszeitung und gedenken Sie Ihren Verstorbenen." /> <link rel="canonical" href="https://www.57trauer.de/traueranzeigen-suche/letzte-14-tage/seite-1" /> <meta property="og:title" content="Traueranzeigen der letzten 14 Tage | 57trauer.de" /> <meta property="og:description" content="..............
                              09:51:08.680	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: Anzahl Seiten NaN
                              09:51:08.680	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: []
                              

                              (Zeile 11 steht nicht im Log, macht das Forum irgendwie da hin ....)
                              axios und cheeriosind aktiv. "Mein" Skript lauft ja durch und braucht auch beides.

                              OliverIO 1 Reply Last reply Reply Quote 0
                              • OliverIO
                                OliverIO @David G. last edited by

                                @david-g said in Funktion gibt kein result aus und JS Funktion erweitern:

                                t: <!DOCTYPE html> <html lang="de" dir="ltr"> <head> <meta charset="utf-8" /> <meta http-equiv="X-UA-Compatible" content="IE=edge" /> <meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no" /> <meta name="description" content="Lesen Sie aktuelle Traueranzeigen und Todesanzeigen der letzten 14 Tage aus Ihrer Tageszeitung und gedenken Sie Ihren Verstorbenen." /> <link rel="canonical" href="https://www.57trauer.de/traueranzeigen-suche/letzte-14-tage/seite-1" /> <meta property="og:title" content="Traueranzeigen der letzten 14 Tage | 57trauer.

                                ok,
                                also seite 1 wird abgerufen,
                                aber die Anzahl der Seiten kann nicht ermittelt werden.
                                Bist du mit einem Account dort angemeldet?
                                Irgendwie ist da die Seite anders aufgebaut, so das er die Zahl nicht findet
                                Hab gerade bei mir nochmal probiert. Da klappt es jedes mal.
                                Kannst du das ausgegebenen HTML, welches nur gekürzt angezeigt wird, hier posten? Dann kann ich schauen warum er die Zahl nicht findet.

                                David G. 1 Reply Last reply Reply Quote 0
                                • David G.
                                  David G. @OliverIO last edited by

                                  @oliverio

                                  Anbei das ganze Log mit Quellcode:
                                  log.txt

                                  Hier der Bereich mit den Seitenzahlen:

                                                       <ul class="pagination">
                                  
                                                                                            <li class="page-item active"><a class="page-link" href="/traueranzeigen-suche/letzte-14-Tage/seite-1">1</a></li>
                                                                   <li class="page-item"><a class="page-link" href="/traueranzeigen-suche/letzte-14-Tage/seite-2">2</a></li>
                                                                   <li class="page-item"><a class="page-link" href="/traueranzeigen-suche/letzte-14-Tage/seite-3">3</a></li>
                                                                   <li class="page-item"><a class="page-link" href="/traueranzeigen-suche/letzte-14-Tage/seite-4">4</a></li>
                                                                   <li class="page-item"><a class="page-link" href="/traueranzeigen-suche/letzte-14-Tage/seite-5">5</a></li>
                                                                   <li class="page-item"><a class="page-link" href="/traueranzeigen-suche/letzte-14-Tage/seite-6">6</a></li>
                                                                   <li class="page-item"><a class="page-link" href="/traueranzeigen-suche/letzte-14-Tage/seite-7">7</a></li>
                                                                   <li class="page-item">...</li>
                                                                   <li class="page-item"><a class="page-link" href="/traueranzeigen-suche/letzte-14-Tage/seite-24">24</a></li>
                                  
                                                               <li class="page-item"><a class="page-link" href="/traueranzeigen-suche/letzte-14-Tage/seite-2">></a></li>
                                                       </ul>
                                  
                                  OliverIO 1 Reply Last reply Reply Quote 0
                                  • OliverIO
                                    OliverIO @David G. last edited by

                                    @david-g

                                    leider sieht das normal aus.
                                    das folgende skript nochmal mit weiteren debug ausgaben
                                    Interessant wäre die Seite mit der folgenden Ausgabe oder so ähnlich:

                                    Element Anzahl Seiten:<a class="page-link" href="/traueranzeigen-suche/letzte-14-Tage/seite-24">24</a>
                                    
                                    
                                    const axios = require('axios');
                                    const cheerio = require('cheerio');
                                     
                                    const domain = 'https://www.57trauer.de';   // domain für die bilder
                                    const baseUrl = 'https://www.57trauer.de/traueranzeigen-suche/letzte-14-Tage/seite-'; //abruf url
                                    const userAgent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36"; //user agent, so das der abruf wie von einem browser aussieht, ansonsten verwendet axios seinen eigenen ua-string
                                    let info=[]; //array in dem  alle infos gesammelt werden
                                    
                                    async function main() {
                                    console.log("F main "); 
                                    
                                        let p1 = await readPage(1); //lesen der ersten seite
                                        let px = await countPages(p1); // ermitteln wieviele seiten
                                        console.log("Anzahl Seiten "+px)
                                        let p=p1;
                                        for (var i=2;i<=px;i++) {
                                            getInformations(p,info); //informationen je seite einsammeln
                                            p=await readPage(i); //nächste seite lesen
                                        }
                                    console.log(info);  //ausgabe aller ergebnisse
                                    }
                                    
                                    //alle informationen einer seite einsammeln
                                    async function getInformations(data,info) {
                                        const $ = cheerio.load(data);
                                        //alle anzeigen einer seite ermitteln und abklappern
                                        $('.col-12.d-flex.align-items-stretch').each((index, el) => {
                                            let obj={}; //objekt zum einsammeln der informationen zu einer anzeige erzeugen
                                            obj.images=getImages(el)||[]; //alle bilder einer anzeige lesen
                                            obj.title = getTitle(el)||""; //den namen einer anzeige lesen
                                            obj.birth = getBirth(el)||""; //geburtsdatum
                                            obj.death = getDeath(el)||""; //sterbedatum
                                            info.push(obj);  //alle infos einer anzeige dem array hinzufügen
                                        });
                                    }
                                    //geburtsdatum ermitteln
                                    function getBirth(data) {
                                        const $ = cheerio.load(data);
                                        let html=$(".c-blockitem-subtitle").html();
                                        if (!html) return "";
                                        let match = html.match(/\* ([\d\.]+)/);
                                        if (match) {
                                            return match[1];
                                        } else {
                                            return "";
                                        }
                                    }
                                    //sterbedatum ermitteln
                                    function getDeath(data) {
                                        const $ = cheerio.load(data);
                                        let html=$(".c-blockitem-subtitle").html();
                                        if (!html) return "";
                                        let match = html.match(/ - † ([\d\.]+)/);
                                        if (match) {
                                            return match[1];
                                        } else {
                                            return "";
                                        }
                                    }
                                    //alle anzeigenbilder ermitteln und als array zurückgeben
                                    function getImages(data) {
                                        const $ = cheerio.load(data);
                                        return $("img").map((i,el)=>domain+$(el).attr("src")).toArray();
                                    }
                                    //den namen ermitteln und zurückgeben
                                    function getTitle(data) {
                                        const $ = cheerio.load(data);
                                        let title = $("a:first").attr("title").match(/Anzeige (.+)/);
                                        if (title) {
                                            return title[1];
                                        } else {
                                            return "";
                                        }
                                    
                                    }
                                    //die anzahl aller seiten ermitteln
                                    async function countPages(data) {
                                        const $ = cheerio.load(data);
                                        console.log($(".pagination:first .page-item a").eq(-2).prop("outerHTML"));
                                        return parseInt($(".pagination:first .page-item a").eq(-2).html());
                                    }
                                    //eine seite mit der angegebenen seitennummer abrufen
                                    async function readPage(page) {
                                    console.log("F readPage "); 
                                      try {
                                        const response = await axios.get(baseUrl + page,{
                                            headers: {
                                                userAgent: userAgent
                                            }
                                        });
                                    console.log("page "+page); 
                                    console.log("status "+response.status); 
                                     
                                        return response.data;
                                      } catch (error) {
                                        console.error('Fehler Abruf Seite: '+page, error);
                                        return 0;
                                      }
                                    
                                    }
                                    
                                    main();
                                    
                                    
                                    
                                    David G. 1 Reply Last reply Reply Quote 0
                                    • David G.
                                      David G. @OliverIO last edited by

                                      @oliverio

                                      Komische Sache, dass es bei dir geht und bei mir nicht.
                                      Hab eben ganz vergessen drauf zu Antworten. Ich habe dort keinen Account oder ähnliches.

                                      Anbei das Log der neuen Version:

                                      15:53:54.279	info	javascript.0 (23527) Start javascript script.js.Eigene_Scripte.trauertest
                                      15:53:54.287	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: F main
                                      15:53:54.287	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: F readPage
                                      15:53:54.289	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: registered 0 subscriptions, 0 schedules, 0 messages, 0 logs and 0 file subscriptions
                                      15:53:54.590	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: page 1
                                      15:53:54.590	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: status 200
                                      15:53:54.641	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: null
                                      15:53:54.642	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: Anzahl Seiten NaN
                                      15:53:54.642	info	javascript.0 (23527) script.js.Eigene_Scripte.trauertest: []
                                      
                                      OliverIO 1 Reply Last reply Reply Quote 0
                                      • OliverIO
                                        OliverIO @David G. last edited by

                                        @david-g
                                        Also sehr seltsam.
                                        Ich habe die Seite die im log enthalten ist untersucht. Von der Struktur passt alles und die letzte Seite ist auffindbar.
                                        Das Ergebnis des letzten logs sagt mir das er aber das Element wo das drin steht nicht findet (null) und dann daher auch keine Zahl daraus extrahieren kann.
                                        Bei mir klappt das. Hier können auch keine Browser Unterschiede wirken da die Daten ja nur technisch abgerufen werden ohne das da noch ein Browser dazwischenfummelt
                                        Mir würde jetzt noch versionsstände von axios oder besser noch cheerio interessieren
                                        Um den genauen Unterschied ausmachen zu können.
                                        Das einfachste aber dürfte sein deine suchmethode zu nehmen die ja die Seriennummer wohl findet

                                        David G. 1 Reply Last reply Reply Quote 0
                                        • David G.
                                          David G. @OliverIO last edited by

                                          @oliverio sagte in Funktion gibt kein result aus und JS Funktion erweitern:

                                          Das einfachste aber dürfte sein deine suchmethode zu nehmen die ja die Seriennummer wohl findet

                                          Meine ist weit hergeholt.
                                          Ich musste googlen wie der trigger auszusehen hat oder es mir in der js Ansicht von einem Blockly abschreiben 🤣

                                          OliverIO 1 Reply Last reply Reply Quote 0
                                          • OliverIO
                                            OliverIO @David G. last edited by OliverIO

                                            @david-g

                                            so hier nochmal mit deiner suchmethode nach der seitenanzahl

                                            
                                            const axios = require('axios');
                                            const cheerio = require('cheerio');
                                             
                                            const domain = 'https://www.57trauer.de';   // domain für die bilder
                                            const baseUrl = 'https://www.57trauer.de/traueranzeigen-suche/letzte-14-Tage/seite-'; //abruf url
                                            const userAgent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36"; //user agent, so das der abruf wie von einem browser aussieht, ansonsten verwendet axios seinen eigenen ua-string
                                            let info=[]; //array in dem  alle infos gesammelt werden
                                            
                                            async function main() {
                                            console.log("F main "); 
                                            
                                                let p1 = await readPage(1); //lesen der ersten seite
                                                let px = await countPages(p1); // ermitteln wieviele seiten
                                                console.log("Anzahl Seiten "+px)
                                                let p=p1;
                                                for (var i=2;i<=px;i++) {
                                                    getInformations(p,info); //informationen je seite einsammeln
                                                    p=await readPage(i); //nächste seite lesen
                                                }
                                            console.log(info);  //ausgabe aller ergebnisse
                                            }
                                            
                                            //alle informationen einer seite einsammeln
                                            async function getInformations(data,info) {
                                                const $ = cheerio.load(data);
                                                //alle anzeigen einer seite ermitteln und abklappern
                                                $('.col-12.d-flex.align-items-stretch').each((index, el) => {
                                                    let obj={}; //objekt zum einsammeln der informationen zu einer anzeige erzeugen
                                                    obj.images=getImages(el)||[]; //alle bilder einer anzeige lesen
                                                    obj.title = getTitle(el)||""; //den namen einer anzeige lesen
                                                    obj.birth = getBirth(el)||""; //geburtsdatum
                                                    obj.death = getDeath(el)||""; //sterbedatum
                                                    info.push(obj);  //alle infos einer anzeige dem array hinzufügen
                                                });
                                            }
                                            //geburtsdatum ermitteln
                                            function getBirth(data) {
                                                const $ = cheerio.load(data);
                                                let html=$(".c-blockitem-subtitle").html();
                                                if (!html) return "";
                                                let match = html.match(/\* ([\d\.]+)/);
                                                if (match) {
                                                    return match[1];
                                                } else {
                                                    return "";
                                                }
                                            }
                                            //sterbedatum ermitteln
                                            function getDeath(data) {
                                                const $ = cheerio.load(data);
                                                let html=$(".c-blockitem-subtitle").html();
                                                if (!html) return "";
                                                let match = html.match(/ - † ([\d\.]+)/);
                                                if (match) {
                                                    return match[1];
                                                } else {
                                                    return "";
                                                }
                                            }
                                            //alle anzeigenbilder ermitteln und als array zurückgeben
                                            function getImages(data) {
                                                const $ = cheerio.load(data);
                                                return $("img").map((i,el)=>domain+$(el).attr("src")).toArray();
                                            }
                                            //den namen ermitteln und zurückgeben
                                            function getTitle(data) {
                                                const $ = cheerio.load(data);
                                                let title = $("a:first").attr("title").match(/Anzeige (.+)/);
                                                if (title) {
                                                    return title[1];
                                                } else {
                                                    return "";
                                                }
                                            
                                            }
                                            //die anzahl aller seiten ermitteln
                                            async function countPages(data) {
                                                const $ = cheerio.load(data);
                                                return parseInt($('.pagination li').last().prev().text());
                                                //return parseInt($(".pagination:first .page-item a").eq(-2).html());
                                            }
                                            //eine seite mit der angegebenen seitennummer abrufen
                                            async function readPage(page) {
                                            console.log("F readPage "); 
                                              try {
                                                const response = await axios.get(baseUrl + page,{
                                                    headers: {
                                                        userAgent: userAgent
                                                    }
                                                });
                                            console.log("page "+page); 
                                            console.log("status "+response.status); 
                                             
                                                return response.data;
                                              } catch (error) {
                                                console.error('Fehler Abruf Seite: '+page, error);
                                                return 0;
                                              }
                                            
                                            }
                                            
                                            main();
                                            
                                            
                                            
                                            David G. 1 Reply Last reply Reply Quote 0
                                            • First post
                                              Last post

                                            Support us

                                            ioBroker
                                            Community Adapters
                                            Donate

                                            865
                                            Online

                                            32.0k
                                            Users

                                            80.4k
                                            Topics

                                            1.3m
                                            Posts

                                            3
                                            32
                                            936
                                            Loading More Posts
                                            • Oldest to Newest
                                            • Newest to Oldest
                                            • Most Votes
                                            Reply
                                            • Reply as topic
                                            Log in to reply
                                            Community
                                            Impressum | Datenschutz-Bestimmungen | Nutzungsbedingungen
                                            The ioBroker Community 2014-2023
                                            logo