| 

.NET C# Java Javascript Exception

2
Hallo codekicker,

ich habe folgendes Problem:
Bisher kopiere ich Webseiten und lasse diese durch ein Makro in Excel auswerten um daraus aus bestimmten Teilen ein PDF zu generieren...

Jetzt funktioniert das nicht mehr zu 100% da einiges geändert wure auf dieser Website.
Jetzt habe ich gesehen wenn ich Rechtsklick mache und dann auf "Inspect element" gehe dort die Informationen alles vorhanden sind, im HTML Code, die ich brauche. Zu beachten wäre das ich auf "Inspect element" und nciht auf "View page source" bin...

Jetzt wollte ich wissen ob ich irgendwie ein Tool programmieren kann das mir den HTMLcode durchschaut und bestimmte Dinge herausfiltert interpretiert und in Excel einfügt, damit ich dann in Excel das PDF generieren kann ohne das ich noch was tun muss.

Beispiel:
Wenn wir die Oberfläche eines Google Play Stores haben und dort eine Bewertung bei den Kommentaren steht... dann ist in dem HTMLcode beispielsweiße ein Abschnitt-->
<span title="4 stars out of 5" class="EUXIYE-Oc-k"><span class="EUXIYE-bi-e EUXIYE-bi-b"></span>n>

Daraus soll dann in dem Excel eine Anzeige mit vier Sternen entstehen ....

Bei Fragen bezüglich verstänlichkeit meiner Frage einfach kommentiren :)

Danke schonmal
Elmar
10.09.2015
sielbick 1 1
1 Antwort
0
Wenn ich die Anfrage richtig verstanden habe, dann läuft das Ganze auf eine geschickte Suche hinaus.

Man konnte also z.B. mit RegExp nach dem Vorkommen von Tags suchen und anschließend den Text ab da auswerten. Ist die Auswertung beendet, wird nach dem nächsten Vorkommen gesucht.

Der wichtigste Punkt wäre also: Lassen sich korrekte Suchbegriffe formulieren, die das Finden der entsprechenden Stellen erlauben.
Im Beispiel bietet sich der title oder class an.
RegExp-Vorschlag für title: /\d stars out of 5/ - hier sehr vereinfacht.
Vorschlag für class: direkt nach EUXIYE-Oc-k suchen

Vielleicht hilft dies schon weiter.
16.09.2015
edvservice 1,4k 1 6

Stelle deine Html-Frage jetzt!
TOP TECHNOLOGIES CONSULTING GmbH