Falls Du es nicht weisst: Diese Seite funktioniert nach dem Prinzip, das man Antworten bewertet und richtige Antworten als solche Kennzeichnet, da die User hier kostenlos helfen und nur durch Reputation "belohnt" werden.
Du schreibst leider nicht, in welcher Programmiersprache Du arbeitest. Deshalb wähle ich erst einmal C#. Das Du die Datei selber einlesen kannst, setzte ich gerade voraus. Ansonsten müsstest Du schon konkrete Hinweise auf die gewünsche Sprache mitteilen.
Hier noch ein weiterer Link mit umfangreicheren regulären Ausdrücken
Und zwei Möglichkeiten mit Java (Regex und javax.swing.text.html.HTMLEditorKit)
Edit: Wenn wir schon einmal dabei sind, es geht auch komplett ohne Programmierkenntnisse. Für Firefox gibt es ein Plugin, welches das Kontextmenü bei markiertem Text erweitert.
Du öffnest dann mit Firefox die HTML-Seite, markierst alles mit Strg + A und wählst dann im Kontextmenü "Kopieren ohne Formatierung". Et voila. Zudem hat es den Vorteil, das Du auch nur Teile der HTML-Seite markieren kannst. Ist natürlich nur eine "für Zwischendurch"-Lösung, falls es Dir speziell nur manuell um einzelne Webseiten geht.
public static string StripTags(this string html, string allowedTags) { var tags = (from Match m in TagRegex.Matches(allowedTags) select m.Groups["TagName"].Value).ToList();
Solch komplizierte Probleme kann man nur mit einer richtigen Programmiersprache (VBScript) lösen:
Dim sURL : sURL = "http://codekicker.de/" Dim oHTMLFile : Set oHTMLFile = CreateObject( "HTMLFILE" ) Dim oXMLHTTP : Set oXMLHTTP = CreateObject( "Msxml2.XMLHTTP" ) oXMLHTTP.Open "GET", sURL, False oXMLHTTP.Send
With oHTMLFile .Open .Write oXMLHTTP.responseText .Close WScript.Echo .body.innerText End With
(gekürzte) Ausgabe:
getText - get text from .html -------------------------------------------------------------------------------
login |
Frage stellen Fragen ansehen Mehr... » Themen » Mitglieder » Abzeichen » Ranking » Blog » RSS-Feed » FAQ » Feedback» Startseite 2 Bewertungen 1 Antwort 5 Aufrufe WPF TreeView-Knoten an Mausposition Ich würde gerne in einem WPF-TreeView das Item an der aktuellen Mausposition ermitteln. Leider finde ich keine Methode "GetNodeAt" oder ähnliches. Wie löst man das Problem also... thomas.ccgdev 43 vor 104m .... +712 Joachim 712 ● 7