Ich will zwei Strings auf Ähnlichkeit vergleichen. Bevor ich das tu will ich sie aber normalisieren (ich hoffe ich verwende hier den richtigen Begriff). D.h. ich will aus den Strings alle Sonderzeichen entfernen, ins Lowercase umwandeln, unnötige Whitespaces entfernen... Dafür gibt es doch sicherlich eine Library/Funktion in Java.
Eine Funktion die alles was du willst auf einmal macht kenn ich nicht, aber ein String bietet z.B. folgende methoden: toLowerCase() oder auch trim()(entfernt Leerzeichen an Anfang und Ende) was dir auf jeden Fall schon mal weiterhelfen sollte.
Was du mit sonderzeichen entfernen meinst weiss ich nicht genau, aber replace(oldChar, newChar) koennte dir helfen ...
Hoffe das ist in etwa das was du suchst. Das entfernt aber nur gewisse Sonderzeichen. Wenn du äöü, ÄÖÜ und +- auch noch entfernen willst musst du den verwendeten RegEx anpassen.
Ich glaub die Levenshtein Distanz ist hier ein bisschen Overkill, obwohl sie zugleich natürlich den schönsten Weg bietet Ähnlichkeiten aufzuspüren! Aber das kommt natürlich auch immer darauf an, was der Entwickler explizit vor hat :-)