.NET C# Java Javascript Exception

 | 
Frage stellen Fragen Themen Mitglieder Abzeichen RSS-Feed
2
Nehmen wir eine Datenbank mit den Tabellen 'Bücher' und 'Autoren' als Beispiel.
Jedes mal wenn ein neues Buch in die Datenbank eingetragen wird, wird geprüft der Autor des Buches schon eingetragen ist. Falls ja wird dieser wiederverwendet, statt ein Duplikat zu erzeugen.
Wie aber sollte eine solche Duplikaterkennung implementiert werde, so dass auch verschiedene Schreibvarianten von Namen (z.B. 'J. R. Tolkien', 'John R. Tolkien',...) als gleich erkannt werden?

Für die Duplikaterkennung von Namen gibt es doch bestimmt Liraries. Kennt ihr eine gute? Bitte gebt dabei an in welcher Sprache sie ist.
26.10.09
ermin 1,2k 1 6
Kommentieren - Für Rückfragen oder Anmerkungen
1 Antworten
5
Vorweg, ich halte eine rein automatische Erkennung nicht für sinnvoll, da es durchaus Autoren mit ähnlichen Namen gibt, welche dann falsch zugeordnet würden. Eine Interaktion bei der Eingabe ähnlich Google Maps (mit Nachfrage bei mehreren Änlichkeiten) ist notwendig. Zur Bestimmung der Ähnlichkeit der Strings gab es hier kürzlich ausreichend Antworten. Wenn keine Treffer vorhanden sind kann der Autor neu angelegt werden.
26.10.09
me 786 1 5
me 786 1 5
Deine Antwort
Entweder einloggen... ...oder ohne Wartezeit registrieren
Name
Passwort
Passwort wiederholen
E-Mail
Geworben von


Login mit OpenID

Mit einem OpenID-Account kannst Du dich auf allen Webseiten anmelden, die OpenID unterstützen. Du hast bereits ein Benutzerkonto bei einem der folgenden Provider? Dann kannst Du dich direkt hier damit registrieren.


OpenID-Provider anklicken: