| 

.NET C# Java Javascript Exception

2
Hallo,

und zwar habe ich einen Datensatz mit vielen verschiedenen Pilzarten gegeben. Diese sollen in essbar und giftig klassifiziert werden. Die Klassifikation erfolg mit k-nearest-neighbours (1) und J48 . Bei beiden Algorithmen ergibt sich eine Präzision von 99,88%. Für mich relevant sind nun die Falsch-Positiv-Raten. Hier weisst J48 eine Rate von 0,3% und KNN eine Rate von 0% auf. Somit würde ich sagen eignet sich für den gewählten Anwendungsfall KNN besser als J48.

Allerdings fällt mir gerade keine Antwort darauf ein warum dies so ist? Hat jemand eine Antwort darauf.

Ps Desweiteren sollte eine 10-fold-cross-validation genutzt werden. Was gibt diese denn genau an?

Vielen Dank im Voraus
13.01.2012
MR 33 5
1 Antwort
0
Ich schätze, bei der 10-fold-cross-validation steckt eine Fuzzy-Suche dahinter. Da Du ja auch im biologischen Bereich hier unterwegs bist, erscheint mir so eine statistische Methode auch wahrscheinlich. Dazu habe ich übrigens eine Seite gefunden:
http://www.cs.auckland.ac.nz/~pat/706_98/ln/node119.html
Ich gehe davon aus, dass der Wert der Ähnlichkeit verbessert werden soll. Ist aber nur eine Vermutung aus meiner Erfahrung mit Ähnlichkeitssuche heraus...
13.01.2012
muffi 1,4k 1 9

Stelle deine Mathematik-Frage jetzt!