Diskussion:Inverse Dokumenthäufigkeit

Letzter Kommentar: vor 13 Jahren von White rotten rabbit

Ist die Addition mit 1 wirklich notwendig?

Der Quotient kann nicht kleiner als 1 sein, denn dann müßte es mehr Dokumente die den Term enthalten geben als es Dokumente gibt, und das kann nicht sein. --LarsT 17:24, 12. Okt. 2006 (CEST)Beantworten

Nach über vier Jahren hat sich noch keiner dazu geäußert? Hmm... Also dass der Quotient nie kleiner als 1 sein kann, stimmt natürlich. Das einzige, was mir dazu einfällt, ist wenn Term t in jedem Dokument auftritt. Dann berechnet man log(1), was natürlich 0 ist. Nun möchte man vielleicht als IDF-Wert keine Null haben (etwa bei der Berechnung von TF-IDF), also schlägt man eine Eins drauf. Aber vielleicht gibt es einen ganz anderen Grund dafür? -- White rotten rabbit 13:30, 7. Apr. 2011 (CEST)Beantworten

es muss log zur Basis 2 heißen oder? (nicht signierter Beitrag von 88.72.237.68 (Diskussion) 12:14, 23. Jul 2012 (CEST))