Hintergrundinformationen zu den neuen automatischen Tagvorschlägen von Lycos iQ

COSMiQ (vormals LYCOS iQ) wurde zum 03. April 2018 eingestellt. Die Informationen auf dieser Seite werden nicht mehr aktualisiert, die Links funktionieren größtenteils nicht mehr und diese Seite wird nur aus melancholischen Gründen nicht gelöscht!

In meinem letzten Beitrag Lycos iQ führt Tagvorschläge für Fragen bei iQ ein habe ich einen kurzen Blick auf die neueste Funktion von Lycos iQ geworfen. Dieser Blick war allerdings etwas oberflächlich, sodass es nun etwas genauere Informationen zur Funktionsweise gibt. Momentan ist das Feature übrigens noch in der Testphase und nicht auf der normalen Frage-stellen-Seite zu sehen.

Nun war Andreas Heß von Lycos Europe so nett und mir einige Hintergrundinformationen zum besseren Verständnis der Funktion gegeben, die ich Euch natürlich nicht vorenthalten möchte. Während ich mich natürlich ebenso für die interessanten Infos bei Andreas bedanke!

Worterkennung?!

Ausschließlich Nomen und Eigennamen werden für die Tagvorschläge benutzt. Bei meinen Beispielen habe ich gleich einen Bug mitbekommen: So wird nämlich das Fragewort „warum“ als Nomen eingeordnet, für die Vorschläge der Tags sollte es eigentlich keine Rolle spielen. Auch zusammengesetzte Worte wie in meinen Beispielen „Musikverwaltung“ bzw. „Musikprogramme“ werden aktuell noch nicht in ihre Bestandteile zerlegt.

Entstehung der Tagvorschläge

Die Vorschläge für einen Tag entstehen nicht, wie ich mich ausdrückte, durch ein Übernehmen der erkannten Worte. Es werden diese Worte erkannt und es wird gesucht, wie frühere Fragen mit diesen Worten getaggt worden sind. So erklären sich auch die Vorschläge von Leid und Menschen für Fragen, die das fälschlicherweise als relevant erkannte „Warum“ enthalten: Eine der „Warum“-Fragen wurde mit eben diesen Tags verschlagwortet.
Die Tagvorschläge entstehen also nicht im luftleeren Raum, sondern werden auf Grundlage der bisherigen Fragen berechnet. Natürlich wäre es auch interessant, wenn die Linkkataloge miteinbezogen werden würden. Ich vermute erstmal, dass in einem relativ sorgfältig geführten Linkkatalog der Titel des Links und die Tags auch einen gewissen Zusammenhang haben. Ob es entsprechend gepflegte Linkkataloge bei Lycos iQ aber gibt, wage ich zu bezweifeln. Der Linkkatalog scheint recht wenig von den Mitgliedern benutzt zu werden.

Homonyme und Synonyme

Ein weiteres Problemfeld sind momentan Homonyme und Synonyme. Homonyme sind Wörter, die unterschiedliche Bedeutungen haben. So z.B. Schloss: Das Schloss kann einerseits ein luxuriöses Gebäude sein und andererseits auch der Bestandteil der Fahrertür meines Autos, das mich eine Zeitlang durch die Beifahrertür einsteigen ließ.
Bei Wikipedia gibt es dann ausführlichere Erklärungen für Homonyme und Synonyme.
So ist bei der Frage Was ist eine Maus? schwer zu unterscheiden für die Software, ob nun das Tier oder das Bedienelement eines Computers gemeint ist. Bislang werden hier aufgrund der bisherigen Fragen nur Tagvorschläge aus dem Computerbereich gemacht.

Zu allgemein? Zu unwissenschaftlich?

Wahrscheinlich wird Andreas auch nach meinem zweiten Erklärungsversuch die Hände über dem Kopf zusammenschlagen müssen. Und neben der Hoffnung auf einen magenschonenden Tee für ihn, bleibt mir nur der Verweis auf weiterführende Informationen, die exaktere und wissenschaftlichere Erläuterungen anbieten.
Direkt von Andreas u.a. kommt diese Erläuterung: From Web 2.0 to Semantic Web: A Semi-Automated Approach (PDF, ~180kb).
Lesenswert ist auch der Wikipedia-Artikel zum Gemeinschaftlichen Indexieren und die Erklärung von Folksonomy im Wiki der Computerwoche. Oder natürlich auch meine Artikel zum Tagging.

Kommentare sind geschlossen.