Benutzerspezifische Werkzeuge

Taxonomien

Taxonomien können sowohl als eigenständige Werkzeuge als auch als Elemente umfangreicherer Formen der Wissensrepräsentation dienen. Im folgenden Beitrag werden der grundlegende Aufbau sowie die Nutzungsmöglichkeiten von Taxonomien beschrieben.

Taxonomien

Vergleichbar der Taxonomie in der Biologie, die Lebewesen in einem hierarchischen System ordnet, werden mit Taxonomien in der Informationstechnologie alle hierarchisch gegliederten Klasseneinteilungen eines Gegenstandsbereiches bezeichnet [vgl. Schmaltz 2004, S. 5]. Taxonomien definieren Klassen von Objekten und Beziehungen zwischen diesen, enthalten aber keine Beschreibungen bzw. Definitionen von Objekten [vgl. Berners-Lee, Hendler, Lassila 2001, S. 27]. Die häufigste Erscheinungsform sind geordnete Begriffsmengen. Die Begriffe einer Taxonomie sind baumartig angeordnet, so dass mit zunehmender Tiefe ihre Spezifität zunimmt.

Vergleicht man den Formalisierungsgrad und das damit einhergehende Potential für Schlussfolgerungen mit anderen Formen der Wissensrepräsentation, so können Taxonomien zwischen Ontologien und weniger geordneten Formen der Repräsentation, wie Mindmaps oder Pathfinder Networks, wie in Abbildung 1 dargestellt, eingeordnet werden.

Taxonomien_Abbildung_1

 

Abb. 1: Einordnung der Taxonomien in verschiedene Formen der Wissensrepräsentation [in Anlehnung an Brewster, Wilks 2004, S. 6 und Ulrich, Maier, Angele 2003, S. 2].

Formal kann eine Taxonomie als (Halb-)ordnungsrelation in einer Menge von Objekten angesehen werden, die Zuordnungen zwischen den Objekten herstellt. Hierbei handelt es sich um eine binäre Relation R in einer Menge A, die reflexiv, antisymmetrisch und transitiv ist. Mittels dieser Beschreibung kann eine Taxonomie zur Konstruktion einer Ontologie genutzt werden, wie z. B. von [Boszak et al. 2002] beschrieben.

Nutzung von Taxonomien

Anwendungsbereiche von Taxonomien

Die Anwendungsbereiche von Taxonomien sind vielfältig. Eine naheliegende Anwendung ist die Unterteilung von Gegenstandsbereichen mittels einer Klassifikation. Beispielhaft sei die Klassifikation der Wirtschaftszweige genannt, die der einheitlichen statistischen Erfassung der wirtschaftlichen Tätigkeiten von Unternehmen, Betrieben und anderen statistischen Einheiten in Deutschland dient (vgl. Abbildung 2). Weitere Klassifikationen bzw. Hierarchien finden sich z. B. unter http://xml.coverpages.org/classification.html.

Taxonomien_Abbildung_2

Abb. 2: Klassifikation der Wirtschaftszweige [Statistisches Bundesamt, 2008]

Die beschriebenen Klassifikationen können in einem weiteren Schritt dazu genutzt werden, Inhalte zu strukturieren und damit die Aufgaben des Content Managements zu unterstützen. Der dritte zu nennende Anwendungsbereich ist die Nutzung zum Information Retrieval bzw. als Unterstützung von Suchmaschinen. Taxonomien können in Kombination mit Ähnlichkeitsmaßen zur strukturierten Suche in Textdokumenten eingesetzt werden [vgl. Pfuhl 2003]. Weitere Möglichkeiten bestehen in der Nutzung von Taxonomien als Benutzeroberfläche für Suchmaschinen, indem der Anwender zunächst mittels einer Taxonomie das Interessengebiet eingrenzt, bevor eine Volltextsuche gestartet wird. Ergänzend finden sich zahlreiche Ansätze, Taxonomien zur Verbesserung von Precision und Recall in Retrievalprozessen einzusetzen. Ein neuerer Ansatz zur Nutzung von Taxonomien ist im Zusammenhang von Web 2.0 unter dem Stichwort Folksonomies entstanden.

Erstellung von Taxonomien

Neben der Alternative, vorgefertigte Taxonomien zu nutzen, besteht die Möglichkeit, für das vorliegende Anwendungsgebiet eine spezifische Taxonomie zu entwickeln. Neben der manuellen bzw. semiautomatischen Erstellung bieten sich verschiedene Vorgehensweisen zur automatischen Erstellung von Taxonomien, wie z. B. regelbasierte oder bayesische Verfahren, an. Beispielhaft sei auf [Cimiano, Staab, Tane 2003] verwiesen.

Literatur

Berners-Lee, Tim; Hendler, James; Lassila, Ora: The Semantic Web. In: Scientific American 5(2001), zitiert aus Scientific American, Special Online Issue (2002), Nr. 2, S. 24-30.

Boszak, Erol et al.: KAON - Towards a large scale Semantic Web. In: Bauknecht, K.; Tjoa. A. M.; Quirchmayr, G.: E-Commerce and Web Technologies, LNCS 2455. Berlin: Springer, 2002.

Brewster, Christopher; Wilks, Yorick: Ontologies, Taxonomies, Thesauri: Learning from Texts. In: Deegan, M. (Hrsg.): The Use of Computational Linguistics in the Extraction of Keyword Information, Proceedings from Digital Library Content Workshop, Centre for Computing in the Humanities, London: Kings College, 2004.

Cimiano, Philipp; Staab, Steffen; Tane, Julian: Automatic Acquisition from Text: FCA meets NLP. In: Proceedings of the ECML/PKDD Workshop on Adaptive Text Extraction and Mining. Cavtat-Dubrovnik: 2003. S. 10-17.

Pfuhl, Markus: Case-Based Reasoning auf der Grundlage Relationaler Datenbanken. Wiesbaden: Deutscher Universitätsverlag, 2003.

Schmaltz, Robert: Semantic Web Technologien für das Wissensmanagement. In: Schumann, M. (Hrsg.): Arbeitsbericht Nr. 1/2004, Institut für Wirtschaftsinformatik: Georg-August-Universität Göttingen, 2004.

Statistisches Bundesamt: Gliederung der Klassifikation der Wirtschaftszweige 2008. Statistisches Bundesamt Deutschland, 2008.

Ulrich, Mike; Maier, Andreas; Angele, Jürgen: Taxonomie, Thesaurus, Topic Map, Ontologie - ein Vergleich. Ontoprise Whitepaper Series, 2003.

Autor


 

Dr. Markus Pfuhl, Viessmann Werke GmbH & Co. KG, Viessmannstraße 1, 35108 Allendorf (Eder)

Autoreninfo


Zuletzt bearbeitet: 25.10.2012 12:30
Letzter Abruf: 24.05.2017 13:40
Artikelaktionen