Die Verwendung des Thesaurus im Umweltdatenkatalog


Einleitung

Datenbanken wie der Umweltdatenkatalog dienen der Beschaffung von Information zu bestimmten Fragestellungen. Damit einzelne informationstragende Datenbankeinträge (Beschreibung von UDK-Objekten) effizient wiedergefunden werden können, müssen ihre Merkmale hervorgehoben werden, so daß aus dem Gesamtbestand an Eintragungen gezielt die für die jeweilige Fragestellung thematisch einschlägigen ausgewählt werden können. Die für die Selektion geeigneten Inhalte befinden sich im Falle des UDK nur zum Teil im Namen der UDK-Objekte ("Objektname"). In der Objekt-"Beschreibung", in denen mit Hilfe 'gleitender Suche' nach vorzugebenden Suchwörtern interessierende Aspekte gesucht werden können, werden und sollen zwar detaillierte Angaben gemacht werden, die Sprache dieser Angaben ist jedoch in jeder Hinsicht frei und individuell, so daß "fremde" Datenbank-Abfrager mit anderer Sprachausprägung Informationen u.U. nur schwer finden. In der Praxis hat es sich daher als hilfreich erwiesen, die Datenbankinhalte zusätzlich nach vereinbarten Regeln standardisiert zu beschreiben und eine gemeinsame, einheitliche, am jeweiligen Zweck orientierte Sprache (Thesaurus) festzulegen. Für den UDK wurde hierzu ein UDK-Modul für die Nutzung eines solchen Thesaurus entwickelt. Der verwendete Thesaurus beruht auf dem Umweltthesaurus des Umweltbundesamtes Berlin (UMPLIS, UBA Berlin), der für die speziellen Zwecke des UDK adaptiert und fortgeschrieben wird.
Der UDK-Thesaurus dient als Hilfsmittel für das Indizieren und Auffinden von Informationen im UDK. Er hilft dem Benutzer, der nach einer bestimmten Information sucht oder den Suchbegriff für ein bestimmtes UDK-Objekt eingeben möchte, diejenige Bezeichnung zu finden, die den von ihm gesuchten oder beschriebenen Sachverhalt am besten ausdrückt.
Die Anbindung eines geeigneten Umwelt-Thesaurus an den UDK soll somit einer Vielzahl von Anwendern als adäquates Instrument zur systematischen Aufbereitung und Abfrage von Umweltdaten mittels genormter Bezeichnungen zur Verfügung stehen, um eine Vereinheitlichung der "Umweltterminologie" zu fördern und einen flächendeckenden homogenen Metadatenbestand im UDK zu gewährleisten.
Die Entwicklung eines geeigneten Umwelt-Thesaurus, deren Koordination im Rahmen der internationalen Kooperation mit Deutschland von Österreich übernommen wurde, stellt daher bei der Realisierung des UDK ein wichtiges Element dar.

Was ist der UDK-Thesaurus

Ein Thesaurus ist eine hierarchisch strukturierte, begrenzte Liste von Bezeichnungen, die der natürlichen Sprache entnommen sind. Die natürliche Sprache kennt zur Bezeichnung ein und desselben Begriffs (die Sache, der Vorgang, der Gegenstand, etc. "an sich", im wesentlichen) eine Vielzahl von Möglichkeiten. Angefangen von unterschiedlichen Wörtern gleicher oder ähnlicher Bedeutung (Synonyme oder Quasi-Synonyme) über verschiedene Formen des Satzbaus bis hin zu unterschiedlich lautenden Bezeichnungen gleicher Bedeutung aus verschiedenen Sprachen; auch Bilder und andere Symbole könnte man als Form zur Bezeichnung von Begriffen auffassen. Die Bezeichnungen (Wörter) können selbst noch in unterschiedlichen Schreibweisen auftreten (Singular, Plural, Bindestrich-Schreibweisen).
Zum Thesaurusbegriff:
"Die Dokumentationssprache 'Thesaurus' ist darauf ausgerichtet, die verschiedenen Möglichkeiten, die die natürliche Sprache bereitstellt, für ihren Anwendungsbereich zu vereinheitlichen und vereindeutigen. Der sprachliche Reichtum der natürlichen Sprache wird dabei bewußt beschnitten. Deshalb ist ein Thesaurus zwar eine natürlich-sprachlich basierte Sprache, trotzdem aber wie eine Klassifikation eine künstliche Sprache, weil die Auswahl und Bedeutung der Bezeichnungen systemspezifisch festgelegt sind und nicht den Bedeutungen in der natürlichen Sprache entsprechen müssen". "Die Vielfalt der Bezeichnungen, die für einen Begriff existiert, soll zusammengefaßt werden zu einer Einheit. Der Thesaurus hat die Aufgabe, natürlich-sprachliche Vielfalt zu filtern oder zu kanalisieren."
"Während die natürliche Sprache für grundsätzlich alle Themen, Situationen Vokabular zur Verfügung stellt, kann ein Thesaurus den Anforderungen nach Eindeutigkeit, Verbindlichkeit und Übersichtlichkeit nur dann gerecht werden, wenn der Kontext, den er abdecken soll, klar umrissen ist (Gegenstandsbereich, Spezifität, Sprachstil, Umfang des Vokabulars und der Beziehungsarten)" (BURKHARD, Margarete. Dokumentationssprachen. in: Grundlagen der praktischen Information und Dokumentation. 3. Auflage, München/London: Verlag K.-G. Saur, 1990)
Zum Beispiel wird für eine Datenbank, die sich mit Unfallforschung im Straßenverkehr befaßt in der Regel von nachrangigem Interesse sein, ob ein am Unfall beteiligter Straßenbaum eine Kiefer oder eine Buche war. Ein Thesaurus hierfür wird verallgemeinernd zur Indizierung von den speziellen Baumarten auf den Deskriptor "Baum" verweisen (z.B. "Eiche": benutze Synonym "Baum"). Es ist klar, daß dieses nur eine Quasi-Synonym-Beziehung ist, denn natürlich ist "Baum" nicht derselbe Begriff wie "Eiche". Aber für dieses Thema ist der allgemeine Deskriptor "Baum" möglicherweise genau genug. Ganz anders würde natürlich eine Botanik-Datenbank diese Unterschiede herausstellen und noch vertiefen.
Für den UDK ist die Dokumentationssprache der UDK-Thesaurus, der aus dem Umweltthesaurus des Umweltbundesamtes Berlin entwickelt wird. Die o.g. Anforderung nach klarem Umreißen des Kontextes, den der Thesaurus abdecken soll, ist beim Umweltthesaurus durch die Themenstellung der Umweltliteraturdatenbank (ULIDAT) und der Umweltforschungsdatenbank (UFORDAT) gegeben, das heißt Informationen zu:
Eine thematische Beziehung von UDK und ULIDAT/UFORDAT ist 'augenscheinlich' vorhanden, letztere könnten ja sogar UDK-Objekte sein (und umgekehrt). Damit ist eine wesentliche Voraussetzung für die Nutzbarkeit des Umweltthesaurus im Rahmen des UDK gegeben. Allerdings sind die Anforderungen an die Spezifität der Deskriptoren verschieden. Unterschiedliche Anforderungen an die Spezifität des Wortgutes erfordern eine differenzierte Handhabung der Synonym-Setzung.
Dies betrifft nicht zuletzt auch die Frage, wie die Gewichtung der Toleranz gegenüber ungenauen Ergebnissen (viel Ballast) einerseits oder aber unvollständigen Ergebnissen (evtl. der Preis für hohe Genauigkeit einer Recherche) andererseits ist.
Hohe Genauigkeit erfordert es, eine Vielzahl spezieller Begriffe einzubeziehen und widerstrebt der Übersichtlichkeit. Eine Grenze ist allemal da zu ziehen, wo spezielle Aspekte nur noch von wenigen Bearbeitern richtig auseinandergehalten werden können, die meisten aber nur mit Glück richtig indizieren. Eventuell fallen solche Aspekte aber auch 'unter den Tisch', weil sie gar nicht mehr begriffen und erkannt werden.
Der UDK-Thesaurus soll es ermöglichen, die Inhalte (Begriffe, Vorgänge, Gegenstände) eines Fachgebietes mit wenigen, einheitlich benutzten Bezeichnungen wiederzugeben, zu umschreiben. Zu diesem Zweck werden zunächst in der natürlichen Sprache jene Termini bestimmt, die innerhalb eines Fachgebietes bzw. des Thesaurussystems von Bedeutung sind. Diese werden dann zueinander in Verbindung gesetzt. Die Termini werden Deskriptoren genannt.
Ein Deskriptor ist eine genormte Bezeichnung, die für die Indizierung und die Suche im UDK verwendet wird.

Die Deskriptoren umfassen also gerade nicht die gesamte und für denselben Begriff oft vielfältige (Fach-) Terminologie.
Da es nicht sinnvoll ist, alle Ausdrücke der Terminologie eines Fachgebietes zu Deskriptoren zu machen, werden bestimmte fachgebietsrelevante Bezeichnungen als Deskriptoren explizit ausgeschlossen. Diese können als Non-Deskriptoren aufgenommen werden.
Ein Non-Deskriptor ist eine Bezeichnung, die nicht zur Indizierung oder zur Suche zugelassen ist, die aber im Thesaurus angeführt wird und entsprechend gekennzeichnet ist, um den Benutzer zu dem für seinen Sachverhalt zutreffenden Deskriptor zu führen.

Non-Deskriptoren sind also nicht nur Synonyme im streng sprachwissenschaftlichen Sinn, sondern es können auch Begriffe zu Non-Deskriptoren werden, die für den jeweiligen Thesaurus als wichtig erachtet werden, die jedoch zu selten vorkommen oder zu spezifisch sind, um sie in die Liste der Deskriptoren aufzunehmen (Quasi-Synonyme).
Beispiel:
Deskriptor:Kläranlage
Non-Deskriptor:Abwasseranlage
Abwasserbeseitigungsanlage
Abwasserreinigungsanlage
Abwasserreinigungsanlage (biologisch)
Abwasserreinigungsanlage (kommunal)
Abwässerranlage
Betriebskläranlage
Einzelkläranlage
Großklärwerk
uvm.
Der dritte Non-Deskriptor ist Synonym im engeren Sinn, während die anderen Non-Deskriptoren aufgenommen wurden, um einen Benutzer, der auf einer für den Thesaurus zu spezifischen Ebene angesetzt hat, zum genormten Deskriptor zu führen.


Im UDK-Thesaurus werden Bezeichnungen dann als Quasi-Synonym gehandhabt, wenn die Bedeutungsdifferenz für das Wiederfinden eines Themas zu gering ist oder aber die Nutzung in der schreibenden Fachwelt undifferenziert ist (Weizen - Winterweizen, Gülle - Flüssigmist). Ansprüche nach spezifizierter Beschreibung von UDK-Objekten erfordern u.U. eine Umwandlung von Quasi-Synonymen des Umweltthesaurus in Deskriptoren.
Anmerkung: In der Version UDK-T 2.0 werden die Non-Deskrip-toren mit Synonymen bezeichnet.

Beispiel:
Der Nutzer möchte zu einem UDK-Objekt den Suchbegriff "Abwasser-reinigungsanlage" eintragen. Da "Abwasserreinigungsanlage" kein Deskriptor, sondern als Synonym von "Kläranlage" ein Non-Deskriptor ist, der nicht als Thesaurusbegriff übernommen werden kann, wird automatisch eine Liste von Deskriptoren gefundener Synonyme ausgegeben (in diesem Beispiel "Kläranlage", "Kommunale Einrichtung" und "Abwasserreinigung (biologisch)"). Der Deskriptor "Kläranlage" ist in diesem Fall als Thesaurus-Suchbegriff zu übernehmen, eine zusätzliche Übernahme des Synonyms "Abwasser-reinigungsanlage" in die Freien Suchbegriffe wäre nur dann empfehlenswert, wenn dies ein im Kontext häufig verwendeter Begriff ist (z.B. in Verordnungen, Gesetzestexten etc.).
Es kann aber auch der Fall auftreten, daß der Non-Deskriptor kein Synonym im sprachwissenschaftlichen Sinn ist, sondern ein Quasi-Synonym, z.B. Deskriptor "Kläranlage" und dazugehöriger Non-Deskriptor "Großklärwerk". In diesem Fall wäre es sinnvoll, den Non-Deskriptor "Großklärwerk" zusätzlich in die freien Suchbegriffe aufzunehmen.
Eine zusätzliche Möglichkeit, im Thesaurus die richtige Bezeichnung für die Indizierung oder die Suche zu finden, bilden die Verwandten Begriffe.
Ein Verwandter Begriff ist ein Deskriptor, der mit dem vom aktuellen Deskriptor dargestellten Sachverhalt in Beziehung gesetzt werden kann. Diese Beziehung ist aber weder hierarchisch noch synonym, sondern beruht vielmehr auf einer Assoziation.

Beispiel:
Aktueller Deskriptor:Altlast
Verwandte Begriffe:Neulast
Verdachtsfläche
Kontaminierter Standort
Altstandort
Auf diese Weise werden die einzelnen Deskriptoren miteinander vernetzt, damit der Benutzer im Thesaurus navigieren kann und so auch unabhängig von der Hierarchie einen geeigneten Deskriptor findet.


Da der Thesaurus für die Verwendung im gesamten deutschsprachigen Raum (Deutschland, Österreich, Schweiz, Liechtenstein) vorgesehen ist, müssen auch nationale Varianten (z.B. "Aprikose - Marille") eines Deskriptors bzw. nationale Deskriptoren, deren Inhalt nur in einem bestimmten Land relevant ist (z.B. "Volksanwaltschaft", "Wasserbuch"), berücksichtigt werden. (Die Festlegung nationaler Varianten obliegt einer internationalen Wortgutredaktion; derzeit sind daher noch keine nationalen Varianten im UDK-Thesaurus enthalten.)
Als zusätzliche Information ist bestimmten Deskriptoren eine Erläuterung beigefügt, die diese näher definiert. Eine Erläuterung ist vor allem dann erforderlich, wenn die Bedeutung eines Deskriptors nicht eindeutig erkennbar ist, oder wenn seine Bedeutung auf einen gewissen Bereich eingeschränkt werden soll.

Der UDK-Thesaurus und seine Struktur


Als wesentliche Hilfestellung und für ein fortwährend effektives Arbeiten mit den Datenbeständen eines Metainformationssystems, wie es der UDK darstellt, ist die Anbindung an einen Thesaurus unbedingt erforderlich. Denn wenn nicht hinreichend Mühe in die Hervorhebung der für die absehbare Nutzung wesentlichen Inhalte und Merkmale investiert wird, werden "Datenfriedhöfe" erzeugt. Von hervorragender Bedeutung ist somit die inhaltliche Erschließung der Informationen.
Der UDK-Thesaurus ist daher ein wesentlicher Bestandteil des österreichischen UDK. Er soll es ermöglichen, die Inhalte eines Fachgebietes mit wenigen, einheitlich benutzten Bezeichnungen wiederzugeben oder zu umschreiben und so ein adäquates Instrument für die Datenverwaltung, -pflege und -recherche darstellen.
Allgemein formuliert ist ein Thesaurus der hierarchisch strukturierte, begrenzte Wortschatz, welcher der natürlichen Sprache entnommen ist und der ein Hilfsmittel für das vereinheitlichte Beschreiben ("Indexieren") und Auffinden von Informationen mittels normierter Begriffe darstellt.
Die höchste Ebene der Hierarchie des UDK-Thesaurus bilden die Klassen der Umweltklassifikation; in der Hierarchie absteigend befinden sich darunter etwa 400 Topterms, 10.000 Deskriptoren und 18.000 Non-Deskriptoren.
Die Klassen dienen der Gruppierung der Deskriptoren nach großen Bedeutungsumfängen. Die nächste Hierarchiestufe bilden die Topterms. Damit werden all jene Deskriptoren bezeichnet, die sich auf der zweithöchsten Ebene im Thesaurus befinden, wobei ein Topterm auch mehreren Klassen zugeordnet sein kann.
Die verwendete Dokumentationssprache ist darauf ausgerichtet, die verschiedenen Möglichkeiten, die die natürliche Sprache bereitstellt, für ihren Anwendungsbereich zu vereinheitlichen. Zu diesem Zweck werden in der natürlichen Sprache jene Ausdrücke festgelegt, die innerhalb eines bestimmten Fachgebietes von besonderer Bedeutung sind und zueinander in Verbindung gesetzt werden (Verwandte -, Ober- und Unterbegriffe). Diese sogenannten Deskriptoren umfassen also nicht die Gesamtheit aller, für ein und denselben Begriff oft sehr vielfältigen Fachausdrücke, sondern eine zweckorientierte Auswahl. Die Deskriptoren sind polyhierarchisch gegliedert (d.h. zu einem Deskriptor können mehrere Oberbegriffe exisitieren), wobei es derzeit bis zu acht Hierachiestufen gibt.
Da es nicht sinnvoll ist, alle Ausdrücke eines Fachgebietes zu Deskriptoren zu machen, werden bestimmte fachgebietsrelevante Bezeichnungen als sogenannte Non-Deskriptoren oder Synonyme aufgenommen. Das sind zum Beispiel Ausdrücke, die für das jeweiligen Fachgebiet als wichtig erachtet werden, jedoch zu selten vorkommen oder zu spezifisch sind, um sie in die Liste der Deskriptoren aufzunehmen. Ein Non-Deskriptor ist nicht zur Indexierung oder zur Suche im UDK zugelassen, er führt den Benutzer aber zu dem für seinen Sachverhalt zutreffenden Deskriptor.
Eine weitere Möglichkeit, um im Thesaurus die richtige Bezeichnung für eine Indexierung oder Suche zu finden, sind die sogenannten Verwandten Begriffe. Sie stellen Deskriptoren dar, welche mit dem aktuellen Deskriptor in einer Beziehung stehen, die weder hierarchisch noch synonym ist, sondern vielmehr auf einer Assoziation beruht.
Bei Deskriptoren, deren Bedeutung nicht eindeutig erkennbar ist, oder deren Bedeutung auf einen bestimmten Fachbereich eingeschränkt werden soll, gibt es als zusätzliche Information Erläuterungen.
Da der UDK-Thesaurus für den gesamten deutschsprachigen Raum vorgesehen ist, müssen auch regional unterschiedliche Bezeichnungen (z.B. "Mist - Kehricht") mit sogenannten Nationalen Varianten berücksichtigt werden.

Die Indexierung mit dem UDK-Thesaurus


Beim Indexieren werden die Begriffe, die den Sachverhalt in einem UDK-Objekt beschreiben, durch einen Deskriptor dargestellt, um die in diesem Objekt enthaltene Information bei einer nachträglichen Suche zugänglich zu machen.
Wesentlichen Einfluß auf ein zufriedenstellendes Recherchen-Ergebnis im UDK hat eine einheitliche Beschlagwortung der Datenbestände unter Einsatz des UDK-Thesaurus, die somit bereits bei der Dateneingabe die unterschiedlichsten Sichtweisen potentieller UDK-Nutzer auf Datenbestände vorwegnehmen muß. Die Beschlagwortung muß daher einerseits so detailliert sein, daß sie auch für Experten von Nutzen ist, aber gleichzeitig so allgemein, daß sie auch von Laien des betreffenden Fachgebietes verwendet werden kann.
Die Gruppe der Anwender und ihrer Fragestellungen ist jedoch bezüglich der Suche und der Beschlagwortung eines bestimmten UDK-Objektes nicht homogen. Es ergeben sich aus der Vielfalt der Individuen folgende Hauptunterscheidungsmerkmale:
Da bei einer dezentral gepflegten Datenbank wie dem UDK die Dateneingebenden i.a. nicht mit den Datenabfragenden identisch sind, muß Sorge getragen werden, daß die "Sprachen" dieser unterschiedlichen Nutzergruppen möglichst ähnlich sind, oder eine Art "Übersetzungshilfe" verfügbar ist, damit gleiche Sachverhalte übereinstimmend beschrieben werden.
Daraus folgt, daß die Indexierung in erster Linie im Hinblick auf den recherchierenden UDK-Nutzer erfolgt, der das in Frage kommende UDK-Objekt mit Hilfe der gewählten Deskriptoren finden soll. Der Inhalt des UDK-Objekts soll weder zu allgemein noch zu speziell wiedergegeben werden, damit bei der Suche zwar die relevanten Objekte gefunden werden, aber möglichst wenig "Ballast" mitgeliefert wird.
Werden z.B. die Objekte durch sehr spezifische Deskriptoren beschrieben, so ist die Trefferquote bei einer Suche relativ gering, dafür beinhalten die meisten der gefundenen Objekte die gewünschte Information; bei einer Indexierung mit einer größeren Anzahl von weniger spezifischen Deskriptoren wird zwar eine höhere Trefferquote erzielt werden, jedoch könnten darunter auch für die Fragestellung irrelevante Ergebnisse sein.
Als erste Annäherung kann (unabhängig vom Thesaurus) eine allgemeine, unspezifische Beschreibung von UDK-Objekten mittels je einer der 14 Klassen der Umweltklassifikation des UBA-Berlin und der 9 Metadatenklassen vorgenommen werden.
Folgende 14 Klassen der Umweltklassifikation des UBA-Berlin sind dzt. vorgesehen:
Folgende 9 Metadatenklassen sind dzt. vorgesehen:
Die Zuordnung von Datenbeständen zu diesen "UDK-Klassen" erfolgt nach folgenden Grundsätzen:
Nachfolgend sind jene Punkte aufgelistet, auf die im Umgang mit dem UDK-Thesaurus besonders Rücksicht zu nehmen ist, und jeweils Beispiele dazu angeführt:
Die Forderung nach übereinstimmender Indexierung vergleichbarer Sachverhalte (terminologische Kontrolle), die in verschiedenen UDK-Objekten beschrieben sind, kann folgendermaßen erreicht werden:

Die Suche im UDK-Thesaurus


Bei der Suche im Thesaurus sind hauptsächlich folgende Grundsätze zu beachten:
Kann das Modul UDK-T in der Menge der Deskriptoren keinen Begriff finden, der mit dem Suchbegriff übereinstimmt, wird automatisch in der Menge der Synonyme danach gesucht. Erst wenn auch dort die Suche erfolglos ist, wird die leere Menge angezeigt.
Grundsätzlich können bei der Suche nach Deskriptoren im Thesaurus drei mögliche Fälle auftreten:
Ist ein Begriff im Thesaurus auch durch Navigieren nicht auffindbar, und kann dieser Begriff auch durch Kombination mehrerer Deskriptoren nicht hinreichend beschrieben werden, besteht die Möglichkeit, auf elektronischen Erfassungsformularen entsprechende Vorschläge für neue Thesaurusbegriffe zu machen. Außerdem können (evtl. nur subjektiv empfundene) verbleibende Defizite in der Spezifität des Deskriptor-Wortgutes durch die Vergabe von zusätzlichen (max. 99) "Freien Suchbegriffen" ausgeglichen werden, die keine "Notlösung", sondern eine wichtige Ergänzung darstellen.

Pflege und Weiterentwicklung des UDK-Thesaurus


Zweck eines Thesaurus ist es, die natürlich-sprachliche Vielfalt zu filtern und kanalisieren, um sie für einen bestimmten Anwendungsbereich zu vereinheitlichen und vereindeutigen. Durch die bewußte Einschränkung bzw. Zusammenfassung der vielfältigen Bezeichnungen, die für einen Begriff existieren, und durch das zweck- und systemorientierte Festlegen von Auswahl und Bedeutung der Bezeichnungen sollen folgende Eigenschaften des Thesaurus erreicht werden:
Ein Thesaurus kann den Anforderungen nach Eindeutigkeit, Übersichtlichkeit und Verbindlichkeit nur dann gerecht werden, wenn der Kontext, den er abdecken soll, klar umrissen ist. Wegen des hohen Grades an Interdisziplinarität und der daraus resultierenden unterschiedlichsten Fachtermini, die mit dem Metainformationssystem UDK verbunden sind, sind diese Anforderungen unter Umständen nicht widerspruchsfrei zu realisieren. Zusätzlich steht die Verbindlichkeit in engem Zusammenhang mit der Akzeptanz durch die Thesaurus-Nutzer, die von folgenden Faktoren beeinflußt wird:
Sowohl für die Thesauruspflege als auch für die Indexierung und Objektsuche ist daher eine Erfahrungs- und Bedürfniskommunikation zwischen den Thesauruspflegern und den Nutzern wichtig. Um der Aktualität des UDK und den Anforderungen seiner Nutzer fortwährend Rechnung zu tragen, ist es notwendig, auch den UDK-Thesaurus in sinnvollen Intervallen auf den neuesten Stand zu bringen und ständig weiterzuentwickeln. Andererseits sollten Änderungen der Thesaurusstruktur vermieden werden, um nicht häufig Retroindexierungen vornehmen zu müssen.
Um die Erfahrungen aus der Datenerfassung zu systematisieren, besteht zum Beispiel die Möglichkeit, mittels des Softwaremoduls UDK-T eine statistische Auswertung der in den Objekten verwendeten Suchbegriffe durchzuführen, um deren tatsächliche Bedeutung für das entsprechende Anwendungsgebiet oder auch Kandidaten für neue Deskriptoren festzustellen.
Ist ein Begriff im Thesaurus auch durch Navigieren nicht auffindbar, und kann dieser Begriff auch durch Kombination mehrerer Deskriptoren nicht hinreichend beschrieben werden, besteht die Möglichkeit, auf elektronischen Erfassungsformularen entsprechende Vorschläge für neue Thesaurusbegriffe zu machen. Zusätzlich besteht die Möglichkeit, das Hinzufügen, Umwandeln oder Löschen von Deskriptoren, Non-Deskriptoren oder Verwandten Begriffen vorzuschlagen. Außerdem können (evtl. nur subjektiv empfundene) verbleibende Defizite in der Spezifität des Deskriptor-Wortgutes
durch die Vergabe von zusätzlichen (max. 99) "Freien Suchbegriffen" ausgeglichen werden, die keine "Notlösung", sondern eine wichtige Ergänzung darstellen.
Allerdings sollten auch bei der Vergabe von freien Suchbegriffen die Thesaurus-Konventionen beachtet werden:

Softwarewerkzeuge zur Thesauruspflege


in Vorbereitung




Umweltbundesamt
Federal Environment Agency - Austria
Spittelauer Lände 5, A-1090 Wien, Austria
Tel.: +43 1 31304-0, Fax: +43 1 31304-5400
URL: http://www.umweltbundesamt.at
Auskunft: Rudolf Legat
Letzte Änderung: 02.11.2000
Copyright 1998 Umweltbundesamt

Homepage UDK   Homepage WGR