Die Wahrheit der Semantik

Netting
Image by Oberazzi via Flickr

Web-three-point-o oder semantic web – dass buzzwords grundsätzlich englisch sind, daran haben wir uns inzwischen gewöhnt. Und auch an die katastrophale Art nach der wir im Internet nach Informationen suchen. Das semantic web, oder Internet der Bedeutungen will uns davon wieder entwöhnen. Semantische Suchmaschinen wie Wolfram|Alpha, eyePlorer oder Powerset werben damit, ‚knowledge engines‘ zu sein. Dabei stoßen sie unweigerlich auf de Saussure, Noam Chomsky und Eleonor Rosch. Genauso wichtig aber wäre eine Auseinandersetzung mit dem Sprachphilosophen John L. Austin oder mit MedientheoretikerInnen wie McLuhan! Denn es geht auch um die Frage, wie ein semantisches Internet mit einer Gesellschaft zusammenspielt, die so vom Internet abhängig ist, wie die unsere.

semantic web @ eyePlorer

Was ist jetzt überhaupt dieses semantic web?

Semantik, das ist die Wissenschaft der Bedeutung von Wörtern, Sätzen und Texten. Die Frage also, was wir meinen, wenn wir sagen „Gib mir mal eine Banane!“

Wenn ich nun Wolfram|Alpha „Banana“ hinwerfe, erkennt die Suchmaschine sofort, dass ich damit das Obst ‚Banana‘ meine und zeigt mir Nährwert, enthaltene Vitamine (und % der RDI) und sogar die durchschnittliche Dichte.

Oder wenn ich eyePlorer frage, was das Semantische Web ist, liefert eyePlorer mir eine optisch aufbereitete „Liste“ von verwandten Begriffen (siehe Bild). Das semantic web ist also eine Gruppe von Methoden, die Bedeutung von Webinhalten für Computer verwertbar zu machen mit dem Zweck, uns Benutzern die (Such-)Arbeit leichter zu machen.

Aber was heißt ‚Banane‘ eigentlich?

Die Semantik ist vermutlich eines der schwierigsten Gebiete der Sprachwissenschaft. Nicht ohne Grund ging an ihr der linguistische Strukturalismus de Saussures zu Bruch. Die Anhänger de Saussures versuchten, Wortbedeutungen mithilfe binärer Merkmale zu erfassen. Zwei Wörter müssten sich damit in mindestens einem Merkmal unterscheiden.  ‚Banane‘ wäre dann Obst – ja, essbar – ja, kernig – nein, brennbar – 0, usw. Spätestens bei der Unterscheidung zu Clementinen aber kommt man nicht umhin ‚bananig‘ zu verwenden. Der ganze Aufwand war also umsonst.

Green Banana

Auch befindet sich die Bedeutung in ständiger Bewegung. So verstehen wir heute unter Banane etwa ein gelbes, gebogenes Obst von etwa 20 cm Länge. Vor nicht allzu langer Zeit aber, war das Bananenbild  bei weitem nicht so einheitlich. Und in manchen Ländern sind Bananen gleich gar nicht gelb sondern grün!

Und…wo bleibt McLuhan?

„The medium is the message!“ Mit diesem Satz ist Marshall McLuhan berühmt geworden. Aufgegriffen haben ihn u.a. Aleida und Jan Assman. Ihre Grundthese ist, dass die Medien, über die wir wahrnehmen, unsere Wahrnehmung radikal mitbestimmen. So führt ein Weg vom Buch, über Landkarten und Computerbildschirmen zu einer Zweidimensionalität unserer Wahrnehmung. Jedoch bleibt es nicht bei dieser Beschränkung auf die Wahrnehmung: Medien manipulieren unser Denken!

Gleichzeitig ist die Macht, die Fernsehen und Zeitungen auf uns haben durchaus bekannt. Die Frage, ob Hans Dichand tatsächlich die Wahlen bestimmen kann, wird mit dem Zeitpunkt irrelevant an dem die falschen Leute sich dieser „Macht“ beugen. „If men define situations as real they are real in their consequences!“ – das berühmte und mehrfach bewiesene Thomas-Theorem. Was aber, wenn diese Manipulation  dem System eingeschrieben ist?

Wer ist das semantic web?

Welcome to the semantic web! Corinna Bath zeigt in einem Interview mit der Semantic Web Company

Mystery Man

Mystery Man by

ganz genau auf, dass die EntwicklerInnen des semantic webs von unsicheren Grundannahmen ausgehen. Derzeit funktioniert die Semantik des Internets größtenteils über Kategorisierung von Texten. Dass diese Kategorien grundsätzlich eurozentrisch, z.T. andozentrisch und auf jeden Fall aus unserer konkreten Gesellschaft entstehen, sind in der Kultur- und Sozialanthropologie und besonders in den Gender Studies allseits bekannt. Naturwissenschaft und Technik weisen allerdings ein notorisches Desinteresse an den Kulturwissenschaften auf und so konstruieren software engineers um die Welt jetzt den geistigen Referenzmenschen.

In einer Gesellschaft, die sich immer mehr auf Google, Wikipedia und wienerlinien.at verlässt, in der die primäre Informationsquelle schon lange das Internet ist, ist diese Entwicklung eine höchst brisante. ReadWriteWeb meint, es genüge Acht zu geben, wer da hinter den Bedeutungen des Internets stünde. Doch selbst wenn wir uns um ‚böse Hintermänner‘ keine Sorgen machen müssten, ginge es hier nach wie vor um eine (Re-)Produktion von allgemeingültigen Wahrheiten. Und gerade in diesem „allgemeingültigen“ steckt die Gefahr.

Ich glaube nicht, dass das semantic web aufzuhalten wäre und ich für meinen Teil will das auch gar nicht. Aber es ist wichtig, dass wir als Gesellschaften nicht blind hineinstolpern. Gerade die Kultur- und Sozialwissenschaften sind jetzt am Zug, dieses großartige Potential für uns nutzbar zu machen.

Links:

Genderforschung in der Informatik (PDF, 193 KB)
„All Animals are equal“: Gender research – a fruitful inspiration for building semantic technologies?
Will The Semantic Web Have a Gender?
semanticweb.org

Liste einiger Semantic Search Engines:

Wolfram|Alpha
eyePlorer
Powerset
hakia
DeepDyve
SenseBot
Cognition
DBpedia (besonders praktisch: „semantisiert“ Wikipedia)

Reblog this post [with Zemanta]

Share

  1. No trackbacks yet.

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: