Christoph Purschke
(Luxemburg)

13. Januar 2023

Cultural Language Processing. Warum Sprachverarbeitung nicht »natürlich« ist.

Die Geisteswissenschaften verstehen Sprache für gewöhnlich als eine sozial ausgehandelte symbolische Form, die tief in der Geschichte menschlicher Kultur verwurzelt ist und aus ihr heraus analytisch zugänglich gemacht werden kann. Demgegenüber steht die technische Auseinandersetzung mit Sprache in NLP und Computer Science zumeist im Zeichen einer „natürlichen“ Gegebenheit sprachlicher Information, sei es in Form von Daten, Modellen oder darin gespeichertem „Wissen“. Die Diskrepanz zwischen diesen beiden disziplinären Auffassungen von Sprache bildet den Ausgangspunkt für meinen Vortrag. Ich möchte zeigen, dass auch „natürlich vorkommende“ Sprache keineswegs natürlich ist, sondern immer schon kulturell geprägt – im Sinne einer sozial geteilten, verkörperten und hochgradig kontextuell bestimmten Praxis. Für die automatische Sprachverarbeitung sprachlicher Daten hat eine solche Auffassung des Gegenstands weitreichende Konsequenzen, die es nötig machen, etablierte Konzepte sprachlicher Informationsverarbeitung neu zu fassen, z.B. im Zusammenhang mit der Erfassung von „Sentiment“ in sprachlichen Äußerungen.