01 Natural Language Processing

Schon 1954 war es Forschern gelungen, mittels einer Maschine sechzig Sätze vom Russischen ins Englische zu übersetzen. Euphorisiert von diesem Start dachten viele Computerwissenschaftler, dass die maschinelle Übersetzung nur noch eine Frage der Zeit wäre. Doch es dauerte noch bis in die 1980er-Jahre, bis erste Systeme für statistisch-basierte, maschinelle Übersetzungen weiterentwickelt wurden. Heute finden wir zahlreiche Ansätze, um Informationen aus der „echten“ Welt in Computersprache zu übersetzen.

Bereits letzte Woche hatten wir über die Technologie des Natural Language Processing (NLP) berichtet. Heute wollen wir tiefer einsteigen.

 

Was genau ist NLP? Wieso wird es verwendet?

Starten wir mit der Frage nach dem Wieso? Das lässt sich leicht beantworten, denn unabhängig von der Anwendung, die verwendet wird, soll mit Hilfe von NLP stets dasselbe Ziel erreicht werden: effizientes und schnelles Arbeiten bei geringstmöglichen Kosten. Möglich wird dies, indem die natürliche Sprache – in  geschriebener oder gesprochener Form – verarbeitet und in strukturierte Daten umgewandelt wird.

Um dies besser zu verstehen, ist es am besten, sich den Unterschied zwischen der natürlichen und der maschinellen Sprache vor Augen zu führen. Menschen nutzen ihre natürliche Sprache, um miteinander zu kommunizieren. Jede Sprache der Welt von Englisch bis Chinesisch ist eine natürliche Sprache. Im Rahmen des NLP analysiert der Computer nicht eine Computersprache wie Java, C oder C++, sondern die tatsächlich von einem Menschen gesprochenen Sätze und versucht diese zu verstehen.

Allerdings ist es kein leichtes Unterfangen, Sprache anhand der Bedeutung einzelner Wörter zu analysieren oder den Zusammenhang eines Satzes zu erfassen. Hier kommen Algorithmen ins Spiel. So basiert NLP auf Algorithmen des maschinellen Lernens. Diese basieren auf der Notwendigkeit, die große Anzahl von unstrukturierten Daten in strukturierte Daten umzuwandeln. Die Möglichkeit, natürliche Sprache mit Hilfe einer Maschine zu analysieren, bietet großes Potenzial für Endanwendungen wie es beispielsweise die Übersetzungsfunktion von Google zeigt.

Kurz zusammengefasst ist Natural Language Processing eine Technologie, die es Computern und Menschen ermöglichen soll, auf gleicher Augenhöhe miteinander zu kommunizieren. Durch die maschinelle Verarbeitung der natürlichen Sprache wird der Computer in die Lage versetzt, zu lesen, zu verstehen und zu antworten. Informationen aus der „echten“ Welt werden mit Hilfe des NLP in Computersprache übersetzt.

 

Komponenten des NLP

NLP besteht aus zwei Komponenten. Einerseits aus dem Natural Language Understanding (NLU) und andererseits aus Natural Language Generation (NLG), auch Textgenerierung genannt.

Während sich NLU mit der Analyse der verschiedenen Aspekte menschlicher Sprache befasst und versucht, diese zu „verstehen“, ist NLG der Prozess, der aus dem Input anschließend sinnvolle Sätze in Form von natürlicher Sprache generieren soll. Im Allgemeinen lässt sich sagen, dass NLU ungleich schwieriger ist als NLG.

Das Problem mit NLP ist nicht die Technologie, sondern die menschliche Sprache, die dahinter steckt. Natürliche Sprache ist selten präzise. Um die Sprache zu verstehen, reicht es nicht aus, die Bedeutung der Wörter zu kennen, sondern der Sinn muss herausgearbeitet und Sätze müssen logisch verknüpft werden. Was für Menschen intuitiv ist, ist für Maschinen ein langer Prozess. Durch die Mehrdeutigkeit der Sprache ist es für Computer schwer diese zu erlernen. Cognitive Computing versucht diese Schwierigkeit zu bewältigen, indem semantische Algorithmen Verwendung finden, die die menschliche Fähigkeit zu lesen und zu verstehen nachahmen. Definitiv kein trivialer Prozess!

 

Anwendungsbeispiele

Viele Unternehmen stützen sich mittlerweile auf diverse NLP-Techniken. Im Folgenden sind zwei Beispiele aufgeführt, die nicht nur in Unternehmen Anwendung finden.

Maschinelle Übersetzung: Das wohl bekannteste Beispiel ist Google mit seiner „translate“ Funktion. Dabei spielt es keine Rolle, ob der Translator aktiv für Übersetzungen verwendet wird oder dieser dem Nutzer beim Besuch einer Website mittels Benachrichtigung eine Übersetzung anbietet. Der Algorithmus bleibt der gleiche – er lernt von den Menschen. Wenn Nutzer merken, dass ein Wort nicht passend erscheint, kann dies leicht editiert und ausgebessert werden. Somit lernt Google Translate, die richtige Semantik zu verwenden. Das Ziel ist ein grundlegendes Verständnis durch eine schnelle und eher grobe Übersetzung.

Spamfilter: Diese können Abhilfe von ungewollten E-Mails schaffen. Anhand der Analyse der Sprache kann der Algorithmus in der jeweiligen E-Mail entziffern, ob es sich um Spam handelt oder nicht und sie somit sortieren.

 

Haben Sie bereits einen Dialog mit intelligenten Systemen geführt und wie beurteilen Sie deren Sprachleistung? Sehen Sie weitere Anknüpfungspunkte für NLP-Technologien in den verschiedenen Anwendungssektoren Bildung, Gesundheit, Energie, Verkehr & Verwaltung?

 

 

 

Quellen

http://www.expertsystem.com/examples-natural-language-processing/

http://blog.algorithmia.com/introduction-natural-language-processing-nlp/

https://www.tutorialspoint.com/artificial_intelligence/artificial_intelligence_natural_language_processing.htm

https://www.lifewire.com/applications-of-natural-language-processing-technology-2495544

https://www.acrolinx.de/blog/kunstliche-intelligenz-und-die-zukunft-der-content-erstellung/

https://de.onpage.org/wiki/Natural_Language_Processing

 

 

06.06.2017
  • natural language processing
  • nlp
  • künstliche intelligenz

Kommentare

Diskutieren Sie mit der Community auf der Open-Innovation-Plattform