Natural Language Processing (NLP)

Aus DIPAS

Natural Language Processing meint die automatische Verarbeitung von Sprache durch einen Computer. DIPAS bietet verschiedene NLP-Dienste zur automatischen Textauswertung. Derzeit als Beta-Testversion aktiv sind die Dienste Wordcloud, Scoring und Clustering.

Einstellungen für die Verschlagwortung[Bearbeiten | Quelltext bearbeiten]

Der Verschlagwortungsdienst wurde entwickelt, um den Beitragstext auf Schlagworte zu überprüfen. Der Dienst bietet den Nutzer*innen die Möglichkeit, ihre Beiträge mit bestimmten thematischen Schlagworten zu markieren. Diese können die Schlagworte ihren Beiträgen zuordnen und eigene Schlagworte vergeben. Per Suche lassen sich so schnell bestimmte Themen finden. Das Feature erleichtert zudem die Auswertung des Verfahrens. Dieses Feature erleichtert dem Verfahrensverantwortlichen die Auswertung, da besonders häufige Themen hervorstechen.

Die Datenexport-Tabelle enthält eine Spalte mit den ausgewählten Schlagworten.

Einstellungen für den Verschlagwortungsdienst[Bearbeiten | Quelltext bearbeiten]

Wenn Sie den Dienst nutzen möchten, aktivieren Sie das Kästchen. Für Hamburger Verfahren nimmt die technische Leitstelle bei Bedarf die folgenden Einstellungen für Sie vor.

Die Voreinstellungen können Sie in der Regel so belassen.

  • Schlagwortmodus: Wählen Sie „extern“, wenn aus dem Beitragstext automatisch Schlagworte extrahiert werden sollen. Wählen Sie „Intern“, können die Nutzer*innen nur eigene Schlagworte eingeben.
  • URL des Verschlagwortungsdienst: Für den Modus external oder internal muss eine URL des entsprechenden Dienstebereitstellers eingegeben werden. Tragen Sie hier http://194.95.76.31:10001/keywords ein.
  • Externer Service: Wählen Sie den Service für den Betriebsmodus 'extern' (Leipzig oder DBPMedia). Tragen Sie hier „Leipzig“ ein.
  • Anzahl der Schlagworte, die erzeugt werden sollen: Konfigurieren Sie die Anzahl der Schlagworte, die der Service erzeugen soll. Tragen Sie hier zum Beispiel „4“ ein.

NLP Einstellungen[Bearbeiten | Quelltext bearbeiten]

Hier können Sie den NLP-Service konfigurieren. Dieser Service stellt Funktionen der automatisierten Textauswertung für die Beiträge bereit. Dieser Service befindet sich aktuell in der Beta-Phase. Nach Absprache mit der Stadtwerkstatt kann das Feature für Ihr Verfahren in Hamburg aktiviert und konfiguriert werden. Wenn Sie den Dienst nutzen möchten, aktivieren Sie das Kästchen.

Abfrage-Intervall für den NLP Service in Minuten: Tragen Sie hier „60“ ein.

Zur Schnittstellenbeschreibung

Derzeit sind folgende Services produktiv: Wordcloud-, Scoring- und Clustering Service.

Die Auswertungsseite erreichen Sie über folgenden Endpunkt: drupal/de/admin/dipas/nlp-analysis.

Score-Dienst[Bearbeiten | Quelltext bearbeiten]

Mit dem Score-Dienst können Sie Beiträge nach besonderen Kriterien filtern oder sortieren. Wenn Sie den Dienst nutzen möchten, aktivieren Sie das Kästchen.

  • Score-Dienst Basic-URL: Tragen Sie hier die URL des Score-Dienstes ein. (http://194.95.76.31:10001/scores)
  • Content Score aktivieren: Wählen Sie hier „normalisiert“ aus.
  • Response Score aktivieren: Wählen Sie hier „normalisiert“ aus.
  • Mutuality Score aktivieren: Wählen Sie hier „normalisiert“ aus.
  • Relevance Score aktivieren: Wählen Sie hier „normalisiert“ aus.
  • Sentiment Score aktivieren: Wählen Sie hier „normalisiert“ aus.
  • Score Blacklist: Hier können Sie Worte hinzufügen, die der Service nicht erfassen soll. Diese müssen durch ein Komma getrennt werden.

Clustering-Dienst[Bearbeiten | Quelltext bearbeiten]

Mit dem Clustering-Dienst können Sie Cluster zu bestimmten Kategorien bilden. Sie erkennen dadurch schnell, welche Begriffe die Nutzer*innen in der gewählten Kategorie am häufigsten genutzt haben. Wenn Sie den Dienst nutzen möchten, aktivieren Sie das Kästchen.

  • Clustering-Dienst Basic-URL: Tragen Sie hier die URL des Clustering-Dienstes ein. (http://194.95.76.31:10002/clustering)
  • Anzahl der zu bildenden Cluster: Tragen Sie hier „3“ ein.
  • Cluster Blacklist: Hier können Sie Worte hinzufügen, die der Service nicht erfassen soll. Diese müssen durch ein Komma getrennt werden.

Summary-Dienst[Bearbeiten | Quelltext bearbeiten]

Dieser Dienst ist leider noch nicht verfügbar.

Wordcloud-Dienst[Bearbeiten | Quelltext bearbeiten]

Ein Beispiel einer Wortwolke
Ein Beispiel einer Wortwolke

Mit dem Wordcloud-Dienst können Sie Wortwolken zu bestimmten Kategorien bilden.

Wortwolken (eng. tag clouds) dienen der Visualisierung von Schlagworten und deren Gewichtung. Besonders häufig genutzte Schlagworte werden größer angezeigt. Dies erleichtert die Analyse und Auswertung. Dadurch erkennen Sie schnell, welche Begriffe die Nutzer*innen in der gewählten Kategorie am häufigsten genutzt haben. Wenn Sie den Dienst nutzen möchten, aktivieren Sie das Kästchen.

  • Wordcloud-Dienst Basic-URL: Tragen Sie hier die URL des Wordcloud-Dienstes ein (http://194.95.76.31:10004/wordcloud)
  • Maximale Anzahl von Schlagworten in der Wordcloud: Tragen Sie hier „20“ ein.
  • Wordcloud Blacklist: Hier können Sie Worte hinzufügen, die der Service nicht erfassen soll. Diese müssen durch ein Komma getrennt werden.
  • Wörterbuch aktivieren: Wählen Sie hier „alphabetisch“.

Topicmap-Dienst[Bearbeiten | Quelltext bearbeiten]

Dieser Dienst ist leider noch nicht verfügbar.