Named Entity Recognition
„Named Entity Recognition“ (NER), im deutschen Eigennamenerkennung, ist ein Teilgebiet der natürlichen Sprachverarbeitung (Natural Language Processing) und gehört damit zur maschinellen Aufbereitung von Texten. Mithilfe des Verfahrens findet eine automatische Identifikation von Eigennamen in natürlichen Texten, wie Zeitungsartikeln, statt. Der natürliche Text wird dabei auf Eigennamen durchsucht und diese anschließend in Kategorien (Personen/Körperschaften, Orte und Themen) eingeordnet. Die erkannten Eigennamen werden durch eine farbige Markierung hervorgehoben.
Zu den Vorteilen von NER gehört unter anderem die schnelle Analyse einer großen Menge an Daten, wodurch Sie als Nutzer mithilfe der erfolgten Verschlagwortung gezielt in umfangreichen Zeitungen suchen können. Bei der Suche mit NER werden ausschließlich die Zeitungsseiten angezeigt, die den gewünschten Begriff enthalten. Durch die farbige Hervorhebung des gesuchten Begriffs lassen sich so die relevanten Beiträge schneller finden. Zusätzlich werden bei diesem Verfahren die erkannten Eigennamen mit dem entsprechenden GND-Datensatz (Gemeinsame Normdatei) und Wikipedia-Artikel verknüpft. So erhalten Sie mit einem Klick weiterführende Informationen.
Beispiel
Die „Südwestdeutsche Volkszeitung“ ist eine der Zeitungen, die mit dem NER-Verfahren bearbeitet wurden. In der Übersicht des Gesamtwerks finden Sie bei den bearbeiteten Zeitungen neben den gewohnten Reitern „Titel“ und „Kalender“ auch die Reiter „Personen/Körperschaften“, „Orte“ und „Themen“. Hinter diesen Reitern verbirgt sich die Verschlagwortung des NER-Verfahrens.
Wenn Sie also beispielsweise zum Künstler Pablo Picasso recherchieren und etwas über das damalige Meinungsbild erfahren wollen, finden Sie die relevanten Artikel unter dem Reiter „Personen/Körperschaften“ beim Buchstaben „P“. Die Sortierung erfolgt hier unter „Nachname, Vorname“.
In der Ergebnisliste finden Sie dann den Treffer zu Pablo Picasso. Über das Plus am unteren Rand gelangen Sie zu den weiteren Treffern in dieser Zeitung und mit einem Klick auf den Bildausschnitt erscheint die entsprechende Zeitungsseite mit dem kompletten Artikel. Weitere Informationen zu Pablo Picasso können Sie über einen Klick auf seinen Namen abrufen. Auf der neu geöffneten Seite sehen Sie zusätzlich auch weitere Erwähnungen in anderen Zeitungen, über das „G“ neben seinem Namen öffnet sich der Datensatz der GND und über das „W“ der entsprechende Wikipedia-Artikel.
Sie können sich in der NER-Suche darüber hinaus auch Artikel von Personen anzeigen lassen, die beispielsweise einen bestimmten Beruf ausgeübt haben oder mit einem spezifischen Ort verknüpft sind. Dazu wählen Sie unter dem Reiter „Personen/Körperschaften“ keinen bestimmten Buchstaben, sondern „Alle“ und können am rechten Rand die Ergebnisliste weiter filtern. Im Berufsfeld „Künstler“ werden neben Picasso beispielsweise Albrecht Dürer, Vincent van Gogh oder Leonardo da Vinci angezeigt.
Die Suche in den Reitern „Orte“ und „Themen“ funktioniert analog zur Suche im Reiter „Personen/Körperschaften“. Sie können die Ergebnisse auch hier über die Buchstabenauswahl und die Filter am rechten Rand einschränken.