// archives

Natural Language Processing

This tag is associated with 10 posts

Metadaten & Linked Data mit Open Calais

Thomson Reuters, der Nachrichten-Riese aus London hat vor einiger Zeit die vierte Version seiner Metadaten-Extraktions-API veröffentlicht. OpenCalais identifiziert - kurz gesagt - bestimmte Typen von Konzepten in unstrukturiertem Text. Diese Named Entity Extraction liefert zum Beispiel alle Personen, Orte und Unternehmen, die in einem Text erwähnt werden. Aktuell erkennt OpenCalais ca. 40 Typen und noch [...]

Microsoft kauft semantische Suchmaschine Powerset

Gerüchte gab es ja schon länger, jetzt ist es offiziell: Powerset aus San Francisco wird in die Live Plattform von Microsoft integriert. Der Kaufpreis wurde nicht genannt, aber es stehen 100 Millionen Dollar zur Debatte. Wenn man den Lärm bedenkt, den die PR Abteilung von Powerset verursacht hat über die letzten Monate ist das kein [...]

Semantic Turn

Der “Semantic Turn” sei da, schreibt die Computerwelt in ihrem Artikel “Die Zukunft der Suche ist semantisch”.
Für mich jetzt schon der Hype 2008

Maschinelle Übersetzung

Philipp Koehn von der Universität Edinburgh verwaltet unter www.statmt.org eine sehr schöne Linksammlung zur statistischen maschinellen Übersetzung. Grundlagenpapers, Konferenzen, Software und Korpora. Alles vorhanden.

Auch das kann man parsen!

Nachdem sich vor einiger Zeit Miss South Caroline offenbart hatte mit einer etwas indisponierten Anwort (hier das Video) auf die Frage, warum wohl viele Amerikaner die USA nicht auf einer Karte finden, haben die Syntax Profis bei Powerset sich der Sache angenommen und die Antwort durch ihren XLE Parser geschickt.
Input (Quelle):
I personally believe that [...]

Daten, Daten, Daten

Peter Norvig sprach beim Google Developer Day im Mai 2007 über “Theorizing from data”.
Google hat wohl mit die größte Sammlung an Textdaten der Welt und nutzt die daraus gewonnenen Informationen, um Anwendungen wie Clustering und (statistische) maschinelle Übersetzung zu trainieren. Die generelle Aussage ist, dass statistische Modelle sich als robuster erwiesen haben als linguistische Modelle [...]

Informationsextraktion: Eine kleine Herausforderung

Informationen über Personen aus websites zu extrahieren scheint auf den ersten Blick kein schweres Problem zu sein, aber bei näherer Betrachtung ergeben sich doch Komplikationen. Namen, Vornamen, Geburtsdaten usw. können in vielen verschiedenen Formaten auftreten. Wer ein bischen knobeln möchte, kann an der ‘Mini Challenge’ der Personen-Suchmaschine Spock teilnehmen und Information über Menschen aus wikipedia [...]