DARPA und die Blogger

Pentagon forscht zur Sprachanalyse.

Die Hightech-Forschungsbehörde DARPA des US-Verteidigungsministeriums verfolgt ein Forschungs- und Entwicklungsprogramm namens Global Autonomous Language Exploitation (GALE). Ambitioniertes Ziel: Transkription gesprochener Sprache, Übersetzung und „Destillation“ von Textdokumenten — per Computer. Wired News berichtet über praktische Anwendungen von Spracherkennung, -übersetzung und -synthese in Kampfgebieten.

Dabei interessiert sich das Pentagon auch für Blogger:

Engines must be able to process naturally-occurring speech and text of all the following types: broadcast news, talk shows, newswire, newsgroups, weblogs and telephone conversations. The source languages will be English, Chinese and Arabic plus surprise languages to be announced later.

Das Linguistic Data Consortium sammelt bereits Material, mit dem Forscher arbeiten können — unter anderem Texte aus englischen, arabischen und chinesischen Weblogs.

Um die Größenordnung des GALE-Programms deutlich zu machen: Der Auftrag HR0011-06-C-0023 aus diesem Programm, den SRI International gewonnen hat, hat einen Wert von 73,4 Millionen US-Dollar.