Sulci Workshop by Yohan Boniface :: 2012-02-15 7pm :

Version Française en dessous ————————
Built in Libération’s labs for internal use, Sulci is an open-source “supervised text mining tool with semantic inference”. Simply said Sulci extract text subjects.
The engine is powered by several natural language processing algorithms
tokenization, stemming, POS tagging and weighted statistical learning.

While tinkering with Sulci internals, the workshop will introduce these classic NLP algorithms.

English version above ————————
Développé dans le labo de Libération pour ses besoins internes, Sulci est une application open-source de «text-mining par inférence sémantique à apprentissage supervisé». Si on ne veut pas utiliser de gros mot, on peut dire que son boulot est de *déterminer de quoi parle un texte*.
Son moteur est basé sur de nombreux algorithmes de traitement automatique du langage (TAL), de la tokénisation à l’apprentissage par pondération statistique, en passant par le POS tagging ou la lemmatisation.
En rentrant un peu dans le moteur de Sulci, cet atelier-présentation sera l’occasion de faire connaissance avec ces algorithmes classiques du TAL.