Ce site utilise des cookies. Pour en savoir plus sur notre politique d'utilisation des cookies, cliquez Politique d'utilisation des cookies

Stage - Liens entre les bases lexicales riches du français et Wordnet & UNL (H/F) - Le Plessis-Robinson - CS

Publiée le: 11/3/2018

Résumé de l'offre

Description de l'offre

Avec 1800 collaborateurs pour un chiffre d'affaires de 170 millions d'euros en 2017, CS s'affirme comme un concepteur, intégrateur et opérateur de systèmes critiques de tout premier plan. Nos clients européens et mondiaux sont dans les secteurs de la Défense, de l’Aéronautique, du Spatial, de l’Énergie, du Transport, des secteurs public et privé. CS réalise environ 80% de ses projets au forfait et est coté sur le marché Euronext Paris.

Afin de renforcer notre équipe parisienne de la Business Unit Défense, Sécurité & ATM, nous recherchons un stagiaire - Liens entre les bases lexicales riches du français et Wordnet & UNL (H/F)

Dans le domaine du contrôle du trafic aérien, les contrôleurs interagissent avec les pilotes au travers d’échanges vocaux. Une des activités de la BU DSA est de concevoir et réaliser une gamme de produits incluant systèmes de communication vocale (VCS), enregistreurs et simulateurs.

Dans ce contexte, nous souhaitons élaborer une base de données lexicales riche et couvrante pour le français, en nous appuyant sur des ressources libres disponibles comme le LVF et le DEM, NooJ ou encore Apertium. Devant à terme être liées à d’autres langues, nous souhaitons que les entrées de cette base de données soient reliées aux synsets de Wordnet et aux UW d’UNL.

Le stagiaire participera aux tâches suivantes :

  • Faire un état de l’art des ressources libres du français
  • Réaliser une base de données lexicale en Sqlite à partir d’un ensemble cohérent de ressources libres
  • Relier les entrées de la base de données obtenue aux synsets Wordnet et aux UW UNL
  • Rédaction d’un rapport

Profil requis

Étudiant(e) en 4ème ou 5ème année d'un cycle ingénieur ou équivalent, vous êtes à la recherche d'un stage.

Vous disposez idéalement des compétences techniques suivantes :

  • Morphologie
  • Lexicologie
  • Sémantique (Wordnet, UNL)
  • Bases de données lexicales