Nous sommes étudiants en première année de master « Traitement automatique des langues (TAL) » à l’INaLCO. Dans le cadre du cours « Programmation et projet encadré », nous menons à bien un projet qui consiste à analyser le comportement sémantique d’un mot dans un corpus multilingue en ligne. Nous avons choisi d’étudier le mot « kebab » en japonais, persan et turc.
Les principales questions auxquelles nous aurons à répondre sont :
– le mot et ses équivalents se comportent-ils de la même manière quelle que soit la langue ?
– existe-t-il, au contraire, des variations en fonction des langues ?
Le journal de travail sur ce blog permet de suivre pas à pas notre travail de programmation. En parallèle, nous mettrons en place un site web qui contiendra les résultats de nos travaux.