diff --git a/README.md b/README.md index e04d238df57d1273adfbfca786d61184f9ead0a4..36d847149e7c5b20be2cb48ceb59cc9648a8f3e9 100644 --- a/README.md +++ b/README.md @@ -13,19 +13,20 @@ Annexes A et B du mémoire de Lala, M.(2017). Consulter les annexes D et E. Pour Bras, M., Vieu, L., Joret, M., Pépin-Boutin, A., Poujade, C. & Roze, C. (2021). Vers un corpus de textes d’élèves annoté en relations de discours. *Langue française*, 211, 115-129. https://doi-org.gorgone.univ-toulouse.fr/10.3917/lf.211.0115 - Article lié à ToNy: Muller, P., Braud, C., & Morey, M. (2019). ToNy: Contextual embeddings for accurate multilingual discourse segmentation of full documents. In *Proceedings of the Workshop on Discourse Relation Parsing and Treebanking* 2019 (pp. 115-124). Association for Computational Linguistics. +- Article lié à DISCUT: +Morteza Kamaladdini Ezzabady, Philippe Muller, and Chloé Braud. 2021. Multi-lingual Discourse Segmentation and Connective Identification: MELODI at Disrpt2021. In *Proceedings of the 2nd Shared Task on Discourse Relation Parsing and Treebanking* (DISRPT 2021), pages 22–32, Punta Cana, Dominican Republic. Association for Computational Linguistics. ### Autre références : Rappel/Approfondissement - Manuel d'annotation RST DT : Carlson, L., & Marcu, D. (2001). Discourse tagging reference manual. *ISI Technical Report ISI-TR-545*, 54(2001), 56. https://www.isi.edu/~marcu/discourse/tagging-ref-manual.pdf - Séminaire Chloé Braud (Thématiques actuelles de la recherche en TAL): -AnDiAMO: Analyzing Discourse Automatically, with Multiple Objectives. http://w3.erss.univ-tlse2.fr/UETAL/2022-2023/SeminaireBraud.pdf +AnDiAMO: Analyzing Discourse Automatically, with Multiple Objectives. http://w3.erss.univ-tlse2.fr/UETAL/2023-2024/Braud.pdf ## Déroulé du TP - Rappels théoriques : discours, segmentation discursive, relations discursives... - Présentation : campagne DISRPT, modèles de segmentation état de l'art (Discut, DiscoDisco). -- (?) Présentation de Leïla Fabre en lien avec son mémoire de M1 *La segmentation dans les écrits scolaires.* - Analyse de données segmentées en différentes langues (chinois, français, anglais..) différences entres gold et prédictions, données issues de DISRPT 2021. - Utilisation d’un modèle pré-entrainé (ToNy) sur de nouvelles données, en utilisant données ECALM (français) - Transformation du format conll-12 de ECALM au format conll de DISRPT pouvant être pris en entrée de DisCut.