Thomas Proisl
Thomas Proisl
seit 2009 | Wissenschaftlicher Mitarbeiter am Lehrstuhl für Korpus- und Computerlinguistik der FAU |
2021 | Lehrbeauftragter an der Abteilung Germanistische Linguistik der Georg-August-Universität Göttingen |
2019 | Professurvertretung der W2-Professur „Computerlinguistik und Kognitionswissenschaft“ an der Universität Osnabrück |
2018 | Dr. phil. in Linguistischer Informatik, FAU Dissertation: The cooccurrence of linguistic structures, ausgezeichnet mit dem STAEDTLER Promotionspreis und dem GSCL-Promotionspreis zum Gedenken an Wolfgang Hoeppner |
2014 | Research Assistant bei der Symanto Research GmbH & Co. KG |
2009–2014 | Verschiedene Verträge als Wissenschaftlicher Mitarbeiter, Lehrkraft für besondere Aufgaben und Lehrbeauftragter am Lehrstuhl für Anglistik, insbesondere Linguistik, der FAU |
2009 | Zusatzzertifikat zum Magisterabschluss: European Masters of Language and Speech |
2005–2009 | Magisterstudium Linguistische Informatik und Anglistik: Linguistik an der FAU Magisterarbeit: Integration von Valenzdaten in die grammatische Analyse unter Verwendung des Valency Dictionary of English |
- Sprachtechnologie
- Korpuslinguistik, „Kollo-Phänomene“
- Digital Humanities
- Proisl, Thomas. The cooccurrence of linguistic structures. Erlangen: FAU University Press, 2019.
DOI: 10.25593/978-3-96147-201-7
BibTeX: Download
Beiträge in Fachzeitschriften
- Proisl, Thomas. "Use words, not constructions! A new perspective on the unit of analysis in collostructional analysis." International Journal of Corpus Linguistics (2022).
DOI: 10.1075/
BibTeX: Download - Büttner, Andreas, et al. "»Delta« in der stilometrischen Autorschaftsattribution." Zeitschrift für digitale Geisteswissenschaften (2017).
DOI: 10.17175/2017_006
BibTeX: Download - Evert, Stephanie, et al. "Understanding and explaining Delta measures for authorship attribution." Digital Scholarship in the Humanities 32.suppl_2 (2017): ii4–ii16.
DOI: 10.1093/llc/fqx023
BibTeX: Download - Uhrig, Peter, and Thomas Proisl. "Less hay, more needles – using dependency-annotated corpora to provide lexicographers with more accurate lists of collocation candidates." Lexicographica 28 (2012): 141–179.
DOI: 10.1515/lexi.2012-0009
BibTeX: Download
Beiträge in Sammelwerken
- Adrian, Axel, et al. "Manuelle und automatische Anonymisierung von Urteilen." Digitalisierung von Zivilprozess und Rechtsdurchsetzung. Hrg. Adrian, Axel/Kohlhase, Michael/Evert, Stephanie/Zwickel, Martin, 2022. 173-197.
BibTeX: Download - Dimpel, Friedrich Michael, and Thomas Proisl. "Gute Wörter für Delta: Verbesserung der Autorschaftsattribution durch autorspezifische distinktive Wörter." DHd 2019. Digital Humanities: multimedial & multimodal. Konferenzabstracts. Ed. Patrick Sahle, 2019. 296–299.
BibTeX: Download - Uhrig, Peter, Stephanie Evert, and Thomas Proisl. "Collocation Candidate Extraction from Dependency-Annotated Corpora: Exploring Differences across Parsers and Dependency Annotation Schemes." Lexical Collocation Analysis: Advances and Applications. Ed. Cantos-Gómez P, Almela-Sánchez M, Cham: Springer International Publishing, 2018. 111–140.
DOI: 10.1007/978-3-319-92582-0_6
BibTeX: Download - Proisl, Thomas. "Automatically exploring lexical tendencies in English." Corpus Linguistics and Variation in English: Theory and Description. Ed. Mukherjee Joybrato, Huber Magnus, Amsterdam: Rodopi, 2012. 143–154.
DOI: 10.1163/9789401207713_012
BibTeX: Download
Beiträge bei Tagungen
- Blombach, Andreas, et al. "Exploring Lexical Diversities." Proceedings of the Digital Humanities 2022, Tokyo 2022. 130-134.
BibTeX: Download - Proisl, Thomas, and Gabriella Lapesa. "KLUMSy@KIPoS: Experiments on Part-of-Speech Tagging of Spoken Italian." Proceedings of the 7th Evaluation Campaign of Natural Language Processing and Speech Tools for Italian (EVALITA 2020), Online Ed. Basile V, Croce D, Di Maro M, Passaro L,, 2020.
DOI: 10.4000/books.aaccademia.7780
BibTeX: Download - Blombach, Andreas, et al. "A Corpus of German Reddit Exchanges (GeRedE)." Proceedings of the 12th International Conference on Language Resources and Evaluation, LREC 2020, Marseille Ed. Nicoletta Calzolari, Frederic Bechet, Philippe Blache, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Helene Mazo, Asuncion Moreno, Jan Odijk, Stelios Piperidis, European Language Resources Association (ELRA), 2020. 6310-6316.
BibTeX: Download - Blombach, Andreas, et al. "A new German Reddit corpus." Proceedings of the 15th Conference on Natural Language Processing, KONVENS 2019, Erlangen-Nurnberg German Society for Computational Linguistics and Language Technology, 2020. 278-279.
BibTeX: Download - Proisl, Thomas, et al. "EmpiriST Corpus 2.0: Adding Manual Normalization, Lemmatization and Semantic Tagging to a German Web and CMC Corpus." Proceedings of the 12th International Conference on Language Resources and Evaluation, LREC 2020, Marseille Ed. Nicoletta Calzolari, Frederic Bechet, Philippe Blache, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Helene Mazo, Asuncion Moreno, Jan Odijk, Stelios Piperidis, European Language Resources Association (ELRA), 2020. 6142-6148.
BibTeX: Download - Proisl, Thomas, et al. "The_Illiterati: Part-of-Speech Tagging for Magahi and Bhojpuri Without Even Knowing the Alphabet." Proceedings of the First International Workshop on NLP Solutions for Under Resourced Languages (NSURL 2019), Trento Association for Computational Linguistics, 2019. 73-79.
BibTeX: Download - Proisl, Thomas, et al. "EmotiKLUE at IEST 2018: Topic-Informed Classification of Implicit Emotions." Proceedings of the 9th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis, Brüssel Ed. Balahur A, Mohammad SM, Hoste V, Klinger R, Brussels: Association for Computational Linguistics, 2018. 235–242.
DOI: 10.18653/v1/w18-6234
BibTeX: Download - Kabashi, Besim, and Thomas Proisl. "Albanian Part-of-Speech Tagging: Gold Standard and Evaluation." Proceedings of the 11th Language Resources and Evaluation Conference, Miyazaki Ed. Calzolari N, Choukri K, Cieri C, Declerck T, Goggi S, Hasida K, Isahara H, Maegaard B, Mariani J, Mazo H, Moreno A, Odijk J, Piperidis S, Tokunaga T, Miyazaki: European Language Resources Association, 2018. 2593–2599.
BibTeX: Download - Proisl, Thomas, et al. "Delta vs. N-Gram Tracing: Evaluating the Robustness of Authorship Attribution Methods." Proceedings of the 11th Language Resources and Evaluation Conference, Miyazaki Ed. Calzolari N, Choukri K, Cieri C, Declerck T, Goggi S, Hasida K, Isahara H, Maegaard B, Mariani J, Mazo H, Moreno A, Odijk J, Piperidis S, Tokunaga T, Miyazaki: European Language Resources Association, 2018. 3309–3314.
BibTeX: Download - Proisl, Thomas. "SoMeWeTa: A Part-of-Speech Tagger for German Social Media and Web Texts." Proceedings of the 11th Language Resources and Evaluation Conference, Miyazaki Ed. Calzolari N, Choukri K, Cieri C, Declerck T, Goggi S, Hasida K, Isahara H, Maegaard B, Mariani J, Mazo H, Moreno A, Odijk J, Piperidis S, Tokunaga T, Miyazaki: European Language Resources Association, 2018. 665–670.
BibTeX: Download - Proisl, Thomas, et al. "Translation Inference across Dictionaries via a Combination of Graph-based Methods and Co-occurrence Statistics." Proceedings of the Shared Task on Translation Inference Across Dictionaries, Galway Ed. McCrae J, Bond F, Buitelaar P, Cimiano P, Declerck T, Gracia J, Kernerman I, Ponsoda E, Ordan N, Piasecki M, CEUR, 2017. 94–102.
BibTeX: Download - Evert, Stephanie, et al. "E-VIEW-Alation – a Large-Scale Evaluation Study of Association Measures for Collocation Identification." Proceedings of the eLex 2017, Leiden Ed. Iztok K, Carole T, Miloš J, Jelena K, Simon K, and Vít B, Brno: Lexical Computing, 2017. 531–549.
BibTeX: Download - Kabashi, Besim, and Thomas Proisl. "A Proposal for a Part-of-Speech Tagset for the Albanian Language." Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), Portorož Ed. Calzolari Nicoletta, Choukri Khalid, Declerck Thierry, Grobelnik Marko, Maegaard Bente, Mariani Joseph, Moreno Asuncion, Odijk Jan, Piperidis Stelios, Paris: European Language Resources Association (ELRA), 2016. 4305–4310.
BibTeX: Download - Evert, Stephanie, et al. "„Delta“ in der stilometrischen Autorschaftsattribution." Präsentiert bei DHd 2016, Leipzig Leipzig: Nisaba, 2016.
BibTeX: Download - Proisl, Thomas, and Peter Uhrig. "SoMaJo: State-of-the-art tokenization for German web and social media texts." Proceedings of the 10th Web as Corpus Workshop (WAC-X), Berlin Ed. Cook P, Evert S, Schäfer R, Stemle E, Berlin: Association for Computational Linguistics (ACL), 2016. 57-62.
DOI: 10.18653/v1/W16-2607
BibTeX: Download - Plotnikova, Nataliia, et al. "SemantiKLUE: Semantic Textual Similarity with Maximum Weight Matching." Proceedings of the Proceedings of the 9th International Workshop on Semantic Evaluation (SemEval 2015) Denver, Colorado, 2015. 111--116.
BibTeX: Download - Evert, Stephanie, et al. "Towards a better understanding of Burrows's Delta in literary authorship attribution." Proceedings of the Proceedings of the Fourth Workshop on Computational Linguistics for Literature Denver, CO, 2015. 79--88.
BibTeX: Download - Proisl, Thomas, et al. "SemantiKLUE: Robust semantic similarity at multiple levels using maximum weight matching." Proceedings of the Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval-2014) Dublin, Ireland, 2014. 532–540.
BibTeX: Download - Evert, Stephanie, et al. "SentiKLUE: Updating a polarity classifier in 48 hours." Proceedings of the Proceedings of the 8th International Workshop on Semantic Evaluation (SemEval-2014) Dublin, Ireland, 2014. 551–555.
BibTeX: Download - Greiner, Paul, et al. "KLUE-CORE: A regression model of semantic textual similarity." Proceedings of the Second Joint Conference on Lexical and Computational Semantics (*SEM), Volume 1: Proceedings of the Main Conference and the Shared Task: Semantic Textual Similarity Atlanta, Georgia, USA: Association for Computational Linguistics, 2013. 181–186.
BibTeX: Download - Proisl, Thomas, et al. "KLUE: Simple and robust methods for polarity classification." Proceedings of the Second Joint Conference on Lexical and Computational Semantics (*SEM), Volume 2: Proceedings of the Seventh International Workshop on Semantic Evaluation (SemEval 2013) Atlanta, GA: Association for Computational Linguistics, 2013. 395–401.
BibTeX: Download - Proisl, Thomas, and Peter Uhrig. "Efficient Dependency Graph Matching with the IMS Open Corpus Workbench." Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC'12), Istanbul Ed. Calzolari Nicoletta, Choukri Khalid, Declerck Thierry, Doğan Mehmet Uğur, Maegaard Bente, Mariani Joseph, Moreno Asuncion, Odijk Jan, Piperidis Stelios, Istanbul: European Language Resources Association (ELRA), 2012. 2750–2756.
BibTeX: Download - Proisl, Thomas, and Besim Kabashi. "Using High-Quality Resources in NLP: The Valency Dictionary of English as a Resource for Left-Associative Grammars." Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC'10), Valletta Ed. Calzolari Nicoletta, Choukri Khalid, Maegaard Bente, Mariani Joseph, Odijk Jan, Piperidis Stelios, Rosner Mike, Tapias Daniel, Valletta: European Language Resources Association (ELRA), 2010. 3878–3881.
BibTeX: Download - Handl, Johannes, et al. "JSLIM – Computational morphology in the framework of the SLIM theory of language." Proceedings of the Systems and Frameworks for Computational Morphology (SCFM 2009), Zürich Ed. Mahlow Cerstin, Piotrowski Michael, Berlin: Springer, 2009. 10-27.
DOI: 10.1007/978-3-642-04131-0_2
BibTeX: Download
Komplexität literatischer Werke aus stilometrischer Sicht im Digital Humanities-Zentrum KALLIMACHOS
(Drittmittelfinanzierte Gruppenförderung – Teilprojekt)
Titel des Gesamtprojektes: KALLIMACHOS – Zentrum für digitale Edition und quantitative Analyse an der Universität Würzburg
Laufzeit: 1. Oktober 2017 - 30. September 2019
Mittelgeber: BMBF / VerbundprojektIm Rahmen dieses Teilprojekts entwickelt der Lehrstuhl für Korpus- und Computerlinguistik robuste Maße für lexikalische Komplexität, erweitert den Komplexitätsbegriff über die gängige vocabulary richness hinaus und implementiert die Ergebnisse in einerfrei verfügbaren stilometrischen Toolbox.
Korpuslinguistische Methoden und statistische Auswertungen im Digital Humanities-Zentrum KALLIMACHOS
(Drittmittelfinanzierte Gruppenförderung – Teilprojekt)
Titel des Gesamtprojektes: KALLIMACHOS – Zentrum für digitale Edition und quantitative Analyse an der Universität Würzburg
Laufzeit: 1. Oktober 2014 - 30. September 2017
Mittelgeber: BMBF / Verbundprojekt
URL: diesem Teilprojekt soll das Verständnis für die mathematischen Eigenschaften der literarischen Autorschaftsattribution mit stilometrischen Abstandsmaßen verbessert werden. Außerdem ist die Trennung von Autor-, Gattungs- und Epochensignal in stilometrischen Analysen von großem Interesse, da dies wiederum der Zuverlässigkeit einer automatischen Genreklassifikationen nutzen könnte. Darüber hinaus sollen zuverlässige statistische Methoden zur Signifikanzüberprüfung der festgestellten Entwicklungen ausgearbeitet, implementiert und erprobt werden.
Keine passenden Datensätze gefunden.
FAU-interne Gremienmitgliedschaften / Funktionen
- Interdisziplinary Center - member, Interdisziplinäres Zentrum für Lexikografie, Valenz- und Kollokationsforschung
- Interdisziplinary Center - member, Interdisziplinäres Zentrum für Digitale Geistes- und Sozialwissenschaften
- : Promotionspreis zum Gedenken an Wolfgang Hoeppner (Gesellschaft für Sprachtechnologie und Computerlinguistik e.V. (GSCL)) – 2020
- : Promotionspreis (STAEDTLER-Stiftung) – 2020