Personenprofil
Kurzprofil
Gerhard Heyer ist Professor emeritus für Automatische Sprachverarbeitung. Vor seiner Universitätstätigkeit war er als Systemspezialist und Leiter von Forschungs- und Entwicklungsaufgaben in der Großindustrie und einer eigenen Firma tätig. Forschungsschwerpunkte sind die automatische semantische Verarbeitung von Text, Forschungsdateninfrastrukturen und Anwendungen des Text Mining u.a. in den Digital Humanities. Sein Buch zum Text Mining (Neuauflage 2022, https://link.springer.com/book/9783658359683) ist das deutsche Standardlehrbuch zu diesem aktuellen Thema. Das von ihm mitdefinierte NFDI-Projekt Text+ leitet er als PI an der Sächsischen Akademie der Wissenschaften. Prof. Heyer ist Beisitzer im Vorstand des Instituts für Angewandte Informatik (InfAI), einem An-Institut der Universität Leipzig zum Wissens- und Technologietransfer in der Informatik, das er 2006 mitgegründet hat, sowie Mitglied im Beirat Digitale Wertschöpfung des sächsischen Ministeriums für Wirtschaft und Arbeit (SMWA).
Berufliche Laufbahn
- seit 01/1985
Lange Jahre war er als Systemspezialist und Leiter von Forschungs- und Entwicklungsaufgaben zu Sprach- und Multimediaprodukten in der Großindustrie und einer eigenen Firma tätig, die eines der ersten Translation Memory Systeme entwickelt hat. An die Universität Leipzig ist er 1994 als einer der ersten Professoren für Automatische Sprachverarbeitung im Fachbereich Informatik berufen worden. Grundlegender Forschungsansatz der Abteilung war dabei stets eine enge Verbindung von Daten und Verfahren.
Ausbildung
- 08/1973 - 12/1984
Gerhard Heyer hat Philosophie, Mathematische Logik und Linguistik an den Universitäten Cambridge (M.A.1980) und Bochum (Dr.phil. 1983) studiert. Daran anschließend hat er einen einjährigen Forschungsaufenthalt zur automatischen Verarbeitung natürlicher Sprache an der University of Michigan, Ann Arbor (USA), als Visiting Assistant Professor und Feodor-Lynen Forschungsstipendiat der Alexander-von-Humboldt Stiftung verbracht.
Gremien Mitgliedschaften
- seit 01/2018
Prof. Heyer ist Mitglied in zahlreichen wissenschaftlichen Beiräten und Beisitzer im Vorstand des Instituts für Angewandte Informatik (InfAI), einem An-Institut der Universität Leipzig. Von 1997 bis 2006 war er Mitglied des wissenschaftlichen Beirats des Informationswissenschaftlichen Zentrums (IZ) im GESIS-Verbund, von 2006 bis 2007 auch Mitglied des GESIS-Kuratoriums.
Sein Forschungsschwerpunkt liegt in der automatischen semantischen Verarbeitung von Text. Neben zahlreichen Veröffentlichungen zu diesem Thema – u.a. dem deutschsprachigen Text Mining Lehrbuch „Text Mining: Wissensrohstoff Text“ (W3L-Verlag, 32011, Überarbeitung bei Springer Campus 2022) – hat er in diesem Bereich auch eine Vielzahl von Forschungsprojekten durchgeführt. Unter den neueren Projekten sind besonders seine Arbeiten zu Forschungsinfrastrukturen (CLARIN-D,CLARIAH und Text+), zur Informations- und Relationenextraktion aus dem zusammen mit der GESIS von der DFG geförderten Projekt iLCM (interactive Leipzig Corpus Miner, http://ilcm.informatik.uni-leipzig.de/) und der Anwendung von Verfahren des maschinellen Lernens bei OCR und HTR hervorzuheben, so u.a. im DFG-Verbundprojekt OCR-D, Koordinierte Förderinitiative zur Weiterentwicklung von Verfahren für die Optical-Character-Recognition.
- iLCM - Eine virtuelle Forschungsumgebung für large-scale qualitative DatenHeyer, GerhardLaufzeit: 02.2017 – 12.2022Mittelgeber: DFG Deutsche ForschungsgemeinschaftBeteiligte Organisationseinheiten der UL: Automatische Sprachverarbeitung
- Recognition and Enrichment of Archival Documents - READHeyer, GerhardLaufzeit: 01.2016 – 06.2021Mittelgeber: EU Europäische UnionBeteiligte Organisationseinheiten der UL: Automatische Sprachverarbeitung
- Sprachdatenressourcen – Deutscher Wortschatz, multilinguale Corpora und Wörter-des-TagesHeyer, GerhardLaufzeit: 05.2011 – laufendBeteiligte Organisationseinheiten der UL: Automatische Sprachverarbeitung
- Informationsverteilung und Sprachstruktur – Korrelation von grammatischen Ausprägungen der Nomen/Verb-Unterscheidung und lexikalischem Informationsgehalt im Tagalog, Indonesischen und DeutschenHeyer, GerhardLaufzeit: 07.2020 – 06.2022Mittelgeber: DFG Deutsche ForschungsgemeinschaftBeteiligte Organisationseinheiten der UL: Automatische Sprachverarbeitung
- CLARIN-DHeyer, GerhardLaufzeit: 05.2011 – 09.2020Mittelgeber: BMBF Bundesministerium für Bildung und ForschungBeteiligte Organisationseinheiten der UL: Automatische Sprachverarbeitung
- Niekler, A.; Bleier, A.; Kahmann, C.; Posch, L.; Wiedemann, G.; Erdogan, K.; Heyer, G.; Strohmaier, M.ILCM - A Virtual Research Infrastructure for Large-Scale Qualitative DataProceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). 2018.
- Heyer, G.; Eckart, T.; Goldhahn, D.Was sind IT-basierte Forschungsinfrastrukturen für die Geistes- und Sozialwissenschaften und wie können sie genutzt werden?Information - Wissenschaft & Praxis. 2015. 66 (5/6). S. 295–303.
- Remus, R.; Quasthoff, U.; Heyer, G.SentiWS - a publicly available German-language resource for sentiment analysisIn: Calzolari, N.; Choukri, K.; Maegaard, B. (Hrsg.)Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC'10). Valetta: ELRA. 2010. S. 1168–1171.
- Yousef, T.; Schlaf, A.; Borst-Graetz, J.; Niekler, A.; Heyer, G.Press Freedom Monitor: Detection of Reported Press and Media Freedom Violations in Twitter and News Articles2021. S. 153–159.
- Schröder, C.; Bürgl, K.; Annanias, Y.; Niekler, A.; Müller, L.; Wiegreffe, D.; Bender, C.; Mengs, C.; Scheuermann, G.; Heyer, G.Supporting Land Reuse of Former Open Pit Mining Sites using Text Classification and Active Learning2021. S. 4141–4152.