\n In vielen Wörterbüchern unterstützen Korpusbelege die lexikographische Beschreibung eines Wortes. \n Die Auswahl passender und hilfreicher Korpusbelege stellt eine Herausforderung dar, weil die Operationalisierung von Kriterien wie bspw. „Qualität“ und „Angemessenheit“ von Korpusbelegen in Messgrößen nicht trivial ist und professionelle Lexikograph*innen im Einzelfall nicht immer ein einstimmiges Urteil darüber erzielen, welcher Beleg am besten in die Beschreibung eines Lemmas passt.\n
\n\n Um Lexikograph*innen in ihrem Entscheidungsprozess zu unterstützen, soll ein System zur Extraktion, Klassifizierung und Bewertung von Korpusbelegen entwickelt und in das lexikalische Informationssystem des DWDS integriert werden. \n Das Empfehlungssystem schlägt für jedes Lemma eine Gruppe von Satzbelegen vor, die jeweils als hochwertig angesehene werden und zusammen eine hohe Vielfalt und Facetten und Nuancen des Wortgebrauchs aufweisen. \n Das Empfehlungssystem soll so weit entwickelt werden, dass die externen Nutzer*innen des lexikalischen Informationssystems auch für noch nicht vollständig lexikalisch behandelte Lemmata ausreichend gute Korpusbelege vorgeschlagen bekommen.\n
\n\n Die Applikation dient vor allem zur Beurteilung hinsichtlich der Güte und Vielfalt der Satzbelege.\n Zur Bewertung der Güte wird das Best-Worst-Scaling Verfahren eingesetzt. \n Den Annotator*innen werden vier Satzbelege angezeigt, von denen sie den besten und den schlechtesten Satzbeleg auswählen. \n Die resultierenden Ranglisten werden als Zielvariablen in einem Überwachten Lernverfahren eingesetzt. \n Zur Bewertung der Vielfalt von Satzbelegen für ein bestimmtes Lemma müssen Benutzer*innen anhand von Schiebereglern angeben, inwiefern sie Güte gegenüber Vielfalt abwägen und welche Arten von Vielfalt präferiert werden (z.B. unterschiedliche Satzstrukturen, Semantik, Quellenhinweise). \n Mit einem Quadratischen Optimierungsverfahren werden anhand dieser Parameter die angezeigten Satzbelege neusortiert, bis der*die Benutzer*in mit der angezeigten Auswahl zufrieden ist.\n
\nDiese Arbeit wurde von der Deutschen Forschungsgemeinschaft (DFG) gefördert - 433249742. Projektlaufzeit: 2020-2023.
\n https://gepris.dfg.de/gepris/projekt/433249742\n\n In vielen Wörterbüchern helfen Korpusbelege bei der Beschreibung von einem Wort. Korpusbelege oder Satzbelege sind Beispiele aus anderen Texten. \n Die Auswahl von Korpusbelegen ist nicht leicht. \n Es ist schwer zu sagen, wann ein Korpusbeleg „gut“ oder „angemessen“ ist. \n Die Autoren von Wörterbüchern heißen Lexikographen. \n Sie wählen die Korpusbeispiele für Wörter aus. \n Oft sind sie sich uneinig, welches Beispiel das Wort am besten beschreibt.\n
\n\n Lexikographen sollen Hilfe bei der Entscheidung für einen guten Korpusbeleg bekommen. \n Deshalb entwickeln wir ein Programm, das Korpusbelege raussucht, in Klassen einteilt und bewertet.\n Das Programm soll Teil vom DWDS werden. \n Es zeigt für jedes Wort eine Gruppe von Beispielen an. Die Beispiele beschreiben das Wort besonders gut. \n Sie zeigen mehrere Kontexte, in denen das Wort vorkommen kann. \n Manchmal haben Wörter noch keinen vollständigen Wörterbucheintrag. \n Das Programm soll trotzdem schon gute Beispiele für diese Wörter anzeigen.\n
\n\n Die App ist dazu da, gute und vielfältige Satzbelege zu bewerten. Dafür nutzen wir das Best-Worst-Scaling Verfahren. \n Die Nutzer sehen vier Satzbelege. Sie wählen den besten und den schlechtesten aus. \n Daraus entstehen Ranglisten. Also Listen, die zeigen, welches Beispiel die Nutzer gut oder schlecht finden. \n Das Programm lernt daraus, selbst solche Ranglisten zu erstellen. \n Es kann dann sagen, welche Satzbelege gut und vielfältig sind. In der Informatik heißt das Überwachtes Lernverfahren. \n Manchen Nutzern ist wichtiger, dass ein Satzbeleg gut oder vielfältig ist. \n Das zeigen sie mit Schiebereglern. \n Sie sollen auch sagen, was genau ihnen bei Vielfalt wichtig ist. \n Zum Beispiel die Struktur vom Satz, die Bedeutung oder die Quelle. \n Das merkt sich das Programm und zeigt den Nutzern immer neue passende Satzbelege an. \n Die werden so lange neu sortiert, bis der Nutzer mit den Satzbelegen zufrieden ist. \n Die Methode, mit der die Satzbelege neu sortiert werden, heißt Quadratisches Optimierungsverfahren.\n
\n\n Diese Arbeit wurde von der Deutschen Forschungsgemeinschaft (DFG) gefördert - 433249742. Projektlaufzeit: 2020-2023.\n
\n https://gepris.dfg.de/gepris/projekt/433249742\n\n In many dictionaries, corpus references support the lexicographical description of a word. The selection of suitable and helpful sentence examples is a challenge because the operationalization of broad criteria such as 'quality' and 'appropriateness' of sentence examples into metrics is not trivial and professional lexicographers do not always achieve an unanimous judgment which sentence example fits best in the description of a lemma.\n
\n\n In order to support lexicographers in their decision-making process, a system for the extraction, classification and evaluation of sentence examples is to be developed and integrated into the lexical information system of the DWDS. \n The recommendation system suggests a group of sentence examples for each lemma, each of which is considered to be of high quality and together have a high variety and facets and nuances of word usage. \n The recommendation system is to be developed to such an extent that sufficiently good sentence examples are suggested to the external users of the lexical information system even for lemmas that have not yet been fully lexically treated by an expert.\n
\n\n The application is primarily used to assess the goodness and diversity of sentence examples. The best-worst scaling method is used to assess the goodness. \n The annotators are shown four sentence examples from which they can select the best and the worst sentence example. \n The resulting rankings are used as target variables in a supervised learning algorithm. \n In order to evaluate the diversity of sentence examples for a given lemma, users must use sliders to indicate to what extent they trade off goodness over diversity and which types of diversity are preferred (e.g. different grammar, semantics, source references). \n With a quadratic optimization algorithm, the displayed sets of sentence examples are re-sorted based on these parameters until the user is satisfied with the displayed selection.\n
\n\n This work was funded by the Deutsche Forschungsgemeinschaft (DFG, German Research Foundation) - 433249742. Project duration: 2020-2023.\n
\n https://gepris.dfg.de/gepris/projekt/433249742\n\n Dans plusieurs dictionnaires, la description lexicographique des mots est étayée par des exemples de corpus. Le choix d'exemples appropriés et utiles constitue un défi en raison de la difficulté d'opérationnaliser en métrique des critères tels que la „qualité“ et l'„adéquation“. \n De plus, les lexicographes professionel·le·s n'arrivent pas toujours à déterminer à l'unanimité quel est l'exemple le plus approprié pour décrire un lemme.\n
\n\n Un système d'extraction, de classification et d'évaluation des exemples de corpus est développé et intégré dans le système d'information lexicale du DWDS afin d'assister des lexicographes dans leur prise de décisions. \n Ce système de recommandation a été conçu afin que des exemples suffisamment pertinents puissent être proposés aux utilisat·eur·rice·s externes du système d'infomations lexicales même pour des lemmes qui n'ont pas encore fait l'objet d'un traitement lexical complet par un·e expert·e.\n
\n\n L'application sert surtout à l'évaluation de la qualité et de la diversité des exemples. La qualité des exemples est mesurée à l'aide de l'échelle de différence maximale. \n Les annotat·eur·rice·s doivent choisir le meilleur exemple et le pire parmi les quatre qui leur sont présentés. \n Les classements ainsi obtenus sont utilisés comme variable cible dans un procédé d'apprentissage surveillé. \n Pour évaluer la diversité des exemples d'un certain lemme, il est demandé aux utilisat·eur·rice·s de mettre en balance la qualité et la diversité et de spécifier quels genres de diversité leur convient le mieux (par exemple, des structures de phrase différentes, la sémantique, des indications de source) en ajustant des curseurs. \n Les exemples présentés sont réorganisés avec un procédé d'optimisation quadratique selon ces paramètres jusqu'à ce que l'utilisat·eur·rice soit satisfait·e de la sélection affichée.\n
\nCe travail a été financé par la Deutsche Forschungsgemeinschaft (DFG) - 433249742. Durée du projet: 2020-2023.
\n https://gepris.dfg.de/gepris/projekt/433249742\n