10 results on '"Büchler, Marco"'
Search Results
2. Converting Latin Treebank Data into SQL Database for Query Purposes
- Author
-
Antonacopoulos, Apostolo, Büchler, Marco, Onambele Manga, Christophe Ledoux, Passarotti, Marco Carlo, Mirovsky, Jiri, Kopp, Matyas, Passarotti, Marco Carlo (ORCID:0000-0002-9806-7187), Antonacopoulos, Apostolo, Büchler, Marco, Onambele Manga, Christophe Ledoux, Passarotti, Marco Carlo, Mirovsky, Jiri, Kopp, Matyas, and Passarotti, Marco Carlo (ORCID:0000-0002-9806-7187)
- Abstract
This paper describes how to turn a Latin dependency treebank into queryable information so that it can be browsed online using a tree query engine and its web interface. e annotation layers of the treebank are first introduced, then the query system architecture is detailed, and finally the way the treebank is converted into a relational database architecture is described.
- Published
- 2017
3. The Impact of Unassimilated Loanwords on Latin Lexicon. A Qualitative and Quantitative Analysis
- Author
-
Antonacopoulos, Apostolo, Büchler, Marco, Budassi, Marco, Passarotti, Marco Carlo, Passarotti, Marco Carlo (ORCID:0000-0002-9806-7187), Antonacopoulos, Apostolo, Büchler, Marco, Budassi, Marco, Passarotti, Marco Carlo, and Passarotti, Marco Carlo (ORCID:0000-0002-9806-7187)
- Abstract
The recent enhancement of the morphological analyser for Latin Lemlat with a large Onomasticon enables us to analyse both the morphology and the distribution of loanwords in the Latin lexicon. In this paper, first we describe the categories of proper names that were not possible to insert into Lemlat automatically, showing that a large part of them are loanwords. Then, we present the results of a qualitative analysis of loanwords to detect those ‘exceptional’ endings that identify loanwords featuring inectional properties not assimilated to those regular in the morphological system of Latin. In the end, we report a quantitative analysis of data to study the frequency of such loanwords in Latin texts.
- Published
- 2017
4. Node Formation. Using Networks to Inspect Productivity in Affixal Derivation in Classical Latin
- Author
-
Antonacopoulos, Apostolo, Büchler, Marco, Litta Modignani Picozzi, Eleonora Maria Gabriella, Passarotti, Marco Carlo, Ruffolo, Paolo, Litta, Eleonora Maria (ORCID:0000-0002-0499-997X), Passarotti, Marco Carlo (ORCID:0000-0002-9806-7187), Antonacopoulos, Apostolo, Büchler, Marco, Litta Modignani Picozzi, Eleonora Maria Gabriella, Passarotti, Marco Carlo, Ruffolo, Paolo, Litta, Eleonora Maria (ORCID:0000-0002-0499-997X), and Passarotti, Marco Carlo (ORCID:0000-0002-9806-7187)
- Abstract
This paper investigates the distribution of word formation data through network visualisation, as an entry point for the exploration / analysis of productivity in affixal derivation in Classical Latin. This study uses data from theWord Formation Latin lexicon, a derivational morphology resource for Latin, where entries are analysed into their formative components, and relationships between them are established on the basis of word formation rules.
- Published
- 2017
5. Mining and Analysing One Billion Requests to Linguistic Services
- Author
-
Büchler, Marco, Eckart, Thoma, Franzini, Greta, Franzini, Emily, Greta Franzini, Büchler, Marco, Eckart, Thoma, Franzini, Greta, Franzini, Emily, and Greta Franzini
- Abstract
From 2004 to 2016 the Leipzig Linguistic Services (LLS) existed as a SOAP-based cyber infrastructure of atomic micro-services for the Wortschatz project, which covered different-sized textual corpora in more than 230 languages. The LLS were developed in 2004 and went live in 2005 in order to provide a Web service-based API to these corpus databases. In 2006, the LLS infrastructure began to systematically log and store requests made to the text collection, and in August 2016 the LLS were shut down. This article summarises the experience of the past ten years of running such a cyberinfrastructure with a total of nearly one billion requests. It includes an explanation of the technical decisions and limitations but also provides an overview of how the services were used.
- Published
- 2017
6. Towards a Historical Text Re-use Detection
- Author
-
Chris Biemann, Alexander Mehler, Büchler, Marco, Burns, Philip R., Müller, Martin, Franzini, Emily, Franzini, Greta, Greta Franzini, Chris Biemann, Alexander Mehler, Büchler, Marco, Burns, Philip R., Müller, Martin, Franzini, Emily, Franzini, Greta, and Greta Franzini
- Abstract
Text re-use describes the spoken and written repetition of information. Historical text re-use, with its longer time span, embraces a larger set of morphological, linguistic, syntactic, semantic and copying variations, thus adding a complication to text-reuse detection. Furthermore, it increases the chances of redundancy in a Digital Library. In Natural Language Processing it is crucial to remove these redundancies before applying any kind of machine learning techniques to the text. In Humanities, these redundancies foreground textual criticism and allow scholars to identify lines of transmission. This chapter investigates two aspects of the historical text re-use detection process, based on seven English editions of the Holy Bible. First, we measure the performance of several techniques. For this purpose, when considering a verse—such as book Genesis, Chapter 1, Verse 1—that is present in two editions, one verse is always understood as a paraphrase of the other. It is worth noting that paraphrasing is considered a hyponym of text re-use. Depending on the intention with which the new version was created, verses tend to differ significantly in the wording, but not in the meaning. Secondly, this chapter explains and evaluates a way of extracting paradigmatic relations. However, as regards historical languages, there is a lack of language resources (for example, WordNet) that makes non-literal text re-use and paraphrases much more difficult to identify. These differences are present in the form of replacements, corrections, varying writing styles, etc. For this reason, we introduce both the aforementioned and other correlated steps as a method to identify text re-use, including language acquisition to detect changes that we call paradigmatic relations. The chapter concludes with the recommendation to move from a ”single run” detection to an iterative process by using the acquired relations to run a new task.
- Published
- 2014
7. Informationstechnische Aspekte des Historical Text Re-use: Computational Aspects of Historical Text Re-use
- Author
-
HEYER, Gerhard, SCHULZ, Klaus, Universität Leipzig, BÜCHLER, Marco, HEYER, Gerhard, SCHULZ, Klaus, Universität Leipzig, and BÜCHLER, Marco
- Abstract
Gegenstand der Arbeit ----------------------- Was ist Text Re-use? Text Re-use beschreibt die mit unterschiedlichen Absichten mündliche und schriftliche Wiedergabe von Textinhalten. Diese können im Sinne einer Definition das Anerkennen einer Autorität aber auch das Wiedergeben einer besonders interessanten Information sein. Während der Fokus dieser Arbeit auf dem Erstellen eines Hypertextes durch eine Text Re-use Analysis liegt, sind die PageRanking-Technik oder auch bibliometrische Analysen weiterführende Anwendungen. Im Kontext derartiger Einsatzmöglichkeiten kann auf historischen Dokumenten, die dieser Arbeit zugrunde liegen, durch eine automatische Analyse eine noch nie zuvor erstellte Breite von Zitierabhängigkeiten erstellt werden, welche heutzutage Aufschluss darüber geben, was in früheren Zeiten als wichtig erachtet worden ist, auch wenn es in der Gegenwart für Sprachen, wie dem Altgriechischen oder dem Latein, keine Muttersprachler mehr gibt. Stand der Forschung ------------------- In der Plagiarismuserkennung, einer modernen Anwendung von Text Re-use, werden meist einfache Ngramm-Ansätze eingesetzt. Diese Form einer Abtastung eines Textes bietet in erster Linie den Vorteil, dass die benötigte Rechenzeit relativ klein bleibt. Ferner genügt dieser Ansatz, um ein einfaches Copy & Paste zu erkennen. Außerhalb des Plagiarismus stellt sich der Forschungsstand so dar, dass nahezu beliebig Daten und Algorithmen kombiniert werden. Die Ergebnisse geben datenspezifische Charakteristika wieder und sind somit oft nicht auf andere Daten reproduzierbar. Der Forschungsstand reflektiert somit mehr Insellösungen als eine ganzheitliche Sicht auf das Thema. Ganzheitliche Sicht auf Text Re-use ----------------------------------- In Kapitel 2 wird die derzeit vollständigste Systematisierung des Text Re-use vorgenommen. Dies umfasst zwei wesentliche Aspekte: - Es werden insgesamt 45 verschiedene Typisierungen von Textstellen, nachfolgend auch Meme im Sinne eines Gedanken oder Ge
- Published
- 2013
8. Informationstechnische Aspekte des Historical Text Re-use: Computational Aspects of Historical Text Re-use
- Author
-
SCHULZ, Klaus, Universität Leipzig, BÜCHLER, Marco, SCHULZ, Klaus, Universität Leipzig, and BÜCHLER, Marco
- Abstract
Gegenstand der Arbeit ----------------------- Was ist Text Re-use? Text Re-use beschreibt die mit unterschiedlichen Absichten mündliche und schriftliche Wiedergabe von Textinhalten. Diese können im Sinne einer Definition das Anerkennen einer Autorität aber auch das Wiedergeben einer besonders interessanten Information sein. Während der Fokus dieser Arbeit auf dem Erstellen eines Hypertextes durch eine Text Re-use Analysis liegt, sind die PageRanking-Technik oder auch bibliometrische Analysen weiterführende Anwendungen. Im Kontext derartiger Einsatzmöglichkeiten kann auf historischen Dokumenten, die dieser Arbeit zugrunde liegen, durch eine automatische Analyse eine noch nie zuvor erstellte Breite von Zitierabhängigkeiten erstellt werden, welche heutzutage Aufschluss darüber geben, was in früheren Zeiten als wichtig erachtet worden ist, auch wenn es in der Gegenwart für Sprachen, wie dem Altgriechischen oder dem Latein, keine Muttersprachler mehr gibt. Stand der Forschung ------------------- In der Plagiarismuserkennung, einer modernen Anwendung von Text Re-use, werden meist einfache Ngramm-Ansätze eingesetzt. Diese Form einer Abtastung eines Textes bietet in erster Linie den Vorteil, dass die benötigte Rechenzeit relativ klein bleibt. Ferner genügt dieser Ansatz, um ein einfaches Copy & Paste zu erkennen. Außerhalb des Plagiarismus stellt sich der Forschungsstand so dar, dass nahezu beliebig Daten und Algorithmen kombiniert werden. Die Ergebnisse geben datenspezifische Charakteristika wieder und sind somit oft nicht auf andere Daten reproduzierbar. Der Forschungsstand reflektiert somit mehr Insellösungen als eine ganzheitliche Sicht auf das Thema. Ganzheitliche Sicht auf Text Re-use ----------------------------------- In Kapitel 2 wird die derzeit vollständigste Systematisierung des Text Re-use vorgenommen. Dies umfasst zwei wesentliche Aspekte: - Es werden insgesamt 45 verschiedene Typisierungen von Textstellen, nachfolgend auch Meme im Sinne eines Gedanken oder Ge
- Published
- 2013
9. Informationstechnische Aspekte des Historical Text Re-use: Computational Aspects of Historical Text Re-use
- Author
-
HEYER, Gerhard, SCHULZ, Klaus, Universität Leipzig, BÜCHLER, Marco, HEYER, Gerhard, SCHULZ, Klaus, Universität Leipzig, and BÜCHLER, Marco
- Abstract
Gegenstand der Arbeit ----------------------- Was ist Text Re-use? Text Re-use beschreibt die mit unterschiedlichen Absichten mündliche und schriftliche Wiedergabe von Textinhalten. Diese können im Sinne einer Definition das Anerkennen einer Autorität aber auch das Wiedergeben einer besonders interessanten Information sein. Während der Fokus dieser Arbeit auf dem Erstellen eines Hypertextes durch eine Text Re-use Analysis liegt, sind die PageRanking-Technik oder auch bibliometrische Analysen weiterführende Anwendungen. Im Kontext derartiger Einsatzmöglichkeiten kann auf historischen Dokumenten, die dieser Arbeit zugrunde liegen, durch eine automatische Analyse eine noch nie zuvor erstellte Breite von Zitierabhängigkeiten erstellt werden, welche heutzutage Aufschluss darüber geben, was in früheren Zeiten als wichtig erachtet worden ist, auch wenn es in der Gegenwart für Sprachen, wie dem Altgriechischen oder dem Latein, keine Muttersprachler mehr gibt. Stand der Forschung ------------------- In der Plagiarismuserkennung, einer modernen Anwendung von Text Re-use, werden meist einfache Ngramm-Ansätze eingesetzt. Diese Form einer Abtastung eines Textes bietet in erster Linie den Vorteil, dass die benötigte Rechenzeit relativ klein bleibt. Ferner genügt dieser Ansatz, um ein einfaches Copy & Paste zu erkennen. Außerhalb des Plagiarismus stellt sich der Forschungsstand so dar, dass nahezu beliebig Daten und Algorithmen kombiniert werden. Die Ergebnisse geben datenspezifische Charakteristika wieder und sind somit oft nicht auf andere Daten reproduzierbar. Der Forschungsstand reflektiert somit mehr Insellösungen als eine ganzheitliche Sicht auf das Thema. Ganzheitliche Sicht auf Text Re-use ----------------------------------- In Kapitel 2 wird die derzeit vollständigste Systematisierung des Text Re-use vorgenommen. Dies umfasst zwei wesentliche Aspekte: - Es werden insgesamt 45 verschiedene Typisierungen von Textstellen, nachfolgend auch Meme im Sinne eines Gedanken oder Ge
- Published
- 2013
10. Informationstechnische Aspekte des Historical Text Re-use: Computational Aspects of Historical Text Re-use
- Author
-
SCHULZ, Klaus, Universität Leipzig, BÜCHLER, Marco, SCHULZ, Klaus, Universität Leipzig, and BÜCHLER, Marco
- Abstract
Gegenstand der Arbeit ----------------------- Was ist Text Re-use? Text Re-use beschreibt die mit unterschiedlichen Absichten mündliche und schriftliche Wiedergabe von Textinhalten. Diese können im Sinne einer Definition das Anerkennen einer Autorität aber auch das Wiedergeben einer besonders interessanten Information sein. Während der Fokus dieser Arbeit auf dem Erstellen eines Hypertextes durch eine Text Re-use Analysis liegt, sind die PageRanking-Technik oder auch bibliometrische Analysen weiterführende Anwendungen. Im Kontext derartiger Einsatzmöglichkeiten kann auf historischen Dokumenten, die dieser Arbeit zugrunde liegen, durch eine automatische Analyse eine noch nie zuvor erstellte Breite von Zitierabhängigkeiten erstellt werden, welche heutzutage Aufschluss darüber geben, was in früheren Zeiten als wichtig erachtet worden ist, auch wenn es in der Gegenwart für Sprachen, wie dem Altgriechischen oder dem Latein, keine Muttersprachler mehr gibt. Stand der Forschung ------------------- In der Plagiarismuserkennung, einer modernen Anwendung von Text Re-use, werden meist einfache Ngramm-Ansätze eingesetzt. Diese Form einer Abtastung eines Textes bietet in erster Linie den Vorteil, dass die benötigte Rechenzeit relativ klein bleibt. Ferner genügt dieser Ansatz, um ein einfaches Copy & Paste zu erkennen. Außerhalb des Plagiarismus stellt sich der Forschungsstand so dar, dass nahezu beliebig Daten und Algorithmen kombiniert werden. Die Ergebnisse geben datenspezifische Charakteristika wieder und sind somit oft nicht auf andere Daten reproduzierbar. Der Forschungsstand reflektiert somit mehr Insellösungen als eine ganzheitliche Sicht auf das Thema. Ganzheitliche Sicht auf Text Re-use ----------------------------------- In Kapitel 2 wird die derzeit vollständigste Systematisierung des Text Re-use vorgenommen. Dies umfasst zwei wesentliche Aspekte: - Es werden insgesamt 45 verschiedene Typisierungen von Textstellen, nachfolgend auch Meme im Sinne eines Gedanken oder Ge
- Published
- 2013
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.