#13

Building a Corpus of Parasynthetic Verbs

Gislene Silva

Talk

Portuguese

Building a corpus is not an easy task, as the researcher needs to make some decisions based on the following questions: build a corpus on their own or use a pre-existing one? Use an online or a print corpus? Is it interesting to use dictionaries for building the corpus? What is the best etymological dictionary? How should the data be organized?

Based on these questions and in seeking to answer them, this session aims to indicate the steps that we followed for the building a corpus of parasynthetic verbs of Contemporary Portuguese and Ancient Portuguese. For this, we will show the use of CETENFolha and CETEMPublico, for the collection of contemporary Portuguese data, and the Dicionário de Verbos do Português Medieval (DVPM), for data collection of Ancient Portuguese. We will also explain why we choose using Houaiss and DVPM online dictionaries and the Corpus do Português to date the occurrences. We will also indicate how the online dictionaries Houaiss and Infopedia were useful to obtain information about the etymology of verbs. Finally, we will present the Excel spreadsheet filled with all the information collected, facilitating the searching and interpretation of the data. The step-by-step description and the collected data allow us to compare the information about parasynthetic verbs in Contemporary and Old Portuguese.


Construir um corpus não é tarefa fácil, pois o pesquisador precisa tomar algumas decisões baseadas nos seguintes questionamentos: construir um corpus próprio ou utilizar um preexistente? Utilizar um corpus online ou impresso? É interessante utilizar dicionários para a construção do corpus? Qual o melhor dicionário etimológico? Como organizar os dados? Com base nas questões anteriores e buscando respondê-las, essa sessão tem como objetivo indicar o passo a passo que seguimos para a construção de um corpus de verbos parassintéticos do Português Contemporâneo e do Português Arcaico. Para isso, mostraremos o uso do CETENFolha e do CETEMPublico, para a coleta de dados do Português Contemporâneo, e do Dicionário de Verbos do Português Medieval (DVPM), para coleta de dados do Português Arcaico. Também explicaremos a nossa escolha por utilizar como fontes de datação das ocorrências os dicionários online Houaiss e DVPM e o Corpus do Português. Ainda, indicaremos como os dicionários online Houaiss e Infopedia foram úteis para obtermos informações acerca da etimologia dos verbos. Por fim, apresentaremos a planilha de Excel preenchida com todos os dados coletados, facilitando a consulta e interpretação das informações. O passo a passo descrito e os dados coletados permitem-nos comparar as informações sobre os verbos parassintéticos do Português Contemporâneo e do Português Arcaico.

Palavras-chave: construção de corpus; verbos parassintéticos; Português Contemporâneo; Português Arcaico.


Keywords:

corpora, parasynthetic verbs, Old Portuguese, Contemporary Portuguese

SPONSOR

twl_round_nobackground.png
  • Facebook
  • Instagram

©2020 The Word Lab