Définition et exemples de linguistique de corpus

linguistique de corpus

« La linguistique de corpus s'intéresse non seulement à la description des modèles de forme », dit Winnie Cheng, « mais aussi à la façon dont la forme et le sens sont inséparables » ( Explorer la linguistique de corpus : la langue en action , 2012).

Hardie / Getty Images





Linguistique de corpus est l'étude de Langue basé sur de vastes collections d'utilisations linguistiques 'réelles' stockées dans corpus (ou corpus )—bases de données informatisées créées pour linguistique rechercher. Il est également connu sous le nom d'études basées sur corpus.

La linguistique de corpus est vue par certains les linguistes comme outil ou méthodologie de recherche et par d'autres comme discipline ou théorie à part entière. Sandra Kübler et Heike Zinsmeister déclarent dans leur livre, 'Corpus Linguistics and Linguistically Annotated Corpora', que 'la réponse à la question de savoir si la linguistique de corpus est une théorie ou un outil est simplement qu'elle peut être les deux'. Cela dépend de la façon dont la linguistique de corpus est appliquée.



Bien que les méthodes utilisées en linguistique de corpus aient été adoptées pour la première fois au début des années 1960, le terme lui-même n'est apparu que dans les années 1980.

Exemples et observations

'[C] orpus linguistique est ... une méthodologie, comprenant un grand nombre de méthodes connexes qui peuvent être utilisées par des chercheurs de différentes tendances théoriques. D'autre part, force est de constater que la linguistique de corpus est aussi fréquemment associée à une certaine vision du langage. Au centre de cette perspective se trouve le fait que les règles du langage sont usage et que des changements se produisent lorsque les locuteurs utilisent le langage pour communiquer avec l'un l'autre. L'argument est que si vous êtes intéressé par le fonctionnement d'une langue particulière, comme Anglais , c'est une bonne idée d'étudier la langue en usage. Une manière efficace d'y parvenir est d'utiliser la méthodologie du corpus....'



–Hans Lindquist, Corpus Linguistics et la description de l'anglais . Presse universitaire d'Édimbourg, 2009

« Les études de corpus ont explosé à partir de 1980, au fur et à mesure que les corpus, les techniques et les nouveaux arguments en faveur de l'utilisation des corpus se sont affirmés. Actuellement, ce boom se poursuit - et les deux «écoles» de linguistique de corpus se développent ... La linguistique de corpus mûrit méthodologiquement et la gamme de langues abordées par les linguistes de corpus augmente chaque année.

– Tony McEnery et Andrew Wilson, Corpus Linguistique , Presse universitaire d'Édimbourg, 2001

Corpus Linguistique dans la salle de classe

«Dans le contexte de la salle de classe, la méthodologie de la linguistique de corpus convient aux étudiants de tous les niveaux car il s'agit d'une étude« ascendante »de la langue nécessitant très peu d'expertise apprise pour commencer. Même les étudiants qui viennent à l'enquête linguistique sans appareil théorique apprennent très vite à avancer leurs hypothèses sur la base de leurs observations plutôt que des connaissances acquises, et les testent par rapport aux preuves fournies par le corpus.



– Elena Tognini-Bonelli, Corpus linguistique au travail . John Benjamins, 2001

'Pour faire bon usage des ressources du corpus, un enseignant a besoin d'une orientation modeste sur les routines impliquées dans la récupération des informations du corpus et, surtout, d'une formation et d'une expérience sur la façon d'évaluer ces informations.'



– John McHardy Sinclair, Comment utiliser les corpus dans l'enseignement des langues , John Benjamins, 2004

Analyses quantitatives et qualitatives

«Les techniques quantitatives sont essentielles pour les études basées sur des corpus. Par exemple, si vous vouliez comparer l'utilisation linguistique des modèles pour les mots gros et grand , vous auriez besoin de savoir combien de fois chaque mot apparaît dans le corpus, combien de mots différents coexistent avec chacun de ces mots adjectifs (la collocations ), et la fréquence de chacune de ces collocations. Ce sont toutes des mesures quantitatives....



«Une partie cruciale de l'approche basée sur corpus va au-delà des modèles quantitatifs pour proposer des interprétations fonctionnelles expliquant pourquoi les modèles existent. En conséquence, une grande partie des efforts dans les études basées sur des corpus est consacrée à expliquer et à illustrer des modèles quantitatifs.

– Douglas Biber, Susan Conrad et Randi Reppen, Linguistique de corpus : enquête sur la structure et l'utilisation du langage , Cambridge University Press, 2004



« [D]ans la linguistique de corpus, les méthodes quantitatives et qualitatives sont largement utilisées en combinaison. Il est également caractéristique de la linguistique de corpus de commencer par des résultats quantitatifs et de travailler vers des résultats qualitatifs. Mais... la procédure peut avoir des éléments cycliques. En général, il est souhaitable de soumettre les résultats quantitatifs à un examen qualitatif, en essayant d'expliquer pourquoi un modèle de fréquence particulier se produit, par exemple. Mais d'un autre côté, l'analyse qualitative (utilisant la capacité de l'investigateur à interpréter des échantillons de langage en contexte) peut être le moyen de classer des exemples dans un corpus particulier selon leurs significations ; et cette analyse qualitative peut alors être l'entrée d'une autre analyse quantitative, basée sur le sens... ».

– Geoffrey Leech, Marianne Hundt, Christian Mair et Nicholas Smith, Changement dans l'anglais contemporain : une étude grammaticale . Cambridge University Press, 2012

La source

  • Kübler, Sandra et Zinsmeister, Heike. Linguistique des corpus et corpus annotés linguistiquement . Bloomsbury, 2015.