Listing 1 - 10 of 66 | << page >> |
Sort by
|
Choose an application
Choose an application
Choose an application
Choose an application
Choose an application
Corpus linguistique --- Recherche documentaire --- Méthodologie --- Droit --- Sources
Choose an application
Corpora (Linguistics). --- Corpora (Linguistics). --- Corpus (Linguistique).
Choose an application
Il devient superflu d'insister sur la révolution scientifique que représentent la numérisation et les capacités de mémoire dans la création de bases de données en sciences humaines. Le défi est désormais ailleurs à la fois quantitatif et qualitatif. En effet la course est désormais à la constitution de très grosses ressources et les possibilités informatiques le permettent. Ce changement d'échelle a une incidence automatique sur la vie académique : les recherches qui ne reposeront pas sur un fondement quantitatif appréciable risquent fort d'être frappées de caducité.Mais la constitution de ces gros ensembles nécessite un soin méticuleux, des moyens matériels, mais surtout humains qui ne sont pas à la portée de tous les chercheurs. A supposer que ces conditions soient remplies, reste encore à s'entendre sur le contenu enregistré : aucun texte n'est numérisé et archivé de façon brute. Ce qui est à présent devant nous est donc autre : entre utilisation "maison" et normalisation des données, il s'agit de se frayer un chemin qui tout à la fois autorise les recherches les plus spécifiques sans pour autant priver la communauté d'une donnée échangeable et utilisable pour d'autres recherches.Ce volume répond à cette préoccupation : comment faire migrer de vieux corpus vers d'autres standards, comment ménager des besoins particuliers et un désir légitime d'exporter ailleurs des documents, de quels outils pouvons-nous disposer pour réaliser au mieux cette quadrature du cercle ?
Corpus linguistique --- Métadonnées --- Actes de congrès. --- Linguistique --- Informatique --- Métadonnées. --- Corpus linguistique. --- Informatique.
Choose an application
More and more people are using Web data for linguistic and NLP research. The Web as Corpus workshop (WAC) provides a venue for exploring how we can use it effectively and the advancementsto which this could lead. This book is a collection of the talks presented at the 3 rd WAC in Louvain-la-Neuve (Belgium). The focus is on the description of Web corpus collection projects, the exploration of Web data characteristics from a linguistics/NLP perspective, and on the use of crawled Web data for NLP purposes. Any use of Web data requires that it be cleaned in order to get rid of unwanted material including, for example, HTML markup, navigation bars, advertisements. To date there has been no sharing of resources or expertise in this particular domain and the cleaning has often been done minimally. Cleaneval was an exercise aimed at promoting collaboration and improving our understanding of the issues. Results and perspectives are presented in this book.
Conferences - Meetings --- Linguistique --- Computational linguistics --- Informatique --- Corpus linguistique
Choose an application
Analyse du discours. --- Corpus linguistique. --- Linguistique --- Méthodologie. --- Lexicology. Semantics --- Pragmatics
Choose an application
Didactique --- Corpus linguistique --- Analyse du discours --- Actes de congrès.
Listing 1 - 10 of 66 | << page >> |
Sort by
|