Listing 1 - 1 of 1 |
Sort by
|
Choose an application
Doelstelling: De voornaamste doelstelling van dit onderzoek bestaat erin om na te gaan of het mogelijk is om Nederlandstalige online consumentenbeoordelingen automatisch te classificeren volgens subjectiviteit. Deze subjectiviteit wordt uitgedrukt in 5 klassen: zeer negatief, negatief, neutraal, positief en zeer positief. De consumentenbeoordelingen zijn verdeeld over verschillende domeinen waarvoor de consument het vaakst het internet raadpleegt alvorens tot aankoop over te gaan. Het uiteindelijke doel is het systeem toe te passen op nieuwe, ongeziene consumentenbeoordelingen en de accuraatheid ervan te meten. Anderzijds wordt de toepasbaarheid gemeten van domeinspecifieke lexicons naar andere domeinen. Middelen of methode: De gebruikte methode is lexicongebaseerde automatische sentiment mining waarbij op zoek gegaan wordt naar de subjectiviteit van taaluitingen, in dit geval consumentenbeoordelingen. Als basis voor het onderzoek werd een corpus van 500 Nederlandstalige reviews samengesteld, verdeeld over 5 domeinen: elektronica, films, auto's, hotels en cd's. Deze reviews zijn handmatig beoordeeld op hun subjectiviteit en verdeeld over 5 klassen. Tevens werden alle subjectieve woorden in de beoordelingen geannoteerd en ingedeeld in 4 klassen: zeer negatieve, negatieve, positieve en zeer positieve woorden. Deze woorden zijn per domein opgelijst in een sentimentlexicon. Daarnaast werd ook gebruik gemaakt van een bestaand sentimentlexicon voor het Nederlands, opgesteld door Jijkoun. Aan de hand van een zelfgemaakt programma, het samengestelde corpus en de lexicons zijn de 5 domeinen geanalyseerd op hun accuraatheid, precisie, recall en F-score. Resultaten: Voor dit onderzoek werden verschillende experimenten uitgevoerd met alle mogelijke combinaties van beschikbare hulpmiddelen. Over het algemeen zijn de verkregen resultaten unaniem: alleen een lexicongebaseerd systeem voor consumentenbeoordelingen volstaat niet om zeer gedetailleerde resultaten te generen. De beste resultaten zijn echter wel verkregen bij zeer uitgebreide lexicons die domeinafhankelijk zijn. Op basis van onze experimentele resultaten concluderen we bijgevolg dat er vooral twee factoren een grote rol spelen in het slagen van lexicongebaseerde systemen: de grootte van het lexicon en de domeinafhankelijkheid van een lexicon.
Consumentenbeoordeling. --- Domeinadaptatie. --- Domeinafhankelijk lexicon. --- Lexicon gebaseerd. --- Nederlandstalig. --- Online meningen. --- Opinion mining. --- Review. --- Sentimentanalyse. --- Subjectiviteit. --- Taaltechnologische studie.
Listing 1 - 1 of 1 |
Sort by
|