UPPSALA UNIVERSITET : Inst. f. lingvistik och filologi : STP
Uppsala universitet
Hoppa över länkar

Syfte
Testsviter
Deluppgift 1
Deluppgift 2
Deluppgift 3
Deluppgift 4
Examination
Kurshemsidan


Uppsala universitet
Institutionen för lingvistik och filologi
Språkteknologiprogrammet
Grundläggande textanalys
Vårterminen 2014
Laboration

Uppgift 3: Utvärdering av stavnings- och grammatikkontroll i MS Word och Granska

Syfte

Laborationen har två syften. Dels ska den ge fördjupade insikter i den lingvistiska funktionaliteten i existerande program för stavnings- och grammatikkontroll, dels ska den ge praktisk kunskap om och erfarenhet av metoder för utvärdering av språkgranskningsverktyg i allmänhet.

MS Word

Det språkgranskningsprogram som ligger till grund för den svenska versionen av MS Word är Grammatifix, som vi har gått igenom på föreläsningarna. Bland annat har vi tittat på dess lingvistiska funktionalitet, dvs. vilka feltyper som programmet uppges klara av. I denna laboration ska du undersöka hur väl den lingvistiska funktionaliteten uppfylls i praktiken. Du ska med andra ord göra en utvärdering i relation till vad programmet säger sig klara av, en så kallad systemutvärdering.

Vad gäller fel i enskilda ord (stavfel, skrivfel och fel i sammansättningar) så använder vi oss här av testsviter som tagits fram i samband med utvärderingen av Scarrie. Vad gäller grammatikfelen, så sker utvärderingen mot de feltypsexempel som presenteras i beskrivningen av Grammatifix.

Deluppgift 1: Stavningskontroll i MS Word (obligatorisk)

Öppna testsvit 1-3 i MS Word och undersök resultatet. För in resultatet i en tabell enligt nedan.

  Erroneous word Error flagged Position of the correct suggestion in the list of suggested corrections Only incorrect suggestions No suggestion
TYPING ERRORS          
1.1 deletions          
1.2 insertions          
1.3 interchanging          
1.4 substitution          
1.5 consonant doubling          
1.6 consonant singling          
           
SPELLING ERRORS          
2.1 l-related errors          
2.2 m-related errors          
2.3 n-related errors          
2.4 r-related errors          
2.5 silent letters          
2.6 errors in loan words          
2.7 syllable omission/repetition          
2.8 letter substitution          
           
ERRORS IN COMPOUNDS          
3.1 hyphen missing          
3.2 hyphen incorrect          
3.3 binding -s- missing          
3.4 binding -s- incorrect          
3.5 split compounds          
3.6 compounds with proprium          
3.7 compounds with abbreviations          
3.8 compounds with erroneous stem          
3.9 compounds with erroneous derivation          

Beskriv helt kort din allmänna uppfattning om resultatet. Ser du några förbättringsmöjligheter? Var så specifik som möjligt.

Deluppgift 2: Grammatikkontroll i MS Word (obligatorisk)

Öppna testsvit 4 i MS Word och undersök resultatet. Besvara följande frågor:

  1. Är du överens med Word om att de fel som felmarkeras bör felmarkeras? Om inte, vilka fel ifrågasätter du och varför?
  2. Får du tillräcklig hjälp av förklaringen för att kunna rätta felet? Om inte, i vilka meningar är förklaringen otillräcklig eller felaktig?
  3. Välj ut de meningar som innehåller fel i nominalfrasen. Ange deras nummer och för in i rapporten. Ur denna grupp ska du sedan välja ut de meningar som har rak ordföljd i huvudsatsen. Ange deras nummer och för in i rapporten. Skriv om var och en av dessa meningar utan att ändra dess betydelse, så att du får omvänd ordföljd i huvudsatsen. Undersök om du fortfarande får den felmarkering som systemet gav för ursprungsmeningen. Om inte, presentera i din rapport den eller de meningar där felmarkeringen försvinner efter omskrivningen. Ser du någon förklaring? Kan det till exempel vara så att det saknas någon regel? Vad skulle den i så fall uttrycka? Är någon regel otillräckligt specificerad? Beskriv med egna ord vad som händer i övningen och dra eventuella slutsatser.

Granska

Deluppgift 3: Språkgranskning i Granska (obligatorisk)

Öppna webbversionen av Granska. Kryssa i rutan Använd våra exempelmeningar som visar många olika typer av fel och klicka på sänd iväg. Gå igenom resultatet och besvara följande frågor:
  1. Vilket är ditt allmänna intryck av språkgranskningsresultatet?

  2. Finns det felaktigheter i texten som inte hittas av systemet? Vilka är det i så fall? Resonera kring varför du tror att dessa felaktigheter inte kan hittas.

  3. Får du tillräcklig hjälp av förklaringarna för att kunna rätta felet? Motivera ditt svar med exempel.

  4. Tror du att en icke-lingvist skulle få tillräcklig hjälp av förklaringen? Motivera ditt svar med exempel.

Deluppgift 4: Egna regler i Granska (frivillig, men krävs för VG)

Välj ut tre av exempelmeningarna i testsvit 4 och spara dessa i en textfil med teckenkodning ISO-8859-1 (latin1). Formulera dina egna Granska-regler som täcker in de grammatikfel som förekommer i dina utvalda meningar. En fil med en exempelregel att utgå ifrån finns här. Du kan också behöva läsa om Granskas regelspråk här.

Testkör i Granska genom att ladda upp din textfil och klistra in dina regler i textrutan för regelskrivande. Kom ihåg att avbocka Använd Granskas regler också, så att det bara är dina egna regler som körs.

Bearbeta dina regler tills de täcker in samtliga feltyper i dina utvalda meningar. Försök att göra reglerna så generella som möjligt utan att ge upphov till för många falska alarm. Det kan vara svårt att beskriva felen fullständigt med reglerna. Ibland kanske inte alla fel täcks av regeln eller så ger regeln upphov till falska alarm. Försök att hitta en så bra balans som möjligt mellan täckning och precision. Kommentera när du anser att en regel inte har tillräcklig täckning. Försök också att komma på exempelmeningar som ger upphov till falska alarm.

För varje feltyp ska redovisas:
  1. Den eller de regler du har skrivit för feltypen i fråga.

  2. En beskrivning av vilken typ av fel du anser att din regel ska kunna detektera.

  3. En diskussion kring hur bra regeln är. Hur tror du att täckningen ser ut för din regel? I vilka språkliga situationer kommer falska alarm att uppstå? Hur kan de falska alarmen minimeras?

Examination och inlämning

Redovisning lämnas i form av skriftlig rapport till Eva Pettersson via e-post (eva.pettersson@lingfil.uu.se), senast fredag 23 maj.

Rapporten ska behandla det som tas upp i uppgiftsbeskrivningen ovan, med svar på de frågor som ställs. Dessutom ska nämnas vilken Word-version som använts för uppgiften, då olika Word-versioner kan ha olika versioner av stavnings- och grammatikkontrollen. För godkänt krävs att deluppgift 1, 2 och 3 genomförs och rapporteras enligt laborationsbeskrivningen. För väl godkänt krävs att du även har genomfört deluppgift 4, samt fört ett insiktsfullt lingvistiskt resonemang kring de resultat som uppnåtts.


Tack till Anna Sågvall Hein (UU) och Ola Knutsson (KTH) för underlag till nuvarande labbinstruktioner.