Markerad statistik kommer att inkluderas och exporteras som tabbseparerad csv.
Decimalavgränsare
Ladda upp annoterad text
Annotera ny text
För att annotera en ny text kan du antingen
ladda upp en eller flera textfiler (texter i format .doc, docx, .odt och .rtf konverteras automatiskt till ren text), eller
klistra in en text.
För information om hantering av metadata, se hjälp i menyn.
Hjälp
SWEGRAM har testats och fungerar med Chrome 58, Firefox 54 och Safari 10.
Skillnaden mellan ord och token är att ord innefattar alla tokens förutom skiljetecken
(ordklasserna MAD (major delimiter), MID (minor delimiter) och PAD (pairwise delimiter)).
Om SWEGRAM
SWEGRAM syftar till att ge möjlighet att märka upp och analysera texter på
svenska. Du kan ladda upp en eller flera texter och annotera dessa på olika
lingvistiska nivåer med morfologisk och syntaktisk information. Annoterade
texter kan sedan användas för att få fram statistik om texterna med avseende på
meningslängd, antal ord, läsbarhetsmått, ordklasstatistik med mera.
Annoterings- och analysverktyget har utvecklats i samarbete mellan Institutionen
för nordiska språk och Institutionen för lingvistik och filologi vid Uppsala
universitet inom ramen av SWE-CLARIN-projektet
som syftar till att bland annat göra språkbaserade material tillgängliga
som primära forskningsdata för humanistisk och samhällsvetenskaplig (HS)
forskning med hjälp av avancerade bearbetningsverktyg för text och tal.
Deltagare
Projektledare
Beáta Megyesi, Institutionen för lingvistik och filologi, UU
Projektdeltagare
Anne Palmér, Institutionen för nordiska språk, UU
Fabienne Cap, Institutionen för lingvistik och filologi, UU
Eva Pettersson, Institutionen för lingvistik och filologi, UU
Sara Stymne, Institutionen för lingvistik och filologi, UU
Utvecklare
Jesper Näsman, Institutionen för lingvistik och filologi, UU