-
Notifications
You must be signed in to change notification settings - Fork 22
/
stats.gec-only.txt
79 lines (71 loc) · 5.69 KB
/
stats.gec-only.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
# By gender
Інше {'Documents': 18, 'Sentences': 986, 'Tokens': 14632, 'Unique users': 9}
Жіноча {'Documents': 1154, 'Sentences': 18527, 'Tokens': 286375, 'Unique users': 537}
Чоловіча {'Documents': 700, 'Sentences': 14220, 'Tokens': 199612, 'Unique users': 288}
# By native
0 {'Documents': 394, 'Sentences': 6076, 'Tokens': 89629, 'Unique users': 238}
1 {'Documents': 1478, 'Sentences': 27657, 'Tokens': 410990, 'Unique users': 600}
# By occupation
Інше {'Documents': 355, 'Sentences': 5860, 'Tokens': 88696, 'Unique users': 168}
Гуманітарна {'Documents': 785, 'Sentences': 12822, 'Tokens': 198270, 'Unique users': 356}
Природнича {'Documents': 86, 'Sentences': 1390, 'Tokens': 21825, 'Unique users': 39}
Технічна {'Documents': 646, 'Sentences': 13661, 'Tokens': 191828, 'Unique users': 291}
# By region
AP Крим {'Documents': 13, 'Sentences': 191, 'Tokens': 2378, 'Unique users': 8}
Івано-Франківська {'Documents': 87, 'Sentences': 1632, 'Tokens': 26032, 'Unique users': 38}
Інше {'Documents': 81, 'Sentences': 802, 'Tokens': 12598, 'Unique users': 72}
Волинська {'Documents': 35, 'Sentences': 636, 'Tokens': 11277, 'Unique users': 20}
Вінницька {'Documents': 69, 'Sentences': 1631, 'Tokens': 22603, 'Unique users': 28}
Дніпропетровська {'Documents': 62, 'Sentences': 1448, 'Tokens': 20831, 'Unique users': 36}
Донецька {'Documents': 40, 'Sentences': 470, 'Tokens': 7847, 'Unique users': 16}
Житомирська {'Documents': 37, 'Sentences': 833, 'Tokens': 12451, 'Unique users': 19}
Закарпатська {'Documents': 15, 'Sentences': 385, 'Tokens': 6564, 'Unique users': 6}
Запорізька {'Documents': 20, 'Sentences': 243, 'Tokens': 3849, 'Unique users': 16}
Київ {'Documents': 578, 'Sentences': 10672, 'Tokens': 158639, 'Unique users': 206}
Київська {'Documents': 47, 'Sentences': 787, 'Tokens': 11643, 'Unique users': 26}
Кіровоградська {'Documents': 15, 'Sentences': 286, 'Tokens': 4648, 'Unique users': 12}
Луганська {'Documents': 17, 'Sentences': 314, 'Tokens': 4720, 'Unique users': 9}
Львівська {'Documents': 221, 'Sentences': 5160, 'Tokens': 69852, 'Unique users': 131}
Миколаївська {'Documents': 17, 'Sentences': 236, 'Tokens': 3596, 'Unique users': 7}
Одеська {'Documents': 47, 'Sentences': 739, 'Tokens': 10037, 'Unique users': 14}
Полтавська {'Documents': 146, 'Sentences': 1544, 'Tokens': 20073, 'Unique users': 30}
Рівненська {'Documents': 32, 'Sentences': 821, 'Tokens': 16010, 'Unique users': 14}
Сумська {'Documents': 31, 'Sentences': 514, 'Tokens': 8973, 'Unique users': 23}
Тернопільська {'Documents': 47, 'Sentences': 837, 'Tokens': 13192, 'Unique users': 24}
Харківська {'Documents': 75, 'Sentences': 1277, 'Tokens': 17778, 'Unique users': 27}
Херсонська {'Documents': 8, 'Sentences': 208, 'Tokens': 2945, 'Unique users': 6}
Хмельницька {'Documents': 50, 'Sentences': 822, 'Tokens': 13281, 'Unique users': 15}
Черкаська {'Documents': 32, 'Sentences': 336, 'Tokens': 5076, 'Unique users': 16}
Чернівецька {'Documents': 23, 'Sentences': 404, 'Tokens': 6231, 'Unique users': 10}
Чернігівська {'Documents': 27, 'Sentences': 505, 'Tokens': 7495, 'Unique users': 10}
# By submission type
essay {'Documents': 94, 'Sentences': 1183, 'Tokens': 16245, 'Unique users': 85}
text_donation {'Documents': 783, 'Sentences': 20878, 'Tokens': 315574, 'Unique users': 270}
translation {'Documents': 995, 'Sentences': 11672, 'Tokens': 168800, 'Unique users': 561}
# By translation lang
de {'Documents': 21, 'Sentences': 201, 'Tokens': 3817, 'Unique users': 18}
en {'Documents': 357, 'Sentences': 3577, 'Tokens': 52067, 'Unique users': 280}
fr {'Documents': 7, 'Sentences': 91, 'Tokens': 1052, 'Unique users': 6}
pl {'Documents': 12, 'Sentences': 172, 'Tokens': 2131, 'Unique users': 12}
ru {'Documents': 598, 'Sentences': 7631, 'Tokens': 109733, 'Unique users': 301}
# Number of errors (by 2 annotators)
G/Aspect 93
G/Case 2488
G/Comparison 137
G/Conjunction 414
G/Gender 518
G/Number 410
G/Other 236
G/PartVoice 99
G/Participle 2
G/Particle 60
G/Prep 537
G/Tense 220
G/UngrammaticalStructure 1048
G/VerbAForm 52
G/VerbVoice 284
Punctuation 19881
Spelling 8843
TOTAL 35322
# Total
All {'Documents': 1872, 'Sentences': 33733, 'Tokens': 500619, 'Unique users': 828}