Rogério Reis


Err and err and err again, but less and less and less.


Tabelas de Frequências na Língua Portuguesa

Todos os dados estatísticos que se seguem foram obtidos pela a análise de um corpus de texto jornalístico actual, contendo mais de 180 milhões de palavras: o CTEMPúblico.

Percentagens de frequência dos caracteres em Português.

a
b
c
d
e
f
g
h
i
j
k
l
m
13.9
1.0
4.4
5.4
12.2
1.0
1.2
0.8
6.9
0.4
0.1
2.8
4.2
n
o
p
q
r
s
t
u
v
w
x
y
z
5.3
10.8
2.9
0.9
6.9
7.9
4.9
4.0
1.3
0.0
0.3
0.0
0.4

Vogais: 47.7 Consoantes: 52.3

Frequência média dos digrafos por cada 1000 caracteres em Português


a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
p
q
r
s
t
u
v
w
x
y
z
a
5.13
2.35
10.05
14.80
4.49
2.27
2.14
0.48
5.11
0.57
0.09
9.03
8.08
11.62
11.84
5.84
1.85
14.89
16.41
5.01
2.26
3.04
0.04
0.15
0.08
0.84
b
1.90
0.02
0.03
0.02
1.90
0.00
0.00
0.00
1.02
0.10
0.00
0.83
0.03
0.00
1.26
0.02
0.00
1.83
0.22
0.07
0.46
0.02
0.00
0.00
0.01
0.00
c
12.57
0.01
0.45
0.07
3.78
0.01
0.01
1.12
6.09
0.00
0.09
0.80
0.02
0.15
14.00
0.10
0.02
1.38
0.03
1.62
1.88
0.00
0.00
0.00
0.00
0.00
d
11.92
0.02
0.03
0.05
20.33
0.01
0.02
0.02
4.96
0.04
0.00
0.02
0.20
0.03
14.45
0.05
0.03
0.50
0.07
0.02
1.13
0.07
0.01
0.00
0.02
0.00
e
6.34
0.95
7.25
5.77
3.34
2.17
2.81
0.44
5.31
0.89
0.07
5.97
10.92
14.94
3.24
3.99
1.66
13.33
20.71
3.53
3.28
2.35
0.08
1.52
0.06
0.73
f
1.56
0.00
0.04
0.01
2.03
0.04
0.00
0.00
2.64
0.00
0.00
0.21
0.01
0.01
2.21
0.02
0.00
0.81
0.01
0.03
0.64
0.00
0.00
0.00
0.00
0.00
g
2.60
0.01
0.02
0.03
1.74
0.01
0.01
0.04
1.22
0.00
0.01
0.13
0.03
0.21
2.05
0.02
0.00
1.56
0.03
0.05
2.52
0.00
0.00
0.00
0.00
0.00
h
2.70
0.00
0.02
0.02
1.44
0.01
0.00
0.02
0.53
0.00
0.00
0.02
0.03
0.06
2.26
0.01
0.00
0.03
0.01
0.04
0.24
0.00
0.00
0.00
0.00
0.00
i
8.15
0.67
6.83
5.54
1.16
0.85
1.50
0.02
0.11
0.05
0.05
2.52
3.70
8.22
4.84
1.07
0.18
4.50
8.79
4.90
0.56
2.50
0.00
0.45
0.00
1.31
j
1.14
0.00
0.00
0.00
0.56
0.00
0.00
0.00
0.03
0.00
0.00
0.00
0.00
0.00
1.04
0.00
0.00
0.00
0.00
0.00
0.75
0.00
0.00
0.00
0.00
0.00
k
0.10
0.00
0.01
0.01
0.11
0.01
0.00
0.02
0.10
0.00
0.01
0.02
0.02
0.01
0.09
0.01
0.00
0.02
0.03
0.01
0.02
0.00
0.00
0.00
0.01
0.00
l
4.93
0.15
0.52
1.32
3.96
0.18
0.59
1.92
5.22
0.06
0.02
0.31
0.78
0.24
3.43
0.45
0.31
0.10
0.35
1.39
1.16
0.56
0.00
0.00
0.04
0.00
m
11.35
1.48
1.08
1.29
8.13
0.37
0.20
0.12
3.37
0.16
0.01
0.30
0.66
0.54
5.21
3.49
0.58
0.38
0.86
0.54
1.88
0.27
0.01
0.00
0.01
0.00
n
8.65
0.04
4.47
5.27
2.24
0.72
1.05
1.91
3.43
0.14
0.07
0.04
0.05
0.13
6.13
0.06
0.25
0.10
3.05
13.27
1.30
0.64
0.01
0.00
0.03
0.06
o
5.41
2.08
5.37
9.58
6.29
1.89
1.73
0.47
2.79
0.83
0.06
3.66
7.79
10.14
2.04
6.30
1.84
11.85
18.26
2.55
4.06
2.24
0.08
0.25
0.03
0.16
p
6.74
0.00
0.17
0.05
5.23
0.02
0.01
0.04
0.93
0.01
0.00
0.86
0.02
0.03
7.46
0.10
0.02
6.02
0.26
0.21
0.93
0.01
0.00
0.00
0.00
0.00
q
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
9.38
0.00
0.00
0.00
0.00
0.00
r
17.43
0.28
2.34
2.41
14.16
0.31
0.92
0.07
8.06
0.10
0.05
0.41
1.88
1.61
8.11
0.85
0.81
1.84
1.31
3.73
1.53
0.66
0.01
0.00
0.05
0.02
s
9.19
0.66
4.18
6.33
13.47
1.19
0.39
0.57
4.72
0.38
0.06
0.65
2.37
1.82
5.91
5.20
1.47
1.05
6.33
9.80
2.58
0.63
0.02
0.00
0.01
0.03
t
11.46
0.01
0.09
0.03
12.72
0.01
0.01
0.15
6.17
0.01
0.00
0.07
0.06
0.04
9.33
0.07
0.01
5.83
0.11
0.12
2.94
0.03
0.01
0.00
0.02
0.02
u
3.98
1.01
1.05
1.22
8.55
0.14
0.87
0.03
2.55
0.15
0.02
2.15
5.54
3.20
0.51
0.96
0.18
2.72
2.07
2.17
0.15
0.26
0.00
0.07
0.00
0.24
v
3.36
0.00
0.01
0.01
4.75
0.00
0.00
0.00
3.19
0.00
0.00
0.01
0.01
0.00
1.75
0.01
0.00
0.17
0.01
0.00
0.07
0.00
0.00
0.00
0.00
0.00
w
0.11
0.00
0.00
0.00
0.05
0.00
0.00
0.01
0.06
0.00
0.00
0.00
0.00
0.01
0.04
0.00
0.00
0.00
0.01
0.00
0.00
0.00
0.00
0.00
0.00
0.00
x
0.45
0.00
0.13
0.01
0.32
0.00
0.00
0.00
0.58
0.00
0.00
0.00
0.01
0.00
0.20
0.42
0.00
0.00
0.01
0.24
0.03
0.01
0.00
0.01
0.00
0.00
y
0.06
0.01
0.02
0.02
0.05
0.01
0.00
0.00
0.01
0.00
0.00
0.02
0.02
0.02
0.05
0.01
0.00
0.01
0.03
0.01
0.01
0.00
0.01
0.00
0.00
0.00
z
1.20
0.01
0.05
0.15
0.86
0.02
0.00
0.01
0.29
0.01
0.00
0.01
0.08
0.05
0.33
0.07
0.08
0.02
0.05
0.02
0.06
0.01
0.00
0.00
0.00
0.02

Lista dos 40 trigrafos mais frequentes e respectivas ocorrências por 10000.

que
ent
nte
ado
ade
ode
ara
est
res
con
72.29
70.23
55.08
51.16
50.04
45.43
45.37
43.90
43.08
41.73
com
sta
dos
cao
par
aca
men
sde
ica
ese
40.95
30.95
38.08
37.97
36.29
35.55
34.65
33.45
33.05
31.87
aco
ada
por
nto
ose
des
ase
era
oes
uma
31.54
31.45
31.39
31.14
30.82
30.51
27.76
27.18
26.60
25.73
tra
ida
dad
ant
are
ont
pre
ist
ter
ais
25.66
25.55
24.84
24.54
24.30
24.05
24.04
23.91
23.89
23.37