3630 registros
0 hoje
14 nesta semana
4 neste mês| Frequência de ocorrência de letras no Português |
|
|
|
| Escrito por vovó Vicki | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Dom, 28.08.2005 00:56 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Página 1 de 3 Para variar, por mais que eu procurasse, não encontrei referências na web sobre a frequência de ocorrência de letras no Português do Brasil. Encontra-se análises de frequência para o Inglês, o Alemão, o Francês, o Espanhol e até para o Latim. Mas para o Português... Se não tem (ou não acho), então mãos à obra: fiz um pequeno programa em Delphi (estava com preguiça e com pressa...) que faz a análise de textos em ASCII puro. O programa usa a tecnologia de streaming de memória, o que permite a leitura e a análise de textos muito longos (acima da limitação de 32 Kb do memo do Delphi). Este programa, chamado Frequência NumaBoa, está disponível para download na Seção de Downloads - categoria Criptologia - Criptoanálise. Os resultados que obtive utilizando a "tecnologia de ponta" da Aldeia são apresentados a seguir. Ensaio de FrequênciasComo ensaio estatístico, usei 6 textos de autores conhecidos e de épocas diferentes. Todos os textos são de domínio público (sem © copyright) e podem ser encontrados com facilidade na Internet para download. Os textos foram analisados transformado-se vogais acentuadas (á, ã, ô,...) em vogais normais e o C cedilha em C.
No total, foram analisadas 157.764 palavras com 725.511 letras - uma amostra significante para dar consistência aos resultados. Frequência das letras
Características do Português do Brasil
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Atualização Seg, 13.04.2009 13:21 |