Категория
Информатика
Тип
дипломная работа
Страницы
25 стр.
Дата
02.05.2013
Формат файла
.html — Html-документ
Архив
487491.zip — 14.97 kb
  • chastotnyj-issledovanie-teksta_487491_1.html — 63.64 Kb
  • Readme_docus.me.txt — 125 Bytes
Оцените работу
Хорошо  или  Плохо


Текст работы

Введение


В настоящее время компьютеры широко применяются в самых разных областях: науке, промышленности, медицине, образовании. Применение компьютеров в лингвистике в настоящее время позволяет произвести глубокий анализ лингвистических особенностей различных языков, автоматизировать получение статистики встречаемости слов или букв того или иного языка.

Созданная в данном курсовом проекте программа частотного анализа текста (пословного) может быть использована для выявления наиболее часто встречающихся слов разных языков, для формирования словарей, для получения статистической информации.


1. Теоретические основы разработки.


.1 Описание предметной области


Частотность - термин лексикостатистики, предназначенный для определения наиболее употребительных слов. Расчет осуществляется по формуле:



Где - частотность слова « х», - количество словоупотреблений слова « х», а - общее количество слов. В большинстве случаев, частотность выражается в процентах.

Аналогичным образом, определяется частотность для букв. Большая частотность согласных на данном отрезке текста (например, в стихотворениях) получила название аллитерация. Высокие показатели частотности гласных называются ассонансом. Частотный анализ текста (посимвольный) используется в криптографии для выявления наиболее частотных букв того или иного языка. Частотный анализ текста (пословный) используется для выявления наиболее часто употребляемых слов того или иного языка. В словарях частотность слов может отражаться пометами - употребительное, малоупотребительное и т.д.


1.2 Анализ методов решения




Ваше мнение



CAPTCHA