Определение наиболее подходящей тематической модели для классификации научных публикаций по авторам-однофамильцам. Использование модели латентного размещения Дирихле, лидирующей среди тематических моделей. Извлечение публикаций из наукометрических баз.
Аннотация к работе
186 Праці Одеського політехнічного університету, 2014. Вип.Одним из наиболее эффективных современных подходов к решению задачи потокового шифрования является подход, основанный на использовании для генерации псевдослучайных ключевых последовательностей математического аппарата булевых функций. Предлагается новая конструкция генератора псевдослучайных ключевых последовательностей на основе клеточных автоматов и таких совершенных алгебраических конструкций, как бент-функции и последовательности со свойством k-граммного распределения. Установлено, что генератор генерирует высококачественные с точки зрения нелинейности и стохастических свойств ключевые последовательности, при этом по сравнению с существующими имеет простую программную реализацию. Таким образом, предложенный генератор псевдослучайных ключевых последовательностей может быть рекомендован для использования в современных криптографических приложениях, например, алгоритмах поточного шифрования, требующих высококачественные псевдослучайные ключевые последовательности. A new design of the pseudo-random key sequences generator based on cellular automata and such perfect algebraic structures as bent functions and sequences with the property of k-gram distribution is proposed.Одним из основных способов извлечения знаний из текстовых коллекций является тематическое моделирование - способ построения модели коллекции текстовых документов, которая определяет, к каким темам относится каждый из документов [3]. Вероятностная тематическая модель (ВТМ) описывает каждую тему дискретным распределением на множестве терминов, а каждый документ - дискретным распределением на множестве тем. Модели со скрытыми (латентными) переменными оказались особенно эффективными для выявления скрытых структур в текстовых коллекциях [4], которые используются для решения таких задач, как классификация документов, поиск схожих документов, многоязычный поиск, выявление ключевых слов в документе, выявление зависимостей между терминами, выявление трендов в различных областях интересов и др.