Разработанная специалистами технология iProcessor, решающая задачи автоматической модерации содержимого интернет-ресурсов, имеет в своей основе уникальные решения по автоматическому формированию и управлению словарями для языковых групп, имеющих следующие морфологические способы словообразования: суффиксальный, префиксальный, безаффиксный, постфиксальный и способы словоизменения за счет постфиксальных флексий. К данной группе языков в частности относятся славянские языки.

За счет обработки массивов текстовых данных в автоматическом режиме формируется морфологический словарь, выстраиваются связи между близким словоформами, в дальнейшем словарь может подвергаться ручному автоматизированному редактированию. Данный способ формирования словаря позволяет охватить не только уже известные словоформы, но и неологизмы, современные жаргонные и сленговые слова. Использование интернет-краулера делает процесс выявления новых популярных слов автоматическим.

Технология iProcessor была разработана при участии Фонда содействия развитию малых форм предприятий в научно-технической сфере.

Имеющиеся разработки и накопленный опыт позволяют разрабатывать программные продукты, решающие следующие задачи:

  • определение тематики текстов;
  • определение эмоциональной окраски;
  • сбор и анализ текстовых данных (text mining), размещенных в Интернете по интересующей тематике или конкретным объектам мониторинга;
  • автоматическая модерация.