SemanTags: семантическая разметка объектов с использованием технологии краудсорсинга

Дополнение объектов (например, ресурсов сети Интернет) семантическими метками, характеризующими их содержание, позволяет существенно повысить качество выдачи поисковых машин и в целом способствует более эффективной работе с информацией. Однако полностью автоматическая семантическая разметка не всегда дает адекватный результат из-за существующих ограничений при алгоритмической обработке естественного языка, а ручная оказывается достаточно трудоемкой, особенно, если количество объектов велико. Частично снять проблему трудоемкости ручной разметки в ряде случаев позволяет технология краудсорсинга. В статье предлагается система (веб-сервис) SemanTags, позволяющая использовать технологию краудсорсинга для того, чтобы снабдить произвольные объекты (научные статьи, страницы в Интернете и пр.) метками (тегами), являющимися классами некоторой проблемно-ориентированной онтологии, записанной на языке OWL 2. Описана архитектура и особенности реализации системы, а также предложен новый механизм обеспечения качества, адаптированный для совместной разметки объектов классами онтологии.

Авторы: И. А. Щербаков, А. В. Пономарев

Направление: Информатика, вычислительная техника и управление

Ключевые слова: Краудсорсинг, крауд-вычисления, онтологии, OWL 2, таксономия, семантическая разметка, семантический поиск


Открыть полный текст статьи