21.10.2008 00:00
Новости.
Просмотров всего: 4282; сегодня: 1.

RIW «Проблема навигации и каталогизации контента в Интернете»

23 октября в рамках Российской недели Интернета RIW состоится круглый стол «Проблема навигации и каталогизации контента в Интернете».

Это реально жгучая проблема, поскольку объем контента в Интернете – как профессионального, так и user generated – возрастает в геометрической прогрессии. Возникли целые новые контент-области: интерент-телевидение, видео-записи, лекции, блоги, короткие литературные формы… Как найти нужную и важную информацию среди необозримого множества?

Обычные средства поиска (каталогизация, многоуровневая рубрикация, тегирование) – спасают лишь отчасти. Поскольку даже на самом последнем уровне рубрикатора возможны выборки с тысячами и десятками тысяч позиций.

Дмитрий Олеринский, директор проектов Имхонета:

Привычные средства навигации (метки, авто контекст и каталогизация) хорошо работают только тогда, когда они активно расставляются пользователями, либо когда возможен качественный семантический анализ контента с выделением высокоточных ключевых слов. Но это крайне слабо работает со звуками, видео и статичными изображениями, а также в тех контент-областях, где семантический анализ невозможен (например, из-за того, что сам контент кроме заголовка недоступен роботу), а у пользователей недостаточно мотивации для UGC тегирования. Кроме того, даже обильные пользовательские теги всегда носят субъективный характер, и редко когда корректно описывают суть контента. А нанимать армию модераторов неоправданно дорого.

Можно прибегнуть к поиску по атрибутам объекта. Что нередко практикуется по отношению к кинофильмам: их ищут по названию + актеру в главной роли или режиссеру. Но и это не панацея, поскольку связи между атрибутами часто не прописаны.

Способы упрощения навигации

Самый распространенный путь выделения наиболее востребованных и популярных объектов – это рейтинги. Но они настолько усредняют информацию, что результат на выходе – средняя температура по больнице. Еще один общепринятый метод – сокращение перечня объектов. Принципы вивисекции разные: список наиболее покупаемых товаров, фильмы, транслирующиеся по телевидению сей момент и т.д. Ограничения очевидны.

Артем Лебедев, глава департамента web-разработки Имхонета:

Все это не решает проблему «хвоста» – не пользующихся массовым спросом, но очень важных объектов. Как быть, например, с документальным кино, востребованность которого ничтожно мала по сравнению с художественными фильмами? Или образовательным контентом: материалами лекций, докладов, сообщений, презентаций? Их не так мало в интернете, но найти что-либо на разрозненных ресурсах крайне сложно.

Поэтому в последнее время стремительно возрастает актуальность новых способов структуризации всех типов данных и удобной навигации по ним.

Поиск контента с помощью искусственного интеллекта

Один из вариантов – автоматический анализ мультимедийных данных. Это особенно актуально для поиска визуальной информации, где стандартные средства работают плохо. Интеллектуальная система анализа содержания мультимедийного контента может быть реализована на основе технологии компьютерного зрения, которые разрабатывает компания SeeStorm (seestorm.com).

Александр Крайнов, директор по продуктам SeeStorm:

Технологии компьютерного зрения позволяют в автоматическом режиме распознавать содержание графических данных: определять наличие на изображении человеческого лица или нескольких ли; идентифицировать заданный объект по признакам подобия; находить изображения, соответствующие определенным визуальным характеристикам и т.д.

Другой путь решения проблемы – совмещение привычных способов поиска контента с его персонификацией. Носителем этой идеологии является рекомендательный сервис Имхонет (imhonet.ru).

Персонификация контента: применение рекомендательных систем для решения проблемы навигации

Артем Лебедев, глава департамента web-разработки Имхонета:

Сильная сторона рекомендательных систем в том, что, оперируя большими массивами данных, они позволяют каждому отдельному пользователю находить контент в соответствии с его личными предпочтениями и вкусами. Благодаря этому юзеры могут отыскать среди множества объектов те, которые не пользуются массовым спросом. Плюс сервис выдает не только списки рекомендованных объектов, но и перечень единомышленников данного человека.

Еще одно важнейшее преимущество рекомендательных систем – они совмещают разные способы расфасовки контента. К стандартному упорядочиванию множества объектов по полочкам тематических подмножеств (областей потребления, развлекательных или потребительских товаров и т.д.) добавляется многоуровневая рубрикация, тегирование, рейтинги, поиск по атрибутам. Плюс на полученные выборки накладывается фильтр по пользовательским предпочтениям (рекомендательный функционал). Таким образом рекомендательный сервис способен выступать значимой надстройкой поисковых систем – поисковиком нового поколения.

Существуют и иные варианты решения проблемы – обо всех них и пойдет речь на круглом столе RIW.


Ньюсмейкер: Имхонет — 9 публикаций
Поделиться:

Интересно:

Исчезнувшие города Руси в легендах и сказаниях
08.01.2025 09:02 Аналитика
Исчезнувшие города Руси в легендах и сказаниях
Города, как и всё на земле, не вечны: они разрушаются, перестраиваются, гибнут во время стихийных бедствий и вражеских нашествий, переносятся на новые места, приобретают новый облик. Но есть в народных сказаниях сообщения о таинственном исчезновении городов или части городов: города или храмы...
Майнинг в России – что изменилось после легализации?
07.01.2025 12:46 Консультации
Майнинг в России – что изменилось после легализации?
Майнинг — это процесс создания новых блоков в блокчейне и подтверждения транзакций с использованием специализированного оборудования. За последнее десятилетие он превратился из увлечения энтузиастов в масштабную индустрию, приносящую значительные доходы. В России этот сектор развивался в условиях...
Как юридическому лицу внести изменения в ЕГРЮЛ
06.01.2025 22:19 Консультации
Как юридическому лицу внести изменения в ЕГРЮЛ
В условиях динамичного развития бизнеса и постоянно меняющегося законодательства компаниям необходимо оперативно реагировать на любые изменения, касающиеся их деятельности. Процедура внесения изменений в Единый государственный реестр юридических лиц (ЕГРЮЛ) важный аспект ведения бизнеса в России...
Тайна гибели несгибаемого генерала Дмитрия Карбышева
05.01.2025 09:04 Персоны
Тайна гибели несгибаемого генерала Дмитрия Карбышева
Дмитрий Карбышев — потомственный дворянин и родственник революционера, подполковник Русской императорской армии и генерал-лейтенант РККА, профессор Военной академии Генерального штаба РККА, доктор военных наук — навсегда вошел в историю не только отечественных инженерных войск, но и всей...
Дивизии народного ополчения Москвы 1941 года
04.01.2025 13:58 Аналитика
Дивизии народного ополчения Москвы 1941 года
Московское народное ополчение 1941 года – это особая страница ратной истории Отечества, не имеющая в ней более ранних аналогов. Дивизии Московского народного ополчения 1941 года в своём развитии прошли путь от военно-гражданских к полноценным боевым тактическим соединениям Красной Армии. Столичное...