суббота, 18 октября 2008 г.

Некоторые проблемы поисковых систем

С ростом популярности Интернета, глобализацией мира и увеличением население (и как следствие рост как пользователей так и поставщиков информации через Интернет) количество информации в Интернете растёт экспоненциально. Как следствие, проблема поиска информации выполняемая поисковыми системами типа Google всё время усложняется. Очевидной проблема является постоянно увеличивающаяся нагрузка на оборудование с ростом объёма хранимой информации, а также непрерывно снижающаяся перидоичности ре-индексации ресурсов. Однако проблем увеличения объёма затрагивает не только поставщика услуги поиска информации, но отражается и на потребителях - количество ссылок на многие, даже специфические запросы столь велико, что обработать результат не представляется возможным.

Если результат выполнения поиска помещяется на 100 страницах, то он имеет столько же смысла как и 20 страничный ответ.

Поэтому одной из текущих задач поисковых систем являетя не только поиск информации, но и её визуализация и классификация.

Исследования показывают, что 81% пользователей не будут листать в поисках информации далее 3-х листов и либо откажутся от поиска либо переформулируют свой запрос.
Поскольку сегодня многие пользуются экранами с достаточно большим разрешением, то неиспользованное пространство можно было бы использовать для алгоритмов искуственного интеллекта, предлагающие там возможные варианты переформулирования запроса основываясь на
1. Фильтрации по типам найденных документов: HTML, PDF, DOC etc
2. Фильтрации на основе ключевых слов наиболее часто употребляемых вместе с терминами используемыми в текущем поиске
3. Логическое продолжение и дополнение терминов поиска основанное на логике предыдущих запросов.

Следует также упомянуть попытки визуализации выполнения запросов основанные за 3D представлении результата по
1. Темам
2. Подобию документов
3. Временные линии (наподобии организации фотографий по дате используемой во многих современных программах / когда фотографии располагаются вдоль оси времени или по оси времени показана гистограмма построенная на основе количества фото сделанных в каждый элементарный промежуток времени данной временной оси).

Комментариев нет: