Все уже привыкли к тому, что в небольшом клубе крупнейших мировых интернет-поисковиков подавляющим количественным преимуществом обладают американские проекты. Однако это не так, и мы попробуем поколебать данный миф рассказом о европейской разработке.
Речь пойдет о системе Exalead, всерьез претендующей на звание «европейского Google». Этот ресурс является примером функционально «заряженного» проекта, обладающего хорошим набором инструментов, а также демонстрирующего конкурентоспособное качество поиска.
Создатель Exalead – частная компания, которая зарабатывает внедрением корпоративных решений для поиска. Однако на развитие общедоступного веб-поиска, о котором пойдет речь в нашем обзоре, фирма в свое время получила субсидии от Еврокомиссии в рамках программы Quaero, так что в данном проекте присутствует и то, что принято называть государственными интересами. Exalead опирается на собственные индексные базы и предлагает поиск по веб-документам, изображениям, видео и «Википедии». Давайте по порядку познакомимся с его возможностями.
Все флаги в гости к нам
Одной из особенностей Европы в сфере интернет-поиска является большое количество национальных языков. А значит, продукт, претендующий на место ведущего европейского поисковика, просто обязан хорошо индексировать национальные сегменты интернета и качественно обрабатывать запросы на многочисленных европейских языках – как ведущих, так и менее распространенных.
И именно в данной области разработка родом из Европы может получить серьезное конкурентное преимущество по сравнению с мощными заокеанскими конкурентами. Надо сказать, создатели Exalead это понимают и работают в данном направлении. При проведении поиска по одинаковым тестовым запросам в Google и Exalead картина получается следующая. В англоязычном поиске Google лидирует по количеству найденных страниц. В немецком однозначного лидера не было – в зависимости от запроса сервисы получали преимущество по очереди.
При включении в настройках французского языка количество результатов выравнивалось, а при переходе к некоторым другим европейским языкам, например итальянскому, Exalead резко вырывался вперед. По некоторым же запросам в разных языках количество найденных страниц отличалось в разы в пользу «европейца».
Стартовая страница Exalead предлагает возможность персональной настройки. Здесь можно разместить ссылки на свои любимые сайты – они будут отображаться в виде графических миниатюр-скриншотов. Правда, для этого придется зарегистрировать бесплатный аккаунт, а также разрешить браузеру принимать кукисы Exalead.
Любопытным образом организован расширенный поиск: в противоположность большинству других аналогичных продуктов он не вынесен на отдельную страницу, а доступен прямо на странице выдачи. Отличается Exalead и от поисковика Bing, разработчики которого приняли аналогичное решение по размещению своего расширенного поиска на странице выдачи. Дело в том, что Exalead предлагает не просто привычную форму с набором дополнительных полей, а выпадающий список, который, по сути, представляет собой мастер по уточнению запроса. При выборе того или иного пункта в строке добавляются новые элементы и, при необходимости, операторы и спецсимволы.
В меню мастера выделено три тематических блока. Первый блок предлагает определиться с вариантами уточнения запроса. Доступны поиск по фразе, обязательное включение и исключение заданного текста, а также поиск с применением масок. Поддерживается использование в запросе стандартных логических операторов. Кроме этих, в общем-то стандартных, режимов предлагаются и более интересные варианты. Это Approximate Spelling Search, который ищет слова, похожие по написанию на заданные, а также Phonetic Search, с помощью которого можно найти слова, похожие по произношению на указанные пользователем. И если предложения по исправлению опечаток уже давно можно найти на других поисковиках, то поиск по звуковой транскрипции слова можно назвать новинкой.
Оставшиеся два блока расширенного поиска предлагают отфильтровать результаты по дате их появления в индексе поисковика, а также ограничить поиск определенным сайтом, заголовком страницы или другим формальным признаком.
Перечень найденных ссылок на странице выдачи сопровождают миниатюры-скриншоты страниц, что достаточно удобно. Кроме того, любой найденный сайт можно тут же добавить в свою базу закладок, благо соответствующий линк выводится сразу после краткой текстовой аннотации, сопровождающей каждую позицию списка.
Страница выдачи Exalead отличается большим выбором вспомогательных инструментов, вынесенных на боковую панель. Первый блок фильтров позволяет ограничить выдачу результатами, найденными на сайтах и блогах. Следующие два блока дают возможность отобрать контент определенного формата. Распознается большое количество «офисных» форматов файлов, а также видео и аудио. Фильтр даты публикации позволяет быстро просмотреть результаты, проиндексированные в определенный промежуток времени. По умолчанию шаг такого фильтра – один год.
На развитие веб-поиска, о котором пойдет речь в нашем обзоре, фирма получила субсидии от Еврокомиссии, так что в данном проекте присутствуют и государственные интересы.
Exalead достаточно уверенно использует кластерные технологии. Фильтр Related Terms как раз предлагает ознакомиться с полученными таким способом дополнительными ключевыми словами, которые способны помочь в уточнении запроса. Возможности данного фильтра, конечно, уступают лучшим кластерным поисковикам, например, здесь нет вложенных кластеров, однако с практической точки зрения он все равно довольно полезен.
Два последних блока фильтров выполнены в виде интерактивных круговых диаграмм. Они демонстрируют процентное распределение результатов поиска по языковому признаку и по принадлежности к национальным сегментам интернета. Щелкая по секторам диаграмм или же по позициям сопровождающих списков, можно быстро отфильтровать выдачу по выбранному критерию.
Отдельным видом поиска в Exalead выделена работа с Wikipedia. В этом режиме на странице результатов все найденные ссылки сопровождаются не только стандартным скриншотом и текстовой выдержкой, но и перечнем тематических категорий, персон, организаций и местоположений, относящихся к найденной статье энциклопедии.
Помимо этого страница снабжена боковой панелью с облаком тегов, в котором тоже выделены названные перечни дополнительных признаков. Кроме того, имеется возможность быстрой сортировки результатов по языковому признаку с помощью выпадающего меню. В результате «эксалидовский» поиск по Wikipedia стал действительно полезным инструментом, работать с которым гораздо удобнее, чем со стандартной системой поиска самой «Википедии».
Эксперименты с интерфейсом
Exalead предлагает хорошие возможности для отыскивания мультимедийного контента – изображений и видео. При просмотре результатов поиска изображений доступен режим вывода найденных картинок в виде бесконечной ленты. Это значит, что выдача не разбивается на отдельные страницы, а новые миниатюры просто автоматически подгружаются по мере прокрутки страницы результатов. Включить эту возможность можно в настройках поисковика, называется она Allow Infinite Scroll in Image Search. Подобный стиль работы хоть и требователен к скорости интернет-соединения, но довольно удобен для просмотра большого количества изображений. Exalead – пока единственный из крупных поисковиков, предлагающий такую опцию.
Инструменты расширенного поиска изображений вынесены на специальную панель фильтров, которая располагается над списком результатов. Кроме стандартных параметров вроде размера картинки и типа файла здесь предоставляются также возможности отбора изображений по ориентации снимка (книжная или альбомная). Есть у Exalead и парочка визуальных фильтров. С их помощью можно отбирать картинки по цветовой гамме – соответствующая палитра доступна на панели фильтров, – а также разделить фотоснимки и рисованную графику, правда, эта опция не всегда функционирует корректно.
Видеопоиск Exalead охватывает базы крупных видеохостингов.
Полного списка поддерживаемых сайтов разработчики не сообщают, однако в результатах тестовых запросов удалось «засечь» два десятка ресурсов. Среди них – YouTube, Metacafe, Dailymotion, Reyters, Comedy Central и ряд других. Отметим, что среди найденного попадались и ролики RuTube. В боковой панели на странице выдачи предлагаются опции отбора результатов поиска по продолжительности ролика, источнику, а также тематической категории. В последнем случае используются теги, которыми видео было помечено на хостинге-источнике. Список можно отсортировать не только по релевантности, но и по дате добавления, а также рейтингам роликов на видеохостингах.
Заметим, что для поиска новостных сюжетов можно воспользоваться вертикальным сервисом Voxalead News. Источниками роликов служат базы 36 телеканалов. Диапазон достаточно широк: от CNN до Al Jazeera, есть в списке и Russia Today. Представлены проекты на английском, французском, китайском и арабском языках. При желании выдачу можно ограничить только выбранными пользователем каналами. Такая настройка доступна в меню Select Sources.
Любопытно, что кроме новостных роликов Exalead также предлагает поиск записей новостей десятка радиостанций. Щелчок по любой позиции в списке результатов – будь то видео или аудио – открывает страницу со встроенным плеером, а также полным текстом новости, что достаточно удобно. Полагаю, что данную возможность по достоинству оценят люди, практикующиеся в изучении иностранных языков. Кроме того, для каждого ролика предлагается панель тегов, состоящая из трех закладок: People, Organization и Location.
На них группируются автоматически выделенные из текста новости ключевые слова, относящиеся к персонам, организациям или географическим пунктам. Щелчки по ним подсвечивают соответствующие фрагменты в тексте, а также включают переход в ролике к соответствующему фрагменту. Такая автоперемотка найденных роликов по ключевым словам также пока является уникальной функцией для универсальных интернет-поисковиков.
Прочие эксперименты…
Как и положено серьезным проектам интернет-поиска, Exalead обзавелся собственной «лабораторией», в которой представлен ряд экспериментальных разработок, пока не внедренных в основном поиске. Проект Chromatik Search предлагает поиск изображений по визуальным признакам. «Разыскные работы» можно начинать с ключевого слова, а можно сразу же воспользоваться панелью визуальных инструментов. С помощью палитры выбираются цвета, которые должны присутствовать в нужном вам изображении. Их процентное соотношение устанавливается простым перетаскиванием слайдера инструмента Adjust Proportions. В результате можно достаточно точно описать характеристики искомого изображения.
Благодаря этому нехитрому в работе средству разработчикам Chromatik удалось, с одной стороны, добиться высокой точности запроса, а с другой – сделать этот процесс максимально простым для пользователя. Во всяком случае, решающий аналогичные задачи движок IBM QBIC заметно сложнее в освоении. Дополнительные настройки запроса позволяют управлять цветностью картинки, а также искать более светлые или более темные изображения. Интересно, что характеристики запроса, составленные с помощью графических инструментов, дублируются текстом, выводимым над областью выдачи результатов.
В итоге у Exalead получился один из наиболее удобных на сегодняшний день интерфейсов для визуального поиска изображений. Интересно будет впоследствии взглянуть на его внедрение в стандартный мультимедиапоиск европейской машины. Экспериментальный интерфейс Exalead Constellations предназначен для визуализации результатов поиска. Найденные по запросу ссылки демонстрируются в виде своеобразной «звездной карты». При ее построении учитывается количество линков на тот или иной сайт – они демонстрируются в виде цветных лучей.
Чем их больше, тем ближе к центру «галактики» будет расположена «звезда» ресурса. Над полем поиска выводятся уточнения, с помощью которых можно быстро отсортировать сайты, посвященные персоналиям. Кроме того, в Constellations доступны практически все инструменты фильтрации «стандартного» Exalead, о которых мы уже рассказывали. Вызвать соответствующую панель можно с помощью ссылки Refines.
Есть у Exalead и своя экспериментальная поисковая машина для Twitter, которая называется Tweepz. В настоящее время она индексирует более 15 миллионов аккаунтов. Интересно выполнена заявка на включение в индекс: если вы желаете, чтобы ваши твитты попадали в базу Tweepz, достаточно подключить канал @tweepz. Система поддерживает использование собственного языка запросов; он позволяет работать с масками, искать слова, расположенные в тексте твитта рядом, вести поиск по именам
и местоположениям пользователей. Как и в «большом» Exalead, страница результатов поиска содержит боковую панель
с хорошим выбором фильтров. Найденное можно сортировать по релевантности, количеству фолловеров и языкам. Кроме того, в Tweepz работает кластерный алгоритм, с помощью которого в твиттах выделяются дополнительные ключевые слова, которые можно добавить к своему запросу.
Весьма оригинален и любопытен экспериментальный сервис Exalead Wikifier: с его помощью можно «викифицировать» любую веб-страницу в ходе серфинга. Суть этой операции заключается в том, что сервис ищет на открытой веб-странице ключевые слова, значения которых есть в «Википедии», после чего подсвечивает их цветным выделением. Наведя на него курсор, пользователь получает всплывающее окошко с информацией из сетевой энциклопедии, а также ссылки на страницу Wikipedia и поиск Exalead по выделенному слову. Викифицировать можно не только указанную веб-страницу, но и текст, введенный в поле на стартовой странице Wikifier. В результате получается удобный встроенный справочник, прозрачно работающий во время серфинга.
Если рассмотренные выше проекты отличаются своей технической сложностью, то Exalead Light демонстрирует прямо противоположный подход к поиску. Это «легкая», максимально упрощенная версия Exalead, предлагающая только текстовые инструменты уточнения запросов. В то же время здесь не поступились качеством поиска – доступны все вертикальные базы проекта. Помимо прочего Exalead Light отличается более высокой скоростью работы, а также совместимостью даже с самыми простыми браузерами.
Exalead Desktop и другие дополнения
Exalead обладает хорошей подборкой дополнительных инструментов. Букмарклет Exalead позволяет создавать закладки на веб-страницы в ходе серфинга и сохранять их в своем онлайновом профиле. Поисковый плагин Exalead предлагает стандартные опции и работает в браузерах Internet Explorer и Firefox.
Для веб-мастеров предоставляется возможность поиска по сайту на основе технологии Exalead. Впечатление от него двоякое. С одной стороны, там работают многие фирменные фишки Exalead, например визуальные фильтры-диаграммы. С другой – глубина индексирования сайтов сильно зависит от страны их происхождения. Поэтому для русских ресурсов такой поиск пока малополезен, в отличие от, например, французских веб-проектов.
Наиболее функциональным дополнением является пакет Exalead Desktop, который предназначен для индексирования и поиска файлов на локальном компьютере. После инсталляции приложения в онлайновом интерфейсе Exalead становится активна закладка My PC, в которой можно вести поиск по собственным файлам.
Exalead Desktop 4.6 работает с операционками Windows 2000 – Windows 7 и поддерживает почтовые клиенты Windows Mail, Outlook, Microsoft Exchange, Mozilla Thunderbird и Lotus Notes. Для получения ссылки на бесплатную версию программы понадобится пройти краткую процедуру регистрации. Пока доступно только шесть языковых версий пакета: английская, французская, немецкая, итальянская, датская и чешская, однако в скором времени разработчики обещают расширить этот список, причем заявлена и русская локализация.
В процессе установки можно определить перечень отслеживаемых каталогов компьютера, время создания первичного индекса (сразу после установки или же во время простоя компьютера), а также оптимизировать скорость поиска за счет резервирования определенного объема оперативной памяти для нужд Exalead Desktop.
Индексирование Exalead Desktop проводит достаточно качественно, документы на русском языке отображаются корректно. К сожалению, у нас нет возможности указывать типы файлов для индексирования – приложение обрабатывает все поддерживаемые типы, что может привести к ненужному информационному шуму. Заметим, что в бесплатной версии Exalead Desktop доступны 120 типов файлов.
Сервер Exalead Desktop работает в фоновом режиме, а собственно поиск и настройка приложения ведутся с помощью веб-интерфейса, развернутого на локальном хосте. Официально заявлена поддержка браузеров Internet Explorer и Firefox, однако на страницах Exalead Desktop нет ничего такого, с чем не справятся другие современные браузеры. Ориентация на веб-техологии предполагает предварительную настройку локальных файрволлов. Деятельность Exalead достаточно охотно блокируется «огненными стенами», и в результате вместо страницы поиска в браузере открываются только сообщения об ошибке: дескать, «приложение не запущено». После правки настроек файрволла эта проблема благополучно исчезает.
Скорость работы веб-интерфейса не так высока, как хотелось бы, – это, пожалуй, главное неудобство в использовании «настольного» поиска от Exalead. Собственно сами «разыскные мероприятия» проходят быстро, а вот генерация графических миниатюр, открытие меню настроек и другие вспомогательные операции заметно притормаживают процесс. Интерфейс выдачи выполнен в стиле онлайнового Exalead: список найденного, расширенный поиск в виде выпадающего меню, а также боковая панель фильтров. Просматривать результаты можно в трех режимах: только текстовые ссылки, ссылки и графические миниатюры, а также миниатюры и расширенный текст.
Набор фильтров на боковой панели можно настраивать. Из специфических для «настольного» поиска инструментов отметим возможность сортировки по имени владельца файла, а также источнику. В последнем случае результаты распределяются по папкам, в которых были обнаружены те или иные материалы. Для мультимедиафайлов выводятся фильтры по жанру, альбому и битрейту. Необходимо отметить, что в «настольном» сервисе также действует автоматический поиск дополнительных ключевых слов в тексте файлов, причем он работает и для русского языка, хоть и не так уверенно, как для английского и французского. Щелчки по найденным ссылкам открывают материалы в сопоставленных им приложениях. Действует поиск в найденном.
В настройках Exalead Desktop можно включить использование облака тегов для демонстрации дополнительных ключевых слов, а также «улучшенный» вид страницы выдачи. В этом режиме просмотр списка результатов проводится не с помощью обычного перехода с перезагрузкой страницы, а посредством горизонтального пролистывания виртуальной ленты найденного.
Кроме бесплатного Exalead Desktop Free предлагается и коммерческая корпоративная версия. Она отличается расширенным списком поддерживаемых файлов, а также рядом дополнительных функций, наиболее полезная из которых – поиск материалов в локальной сети. UP