15 лет назад 8 июля 2009 в 17:15 3208

Кроме того, Google Desktop бескомпромиссно индексировал все дисковые разделы, а меня интересовал лишь поиск в одной партиции, где хранились документы, музыка и фильмы. Нынешняя версия обучилась дифференцированному подходу, но пользователь должен указать диски, которые не подлежат сканированию, – на мой взгляд, это не очень логично. Ко всему прочему сбор данных возможен лишь при простое компьютера. Другие продукты индексируют содержимое указанных папок намного быстрее, но либо отказываются понимать кириллицу в документах, либо не поддерживают поиск в некоторых мультимедийных форматах. Да и цена ряда приложений далека от идеалов гуманизма. Возможности поискового движка Windows Vista порадовали, но этой операционной системой я не пользуюсь. Штатное средство поиска в публичной бета-версии Windows 7 выдавало крайне неполные результаты, несмотря на включенную опцию индексации содержимого (возможно, финальный релиз избавится от выявленных недочетов).

Arhivarius

К выбору нового десктопного поисковика меня подтолкнуло солидное количество текстовых файлов, хранящихся у меня на компе: попробуйте оперативно найти среди сотен статей нужный документ. В период упоминавшегося тестирования программа «Архивариус» была недоступна (уже и не помню, по какой причине), так почему бы не опробовать новую сборку российского продукта сейчас? Тем более что заявленные минимальные требования просто смешны: процессор Pentium с частотой не ниже 166 МГц, 32 Мбайт оперативной памяти, любая ОС семейства Windows. Разработчик обещает мгновенный полнотекстовый поиск документов и электронных сообщений (в т. ч. в кодировке UTF-8), причем местонахождение файлов не имеет значения: поддерживаются локальная сеть и съемные носители. Индексирование сообщений возможно в содержимом Outlook, Outlook Express, MS Exchange, The Bat! и других клиентах, а также в популярных IM (ICQ, Miranda, MSN и т. д.). Кроме этого доступен поиск в базах данных Lotus Notes и Lotus Domino. Лично мне показался интересным смысловой поиск с морфологией. Вы подзабыли, что такое морфология? Очень полезная штука.

Русский принадлежит к флективному типу языков. Например, для слова «окно» доступно 12 вариантов словоформ (6 падежей и 2 числа): «окна», «окнами», «окном» и так далее (из них 10 уникальных форм). Обычные поисковики без поддержки морфологии (например, «виндовый» движок) ищут только заданные формы слов. Если сделать запрос по слову «окно», то такая поисковая система найдет только эту форму, а другие, например «окна», «окнами», останутся за кадром. Зато «Архивариус 3000» обнаружит все грамматические формы слов (поддерживается морфология русского, украинского, белорусского, английского и еще 14 языков). Обрабатываются не только несколько десятков текстовых форматов, но и все популярные архивы. Я не оговорился – число знакомых «Архивариусу» архивных форматов исчисляется десятками. Причем он умеет индексировать такие «хитрые» файлы, как DEB (Debian Software Package), IMA (образы гибких дисков), IMG, ISO, а также файлы резервных копий в форматах VHD (MS Virtual PC) и TIB (Acronis True Image). Более того, софтина несет на борту свой модуль для распаковки всех архивов.

Лично мне нужен поиск в двух папках: в первой складированы 1112 (одна тысяча сто двенадцать) каталогов с несколькими сотнями статей в различных форматах и скриншотами, в том числе запакованными в ZIP и RAR. Необходимость поиска информации в данном каталоге возникает примерно два-три раза в неделю. Во второй папке хранится скромная коллекция звуковых файлов как с англо-, так и с русскоязычными названиями. Размер первой папки – без малого 3 Гбайт, вторая чуть меньше – 2,55 Гбайт. Что ж, приступим. Для начала следует проиндексировать нужные каталоги: кнопка «Индекс» > «Создать».

В выпадающем списке предлагается несколько опций, среди которых «Почтовые сообщения», «Интернет-пейджеры» и «Файлы FTP». Для моих нужд достаточно выбрать «Мой компьютер» и в дереве дисков включить чекбоксы напротив необходимых папок. Обратите внимание, что изначально предлагается поиск только с английской морфологией. Я отключил чекбокс «Наследовать установки из настроек программы» и отметил необходимую мне русскую морфологию (чем меньше модулей выбрано, тем выше скорость индексирования). Следующий этап – выбор документов для индексирования – подразумевает только то, что «Архивариус» найдет искомое практически в любом файле, даже в документах «1С», торрент-файлах и книжках формата FB2 (см. «Документы XML»). Настоятельно рекомендую ознакомиться со всеми поддерживаемыми типами: обнаружите много интересного.

Думаю, что с предлагаемыми кодировками вы разберетесь самостоятельно, а заодно не станете отказываться от функции извлечения файлов из архивов: искать так искать! Осталось дать имя создаваемой базе данных и указать папку для хранения оной (по устоявшейся привычке для этих нужд я выделил каталог на одном из логических дисков). Перед началом сканирования можно вычислить размер создаваемого индекса. На исследование моих папок «Архивариус» потратил не более 4 мин., обнаружив и собрав данные из 17 866 документов, а совокупный размер файлов индекса составил 26 Мбайт. Объем оперативной памяти, занимаемый прогой во время индексирования, не превышал 50 Мбайт.

Для поиска переходим в одноименный программный раздел, выбираем требуемый индекс и вводим запрос. Я использовал ключевое словосочетание «записки технофетишиста», результат вы видите на рисунке: «Архивариус» нашел все тексты, содержащие данную фразу. Для вящей точности предлагается указать доппараметры, например дату изменения, размер и / или формат документа. Кроме этого, нажав ссылку «Введите запрос», можно дополнительно конкретизировать поиск, например приказав «Архивариусу» использовать все слова запроса, часть слов или точную фразу. Если же вы не помните об искомом документе вообще ничего, обратитесь за помощью к «Мастеру поиска», который предложит несколько критериев, по которым можно сформулировать задачу. Для экономии дискового пространства рекомендуется сжимать файлы индекса, а при необходимости дать команду программе осуществлять повторное индексирование изменившихся файлов (к вашим услугам встроенный планировщик заданий).

  • Программа: «Архивариус 3000» 4.17
  • Тип: программа для поиска файлов на ПК
  • Разработчик: Likasoft
  • ОС: Windows 9x / Me / NT / 2000 / XP / 2003 / Vista
  • Объем дистрибутива: 4,15 Мбайт
  • Русификация интерфейса: есть

Адрес программы: www.likasoft.com/ru

Автор: Акустик

Никто не прокомментировал материал. Есть мысли?