12 лет назад 14 декабря 2011 в 0:51 2656

Обзор посвящен интернет-поисковикам, предназначенным для розыска информации о пользователях Сети. Они помогут установить личность человека, с которым вы встретились в интернете, навести справки о знакомых или же провести поиск по собственному имени. Многие пользователи зачастую не отдают себе отчета в том, что, если собрать воедино те фрагменты данных о них, которые они оставляют на разных ресурсах, такой сводный «профиль» будет содержать куда больше информации, чем они бы решились сообщить одному веб-сервису.

Анализируем открытые источники
Начиная рассказ о средствах поиска персональной информации, нельзя пройти мимо возможностей универсальных поисковиков, которые с относительно недавнего времени научились индексировать открытые страницы пользователей крупнейших социальных сетей. В то же время для такого поиска характерен ряд ограничений. Один из нюансов работы универсальных поисковиков – ориентация на рейтинг проиндексированных веб-страниц при формировании списка результатов.

Это означает, что при персональном поиске на первых позициях будут популярные сетевые публикации, подписанные указанным именем. В лучшем случае мы увидим ссылки на первые страницы профилей некоторых социальных ресурсов, на которых зарегистрированы люди с таким именем. В то же время установить отдельные факты о человеке либо его связях с другими лицами или событиями довольно сложно.

Немного дальше пошел «Яндекс», запустивший в своем новостном разделе оригинальный сервис «Пресс-портреты» (news.yandex.ru/people). Это своеобразный справочник о встречающихся в новостях персоналиях. Для каждой персоны приводится настоящее досье, состоящее из нескольких разделов. Первый бесхитростно назван «Кто это» и содержит перечень ключевых слов, которые характеризуют героя досье. Для каждого такого слова приводится количество упоминаний в СМИ, а также ссылки.

Названия разделов «Работа», «Новости» и «Интервью» говорят сами за себя: там вы найдете именно названные сведения о данной персоне. Весьма полезна функция «Связанные пресс-портреты». Раздел содержит ссылки на пресс-портреты других людей, которые часто упоминаются вместе с именем героя изначального поиска.

Ресурс PeekYou (www.peekyou.com) обладает базой, содержащей порядка 250 млн персональных «досье», полученных индексированием различных открытых источников: блог-платформ, медиахостингов, социальных сетей и других подобных ресурсов. PeekYou работает с открытым, «видимым» вебом, индексируя Twitter, LinkedIn и еще парочку подобных источников. К сожалению, он не взаимодействует с нашими популярными социальными ресурсами.

Интерфейс поиска и списка результатов у PeekYou устроен достаточно понятно. На стартовой странице предлагается указать имя, фамилию или ник интересующего вас человека. К сожалению, ники обрабатываются гораздо хуже, чем «нормальные» имена. Сразу же можно уточнить страну поиска, а для США еще и штат.

Все остальные инструменты уточнения запроса собраны на боковой панели страницы. Это пол, возраст, который задается с помощью ползунка, а также тематические теги. Собственно список результатов разделяется на блоки по типам источников: профили на сайтах, мультимедиахостингах и ряд других. Выбрав подходящий результат, можно открыть страничку персонального «досье», на которой вся найденная фактическая информация будет представлена в легком для восприятия, структурированном виде.

Для ранжирования и оценки результатов на данном ресурсе используется собственный индекс PeekScore. Измеряется он в диапазоне от единицы до десяти и рассчитывается для каждого «досье». Чем выше PeekScore, тем более заметной и активной является данная персона в Сети.

Учитываются посты на блогах, количество аккаунтов на социальных ресурсах, упоминания во внешних источниках и другие подобные факторы. Высокий индекс также косвенно свидетельствует о большей достоверности приведенных результатов поиска, поскольку при извлечении и анализе данных системе было доступно больше источников. Кроме того, ориентируясь на PeekScore, можно вычислять экспертов или просто активных авторов в той или иной тематической сфере.

Еще один проект, делающий ставку на удобный анализ открытых источников, – CVGadget (www.cvgadget.com). Устроен он весьма просто: заданный запрос отправляется на поддерживаемые источники, после чего результаты демонстрируются на одной странице. Обрабатываются 14 проектов, среди которых Facebook, MySpace и LinkedIn, а также линейка сервисов Google – от блогов до «Документов». Для каждого блока показывается общее количество найденных совпадений. Сами ссылки можно увидеть в раскрывающемся списке. Надо сказать, такой подход заметно ускоряет работу с ресурсом, да и результаты поиска довольно приличные.

Работаем со «скрытым вебом»
Наглядное представление информации из открытых источников – это, конечно, замечательно, однако позволяет решить только ограниченный круг задач. Ряд современных поисковиков, ориентированных на операции с персональными данными, обращаются к тому, что принято называть «deep web», – имеющейся в Сети информации, которая в силу разных причин ускользает от роботов-индексаторов обычных, универсальных поисковиков.

Как правило, это различные базы данных, не размещаемые напрямую на веб-страницах. Роботы таких систем пытаются взаимодействовать с подобными базами, проводить поиски, извлекая полезную инфу – контактные данные, факты, сведения о других опубликованных данных. Именно к «скрытому вебу» относятся базы профилей пользователей различных ресурсов и другие источники информации о людях, а также данных, позволяющих связать опубликованную в Сети информацию с определенной персоной.

В этой связи нельзя не упомянуть сервис Wink (wink.com). Дело в том, что его создатели называют Wink крупнейшей открытой базой персональной информации в интернете, заявляя о том, что их система проиндексировала к настоящему времени более 400 млн профилей на самых различных сетевых ресурсах.

Форма составления запроса Wink достаточно проста и предлагает отличный набор дополнительных фильтров, сгруппированных в тематические блоки, расположенные под строкой запроса. С их помощью можно отфильтровать данные по полу и возрасту, указать возможные интересы, местоположение и другие дополнительные сведения, позволяющие уточнить результаты поиска. Возможен также реверсивный поиск по адресу электронной почты.

Несмотря на впечатляющие объемы базы, в наших широтах Wink имеет ограниченную полезность, поскольку он не только не работает с наиболее популярными у нас социальными ресурсами, но и не воспринимает запросы, набранные кириллицей. Так что сфера его применения для нас – поиск информации о зарубежных контактах. Кроме того, во многих случаях Wink получает данные от своих партнеров, в частности сервиса MyLife, а там для просмотра результатов поиска требуется регистрировать платный аккаунт. В то же время действительно большая база Wink пригодится при первоначальном сборе информации.

Следующий проект нашего обзора вовсю эксплуатирует образ всезнающих чекистов. kgbpeople (www.kgbpeople.ru) позиционируется как средство поиска сведений о людях, размещенных в социальных сетях и на других интернет-источниках. Кроме того, создатели kgbpeople предлагают находить некорректные сведения о себе и, соответственно, принимать те или иные меры для исправления ситуации. Можно также включить оповещение о новой информации, связанной с вашим именем, которая попадает в индексные базы проекта.

В качестве запроса принимается имя или ник интересующего вас человека. Далее система действует как классический метапоисковик: проводит поиск по доступным базам различных внешних проектов, затем обрабатывает результаты и демонстрирует их единым списком.

Ряд современных поисковиков, ориентированных на операции с персональными данными, обращаются к тому, что принято называть «deep web».

Выбрать ресурсы, по которым ведется поиск, можно на странице настроек («Параметры поиска»). Выбор, надо сказать, неплохой. Предлагается больше двух десятков социальных сетей, причем не только общеизвестных Facebook, Twitter или LinkedIn, но и достаточно неизбитых: здесь представлены, например, французские и голландские социальные сети, а также музыкальный рекомендательный сервис Last.fm. Кроме того, доступен список крупных универсальных интернет-поисковиков, а также медиахостингов. Это позитивно сказывается на широте поиска. Фильтр имеется только один: географический. При необходимости можно ограничить сферу деятельности kgbpeople определенной страной.

Страница результатов kgbpeople состоит из нескольких вкладок. Первая, «Виртуальные сообщества», содержит список панелей, соответствующих задействованным в поиске ресурсам. По умолчанию выводятся только панели тех ресурсов, на которых были найдены какие-то полезные сведения. Другие панели предлагают доступ к результатам универсальных поисковиков, выдаче популярных медиахостингов.

Вкладка «Личные» носит вспомогательный характер: сюда, например, попадают теги, которые нашлись в описаниях, аккаунтах и других материалах. Этот инструмент позволяет быстро уточнить свой запрос, что полезно, в частности, при большом количестве обнаруженных однофамильцев.

На сайте предусмотрена бесплатная регистрация. Она, в принципе, необязательна, но позволит создать свою страничку с персональными данными, которые будут использоваться поисковиком, сохранять поисковые запросы, что весьма удобно при устойчивых интересах. Кроме того, появятся дополнительные инструменты анализа данных, например статистика поисков по вашему имени. kgbpeople также умеет рассчитывать так называемый WOW-фактор, который отражает общее количество связей конкретного человека с другими в социальных сетях и на других подобных ресурсах.

Для работы этого инструмента, правда, придется предоставить приложению доступ к вашим собственным аккаунтам в нужных социальных сетях. Поскольку при этом открывается доступ к приватной информации, приходится внимательно взвешивать возможности и потенциальные риски. Справедливости ради заметим, что подключение своих учетных записей действительно благоприятно сказывается на полноте и точности получаемых с помощью kgbpeople результатов.

Теперь о недостатках. В результатах поиска kgbpeople довольно много информационного шума. Система не всегда корректно обрабатывает пару «имя-фамилия», в результате чего нужные данные приходится иногда буквально выкапывать. Есть проблемы и с полнотой индексирования: например, система «не видит» недавно зарегистрированные аккаунты, что говорит о невысокой скорости индексирующих роботов. Еще один важный для нас недостаток – отсутствие поддержки популярных российских социальных проектов. Смутить может и попытка сбора персональных данных при регистрации аккаунта.

Поисковая система Pipl (pipl.com) также пытается связать данные, полученные из различных источников, с конкретной персоной и представить их в более-менее организованном виде. Pipl применяет собственные алгоритмы ранжирования. «Вес» найденных данных определяется в отрыве от конкретных страниц и источников, из которых они извлекаются.

Соответственно, и «улов» ближе к фактографическому: даты, записи профилей, адреса – все это оценивается применительно именно к характеристике персоны. Досье может содержать сведения о возрасте, предполагаемом географическом местоположении, аватар, а также короткие выдержки из найденных профилей. В принципе, подобной информации обычно бывает достаточно, чтобы вычислить интересующего вас человека.

В качестве поискового запроса можно вводить как реальное имя, так и ник – ориентируйтесь на то, что, по вашему мнению, может быть использовано человеком в Сети. Есть у Pipl и форма расширенного поиска. В ней можно точно указать в отдельных полях все известные вам сведения о нужном человеке: имя, фамилию, ник, адрес e-mail, что позволит Pipl уточнить и ваш запрос, и, возможно, свои сведения о данной персоне. Кроме того, на боковой панели предлагается ряд фильтров, позволяющих уточнить запрос по возрасту, тегам или географическому признаку. Это весьма полезно, если вы ведете поиск только по нику и количество результатов слишком велико.

Первая страница выдачи содержит ссылки на «профили» – своеобразные автоматически сгенерированные досье, которые, возможно, относятся к человеку, которого вы ищете. Отдельные досье, например, составляются на ники, встречавшиеся вместе с именем из вашего запроса. Уточняющие ссылки, всплывающие при наведении курсора на профиль, – спонсорские, они направляют вас на внешние ресурсы и на них можно не обращать внимания. А вот клик по «профилю» приведет нас на следующую страницу списка результатов самого Pipl.

На ней приведены линки на проиндексированные ресурсы, которые, возможно, относятся к данной персоне. При желании вы можете помочь Pipl в его работе, отметив точные результаты с помощью кнопки Add to Profile. К сожалению, Pipl плохо понимает кириллические запросы, а также не индексирует наши социальные ресурсы.

В отличие от рассмотренных выше поисковиков, Spokeo (www.spokeo.com) не ставит задачу нахождения всех упоминаний человека в Сети. Его создатели вместо этого предлагают своеобразный гибрид поискового и мониторингового сервиса: вы указываете людей, а Spokeo пытается отследить все связанные с ними обновления на сетевых ресурсах. Другими словами, вам предлагается самостоятельно «сдать» системе персональную информацию о своих контактах, например импортировав адресную книгу своего почтового клиента.

Нельзя не напомнить, что и с вами могут поступить аналогичным образом. Spokeo также обрабатывает основные блог-платформы, крупные зарубежные социальные сети, а также ряд медиахостингов и рекомендательных сервисов. В результате вы получаете обзор сетевой активности интересующего вас человека на всех этих ресурсах. Spokeo пытается сгенерировать собственное «досье» на каждого отслеживаемого человека. В нем могут находиться достаточно чувствительные персональные данные, извлеченные из профилей отслеживаемых сервисов.

В качестве запросов Spokeo принимает не только имена или ники, но и адреса e-mail, а также номера телефонов (для некоторых стран). Интерфейс у сайта интуитивно понятный. Все обработанные ресурсы разделены на группы: «социальные сети», «сайты знакомств», «видеохостинги» и другие – всего десяток групп и 60 используемых ресурсов. Сразу следует оговориться, что в основном представлены популярные зарубежные сайты, так что для поиска информации о ближних соседях будут полезны разве что агрегированные результаты с таких сервисов, как Facebook, Twitter, LiveJournal, YouTube, Photobucket. Кроме того, Spokeo ведет поиск доменов, совпадающих с именем или ником из запроса.

Если в какой-либо из групп было найдено совпадение с вашим запросом, иконка соответствующего ресурса будет подсвечена. Поскольку Spokeo предлагает платную подписку на свои услуги, ряд сайтов в результатах поиска в бесплатной версии системы заблокированы. Как бы то ни было, мы действительно получаем массу полезной информации о персональной активности человека на одной странице.

Пару слов о качестве поиска. Несмотря на то что просмотр полных результатов здесь доступен только после регистрации платного аккаунта, Spokeo может сослужить добрую службу и в бесплатной ипостаси. Тестовые запросы показали, что поисковик вполне справляется с отслеживанием различных медиахостингов, неплохо разбирается с различными рекомендательными сервисами, а также, что бывает весьма полезно, хорошо ищет информацию об участниках аукционов на eBay. В то же время Spokeo пропускает профили Facebook и не всегда находит блоги LiveJournal.

Среди современных социальных сетей можно найти немало специализированных ресурсов, призванных объединять не просто всех желающих, но определенные группы пользователей, например по профессиональному признаку. Аналогичное разделение сфер начинает проявляться и в нише поисковиков персональной информации.

Удачным примером здесь будет бесплатный сервис Zoominfo (www.zoominfo.com), ориентированный на поиск информации о специалистах и потенциальных деловых партнерах. Источников пополнения у данного проекта несколько. Кроме индексирования сетевых ресурсов и получения информации от проектов-партнеров практикуется и прямое получение данных от пользователей.

На сервисе предусмотрена бесплатная регистрация. В ходе нее вам предложат скачать и установить дополнение для Outlook, которое предназначено для анализа переписки пользователя. В ходе этого анализа программа пытается автоматически выделять имена, адреса, названия фирм, должности, ссылки на корпоративные веб-сайты и социальные сети, а также другую подобную информацию.

Взамен пользователь получает доступ к полной базе данных Zoominfo, в которой содержится примерно 50 млн персональных «досье» и 5 млн профилей фирм. Насколько это равнозначный обмен, решать вам. Упомянем только, что разработчики Zoominfo предусмотрели возможность удаления собственных данных из их каталога по запросу пользователя.

Заметим, что Zoominfo достаточно разборчив при сохранении данных. Проект ориентирован на поиск деловой информации, поэтому, например, сведения о e-mail-адресах с «общедоступных» почтовых хостингов игнорируются, а вот адреса корпоративной почты становятся лакомой добычей. Если вы нашли информацию о себе или своей фирме в Zoominfo, есть возможность подтвердить ее правильность. После этой операции данный результат получит на странице выдачи значок «verified». UP

Никто не прокомментировал материал. Есть мысли?

Общеизвестно и малоэффективно, обычный запрос в Google приносит больше результата.