• 5.1. Поиск на локальном компьютере
  • 5.2. Поиск в сети
  • 5.3. Поиск в Интернете
  • 5

    Поиск информации

    Способность оперативно найти нужную информацию является залогом успеха современного человека. В самом деле, извечное стремление человечества к коллекционированию и накоплению привело к тому, что сейчас в Интернете (да и в любой большой организации со свободным доступом сотрудников к сети) можно найти ответ на любой вопрос, который может возникнуть. Однако для этого нужно обладать поистине огромным везением, смекалкой и опытом.

    Таким образом, умение искать информацию ценится все больше и больше. И этим умением должен обладать каждый: от обычного пользователя до служащего, хоть иногда задумывающегося о карьерном росте.

    Задачи поиска информации условно делятся на три типа. В зависимости от размера области, в которой нужно выполнить поиск информации, это задачи поиска на локальном компьютере, на компьютерах локальной сети и в Интернете.

    5.1. Поиск на локальном компьютере

    Самой простой задачей поиска является поиск на локальном компьютере. В этом случае множество проблем решается автоматически, и вам остается разобраться с несколькими оставшимися: где и как искать.

    Если вы точно или хотя бы приблизительно знаете, что ищете и где это находится, то нет смысла пользоваться специальными программами: в этом случае достаточно открыть нужный каталог и выполнить поиск необходимого файла. В операционной системе Windows Vista это сделать очень просто – достаточно открыть каталог и начать вводить название искомого файла. По мере того как вы будете вводить название, операционная система автоматически будет переходить к файлу, название которого удовлетворяет тому, что вы вводите.

    Если же область поиска и название искомого файла вам неизвестны, значит, пришла пора воспользоваться специальными программами и окнами для поиска.

    Возможности Windows Vista

    Как всегда, такие программы можно найти в стандартной поставке операционной системы Windows Vista.


    Окно Результаты поиска

    Начиная с самой первой версии операционной системы Windows, для поиска файлов и папок использовалось специальное окно, открыть которое можно при помощи сочетания клавиш Windows+F. В этом отношении ничего не изменилось и в Windows Vista (рис. 5.1).

    Рис. 5.1. Окно Результаты поиска в режиме расширенного поиска


    Окно Результаты поиска состоит из четырех основных полей.

    0 Расположенное в верхнем правом углу поле Поиск, с помощью которого проще всего начать поиск файлов и папок. Для этого достаточно ввести в этом поле часть названия искомого файла и папки. Причем поиск начнется уже при вводе первой буквы искомой фразы.

    0 Показать только, с помощью которого можно ограничить результаты поиска файлами, имеющими тип, выбранный при помощи кнопок данного поля. По умолчанию выбрана кнопка Все, то есть поиск осуществляется среди файлов любого типа.

    0 Расширенный поиск, отображаемое при нажатии одноименной ссылки поля Показать только. С его помощью можно выполнять более сложный поиск, чем поиск с использованием поля Поиск, расположенного в верхнем правом углу окна.

    0 Самое большое поле окна – поле результатов выполняемого поиска.

    Поле Поиск. Итак, самый простой способ начать поиск – это ввести часть названия искомого файла или папки в поле Поиск. В этом случае поиск будет выполняться либо по всему компьютеру, либо только в индексированных местах.

    Выбор области поиска осуществляется на основе того, запущена ли служба, предназначенная для индексирования файлов. Так, если служба Поиск Windows отключена, то поиск будет выполнен по всему компьютеру. Если же она включена, то поиск будет выполнен только среди проиндексированного содержимого компьютера. По умолчанию служба Поиск Windows включена.

    Поле Показать только. Вы можете ограничить результаты поиска лишь файлами определенного типа. Для этого предназначены следующие кнопки поля Показать только, позволяющие искать среди:

    0 Везде – файлов любого типа;

    0 Эл. почта – писем электронной почты, то есть в файлах с расширениями EML, MSG, NWS, VCS;

    0 Документ – текстовых и других файлов документов; например, к ним относятся файлы с расширениями XML, XLS, XLL, WRI, WPD, WKS, TXT, TEXT, RTF, PPT и т. д.;

    0 Изображение – файлов изображений; например, к ним относятся файлы с расширениями 3DS, A11, AI, ANI, ART, AMF, BIN, B8, BMP, CDR, CMP, CPS, EMF, EPS, GIF, TIF, TIFF, JPEG, JPG и т. д.;

    0 Музыка – среди музыкальных файлов; например, к ним относятся файлы с расширениями AAC, AIF, AIFC, AU, CDA, DFS, DSS, M3U, MIDI, MID, MP3 и т. д.;

    0 Другое – других файлов; в этом случае поиск будет выполняться среди файлов с расширениями, не входящими ни в одну из предыдущих категорий, а также среди каталогов.

    Поле Расширенный поиск. Если при помощи предыдущих элементов окна Результаты поиска нельзя решить поставленную перед вами задачу, то следует открыть поле Расширенный поиск и воспользоваться теми средствами поиска, которые оно предоставляет.

    В этом случае нужно установить необходимые положения элементов данного поля, после чего ввести имя искомого объекта и нажать кнопку Найти. Следует учесть, что имя искомого объекта нужно вводить в поле Имя, а не в поле Поиск.

    Итак, в поле Расширенный поиск присутствуют следующие элементы.

    0 Папка – с помощью этого раскрывающегося списка можно конкретизировать расположение искомых данных. При этом вы можете как самостоятельно указать нужную папку (выбрав элемент Выбрать места для поиска), так и воспользоваться преопределенными элементами, например Везде, Индексированные места, Компьютер, Локальные диски.

    После того как вы выберете элемент Выбрать места для поиска данного раскрывающегося списка, перед вами отобразится окно Выбор мест для поиска. Оно позволяет выбрать как одну, так и несколько папок для поиска. В этом окне напротив каждой папки стоит флажок. Поиск будет вестись только в тех папках, для которых вы установили флажки.

    0 Дата – этот раскрывающийся список позволяет указать диапазон значений даты изменения или даты создания файлов, которые будет искать операционная система.

    0 Размер – раскрывающийся список позволяет определить размер искомого файла.

    0 Включая неиндексированные, скрытые и системные файлы – по умолчанию этот флажок снят, поэтому поиск среди системных и скрытых файлов вестись не будет. Чаще всего, в выполнении поиска скрытых и системных файлов нет никакой необходимости, так как пользовательские данные не имеют установленных атрибутов Скрытый или Системный. Как правило, такие атрибуты установлены только для некоторых файлов операционной системы Windows.

    0 Имя – в этом поле можно определить часть названия искомого файла. Чтобы начать поиск файла, необходимо обязательно заполнить либо это поле, либо поле Ключевые слова, либо поле Авторы.

    0 Ключевые слова – с помощью этого поля можно определить ключевые слова (теги), которые должны быть установлены для искомого файла. Ключевые слова можно добавить к музыкальным файлам, к файлам изображений, а также к некоторым типам документов (например, к файлам пакета Microsoft Office).

    Добавить к файлу ключевое слово очень просто. Для этого достаточно выбрать файл в Проводнике, после чего воспользоваться полем Ключевые слова строки состояния Проводника (рис. 5.2). Кроме того, ключевые слова можно добавить при помощи специальных программ. Например, при помощи стандартной программы операционной системы Фотоальбом Windows можно добавлять ключевые слова к файлам изображений.

    Рис. 5.2. Редактирование ключевых слов файла


    0 Авторы – в этом поле вы можете определить автора, файлы которого нужно найти.

    Поиск внутри файлов. До этого мы рассмотрели возможности по ведению самого простого типа поиска – поиска по части названия файла или папки. Однако, помимо этого типа, существует еще один, более сложный – поиск по фразе внутри документа.

    Такой тип поиска поддерживается и окном Результаты поиска. Однако, перед тем как им воспользоваться, следует выполнить небольшую настройку механизма поиска операционной системы.

    Основные настройки поиска операционной системы сосредоточены на вкладке Поиск окна Свойства папки (рис. 5.3). Чтобы открыть его, достаточно в окне Результаты поиска (либо в любом окне Проводника) нажать клавишу Alt и в появившейся строке меню выбрать команду Сервис > Свойства папки.

    Рис. 5.3. Основные настройки поиска


    Для нас сейчас представляет интерес лишь переключатель Что искать, расположенный в самом верху вкладки Поиск. Можно установить этот переключатель в следующие положения.

    0 Индексированные места: имена файлов и содержимое. Неиндексированные места: только имена файлов – по умолчанию переключатель установлен в это положение. Если вы точно знаете, что файл, в содержимом которого нужно выполнить поиск фразы, расположен в каталоге, проиндексированном операционной системой, то просто введите в поле Поиск часть нужной фразы.

    0 Всегда искать имена файлов и содержимое (медленно) – если же вы точно знаете, что содержимое документа, который вы пытаетесь найти, проиндексировано не было, то следует установить переключатель в это положение. В этом случае поиск внутри документа будет идти во всех файлах.

    0 Всегда искать только имена файлов – поиск будет всегда выполняться только по названию файла.

    Итак, чтобы выполнить поиск по фразе внутри документа, нужно установить переключатель в положение Всегда искать имена файлов и содержимое (для примера будем надеяться на худшее – на то, что нужный файл не проиндексирован), после чего ввести искомую фразу в поле Поиск, расположенное в правом верхнем углу окна Результаты поиска. Обратите внимание на это обстоятельство! Для поиска в содержимом файла нельзя пользоваться полем Имя – оно предназначено только для поиска по названию файла. Поэтому даже при выполнении расширенного поиска (например, при выборе даты или папки для поиска) искомую фразу нужно указать в поле Поиск. При этом поиск начнется сразу, как только вы укажете искомую фразу. Из этого вытекает еще одно правило – сначала нужно указывать расширенные параметры поиска, а уже в самом конце вводить искомую фразу в поле Поиск.

    Итак, вы воспользовались всеми предоставленными в книге рекомендациями, однако документ с нужной фразой так и не нашли, хотя точно знаете, что он где-то должен быть? Такое возможно только в одном случае: если искомый документ имеет расширение, для которого операционная система не поддерживает поиск внутри файла.

    Операционная система Windows Vista поддерживает поиск внутри файлов со следующими расширениями: ASM, BAT, C, CMD, CPP, DIC, H, INF, INI, JAVA, LOG, M3U, MDB, RC, REG, SQL, TXT, VBS, WRI и т. д.

    Если же нужный документ имеет какое-либо другое, нестандартное, расширение, то его поиск следует выполнять при помощи сторонних программ, которые мы рассмотрим далее в этой книге.

    Механизм индексирования. Я уже несколько раз упоминал этот странный термин, однако так ни разу и не объяснил его назначения. Пришла пора восстановить справедливость и рассказать о возможностях индексирования.

    Механизм индексирования – это дальнейшее развитие простых способов поиска, которое позволяет существенно снизить время поиска нужных файлов. Он работает довольно просто – на основе так называемого индекса. Индекс – это перечень слов и словосочетаний, которые встречаются внутри проиндексированных файлов. Рассмотрим пример, чтобы лучше понять это.

    Допустим, вы создали или откуда-то получили новый документ. Когда операционная система обратит на него внимание, она проверит его расширение. Если расширение документа входит в список тех, для которых включен механизм индексирования, то операционная система откроет документ и занесет все найденные в нем слова в свой индекс. В дальнейшем, если вы захотите выполнить поиск внутри документа и в настройках поиска установлен поиск в индексе, операционная система, вместо того чтобы искать в содержимом файла, выполнит поиск в индексе. Как показывает практика, это существенно сокращает время поиска, ведь Windows не нужно просматривать все содержимое файлов – ей достаточно обратиться к базе индекса с запросом по введенной фразе, после чего отобразить в результатах поиска те файлы, ссылки на которые были возвращены из базы индекса.

    Механизм индексирования работает на основе службы Поиск Windows. Эта служба сильно снижает производительность компьютера, поэтому администраторы часто отключают ее. Обратите на это внимание – если поиск в индексе не приводит ни к какому результату и завершается сразу же после своего начала, значит, скорее всего, служба Поиск Windows отключена.

    Механизм индексирования также необходимо настраивать. Его настройка позволит более точно указать те файлы, содержимое которых будет заноситься в индекс.

    Все основные настройки механизма индексирования сосредоточены в окне Параметры индексирования (рис. 5.4), которое вызывается при помощи одноименного значка Панели управления. Это окно состоит из трех интересных для нас элементов.

    0 Строка Проиндексировано элементов, с помощью которой можно узнать количество файлов, чье содержимое было занесено в индекс.

    0 Поле Индексировать следующие места и кнопка Изменить, с помощью которых можно определить каталоги, чье содержимое будет заноситься в индекс.

    После нажатия кнопки Изменить перед вами отобразится окно, подобное тому, которое используется при выборе каталогов для поиска в окне Результаты поиска. С его помощью можно выбрать несколько каталогов для индексирования, просто установив напротив них флажки.

    0 Кнопка Другие позволяет открыть дополнительное окно, с помощью которого можно настроить параметры работы механизма индексирования.

    Наибольший интерес для нас представляет вкладка Типы файлов, с помощью которой можно указать те расширения файлов, содержимое которых будет разрешено индексировать. При этом обратите внимание на переключатель под списком типов файлов. С его помощью можно определить, что именно будет заноситься в индекс: только метаданные файла либо метаданные и содержимое файлов.

    Рис. 5.4. Окно Параметры индексирования


    Сохранение параметров поиска. После того как вы выполнили расширенный поиск, можете сохранить параметры поиска в отдельном файле. Для этого нужно нажать кнопку Сохранить условия поиска, отображаемую после выполнения поиска в окне Результаты поиска. Это приведет к открытию окна для выбора места хранения результатов поиска. По умолчанию все результаты поиска сохраняются в папке %userprofile%\riOMCKM.

    Теперь вы всегда сможете быстро выполнить поиск с теми же параметрами. Для этого будет достаточно зайти в папку %userprofile%\Поиски, после чего открыть сохраненный ранее файл.

    Выполнить поиск в сохраненных ранее результатах поиска можно и при помощи окна Выбор мест для поиска, которое открывается после выбора элемента Выбрать места для поиска раскрывающегося списка Папка поля Расширенный поиск. В этом окне нужно перейти к значку Папки поиска и выбрать в нем сохраненный ранее поиск.

    Помимо сохраненных вами параметров поиска, в папке %userprofile%\Поиски также присутствует несколько стандартных файлов условий поиска: Мои файлы с общим доступом, Недавние документы, Недавние изображения и видео, Недавно измененные, Недавняя музыка, Недавняя электронная почта.


    Другие поля для поиска

    В операционной системе Windows Vista нет особой необходимости в использовании именно окна Результаты поиска. Теперь его возможности встроены в окно Проводника операционной системы. Без сомнения, вы уже обратили внимание на поле Поиск, которое расположено в правом верхнем углу любого окна Проводника.

    С его помощью можно выполнить быстрый поиск по части названия или содержимому файлов, хранящихся в открытой в данный момент папке и ее подпапках (по умолчанию поиск в подпапках выполняется, однако, если снять флажок Включать подпапки при вводе текста в поле поиска, расположенный на вкладке Поиск окна Свойства папки, поиск внутри вложенных папок вестись не будет).

    Даже тогда, когда вы хотите выполнить поиск с расширенными параметрами, нет необходимости запускать окно Результаты поиска. Достаточно начать поиск по любому слову при помощи поля Поиск окна Проводника. При этом на панели кнопок окна Проводника отобразится дополнительный раскрывающийся список Средства поиска. Выберите в нем элемент Панель поиска, и в окне Проводника отобразится панель Показать только, с помощью которой можно открыть и панель расширенных параметров поиска.

    Выполнить поиск можно и при помощи меню Пуск. В операционной системе Windows Vista в меню Пуск впервые добавлено поле для поиска. С его помощью можно выполнить поиск среди содержимого меню Пуск, а также среди Избранного, сетевых подключений и файлов папки пользователя.

    Вы самостоятельно можете настроить места для поиска при помощи поля меню Пуск. Для этого нужно открыть окно Свойства панели задач и меню «Пуск» (например, при помощи команды Свойства контекстного меню Панели задач), перейти на вкладку Меню «Пуск» и нажать кнопку Настроить напротив положения переключателя Меню «Пуск». После этого откроется окно Настройка меню «Пуск», в котором нужно воспользоваться следующими настройками.

    0 Искать в переписке – дает возможность определить, будет ли выполняться поиск среди ваших электронных писем.

    0 Поиск в избранном и журнале обзора – позволяет указать, будет ли выполняться поиск в Избранном и журнале обзора браузера Internet Explorer.

    0 Поиск программ – дает возможность определить, будет выполняться поиск программ (ярлыков на них) либо только файлов пользователя.

    0 Поиск файлов – позволяет указать, где именно будет выполняться поиск файлов: либо среди файлов пользователя (папка %userprofile%), либо во всем индексе, либо поиск файлов вообще не будет выполняться.


    Программы командной строки для поиска

    Помимо графических окон, операционная система Windows Vista содержит в своей поставке и набор специальных программ командной строки для поиска. Использование данных программ может пригодиться не только при работе в командной строке либо создании ярлыков или сценариев. Знание программ поиска командной строки может также расширить поиск, ведь они поддерживают несколько уникальных возможностей, которые недоступны при помощи графических окон операционной системы.

    Программа where. С помощью данной программы можно выполнить поиск по части имени файла. Это можно сделать двумя командами: where [параметры] «ката-лог»: «шаблон поиска» или where [параметры] /R «каталог»: «шаблон поиска». В первом случае поиск выполняется только внутри указанного каталога (через точку с запятой можно указать несколько каталогов для поиска). Во втором же случае поиск выполняется как внутри указанного каталога, так и внутри вложенных в него каталогов (через пробел можно указать несколько шаблонов для поиска).

    От параметров данной программы зависит то, что именно она будет возвращать.

    Программа find.exe. С помощью данной программы можно выполнить простой поиск в содержимом файла (при этом нельзя выполнять рекурсивный поиск). Это делается так же просто, как и с помощью предыдущей программы: find [параметры] «шаблон искомой строки» «путь к каталогу и шаблон файла».

    От параметров данной программы зависит то, что именно она будет возвращать.

    Программа find.exe обладает одной очень важной для нас особенностью: с ее помощью можно искать в файлах с любым расширением. Другими словами, вместо того, чтобы изменять реестр (чтобы включить возможность поиска в содержимом файлов определенного расширения при помощи окна Результаты поиска), можно просто воспользоваться поиском при помощи данной программы.

    В качестве примера рассмотрим одну сложную команду: find «canoni» c: \windows\ system32\*.* > c:\1.txt. Она позволяет выполнить поиск строки canoni во всех файлах каталога c: \windows\system32. При этом результат работы команды find заносится в файл 1.txt, расположенный на диске C: \.

    Программа findstr.exe. Эта программа является самой функциональной из всех программ операционной системы Windows Vista, предназначенных для поиска. Ее синтаксис совпадает с синтаксисом программы find.exe: findstr.exe <параметры> «шаблон искомой строки» «путь к каталогу и шаблон файла». Однако findstr.exe поддерживает следующие дополнительные возможности:

    0 большее количество параметров;

    0 возможность указания сразу нескольких шаблонов (через пробел);

    0 возможность выполнения рекурсивного поиска при помощи параметра /S.

    Сторонние программы

    Механизмы и возможности поиска в операционной системе Windows Vista реализованы очень хорошо, но не идеально. То, что возможность поиска в содержимом файлов при помощи окна Результаты поиска ограничена лишь определенными расширениями файлов, уже намекает на необходимость более функциональной замены стандартного окна поиска.


    Avsearch 3.13

    Сайт: http://www.avtlab.ru/avsearch.htm.

    Статус: Freeware.

    Размер: 821 Кбайт.

    Язык: русский.

    Если говорить только о поиске в содержимом файлов, то заменой стандартного окна поиска может стать полностью бесплатная и не требующая установки программа Avsearch. Она предназначена только для поиска в содержимом файлов и обладает следующими достоинствами.

    0 Позволяет искать в файлах, созданных в любой из следующих кодировок: Windows, OEM 866 (DOS), KOI-8R, ISO 8859-5, Unicode. По умолчанию поиск ведется в кодировке Unicode.

    0 Дает возможность искать файлы более чем в 20 видах архивов.

    0 Позволяет просматривать найденные файлы не только в текстовом виде, но и в виде HEX-таблицы.

    0 Дает возможность сохранять список найденных файлов и в будущем загружать его в программу.

    После скачивания и распаковывания архива программы вы должны обнаружить два исполняемых файла: AVSearch.exe и FileSearch.exe.

    Файл FileSearch.exe представляет собой окно для поиска файлов внутри архивов. Поиск выполняется только по части названия файла. Использовать это окно очень просто, поэтому не будем его рассматривать.

    Файл AVSearch.exe представляет собой основной исполняемый файл программы. После его запуска перед вами отобразится окно программы, изображенное на рис. 5.5.

    Рис. 5.5. Основное окно программы


    Поиск при помощи данной программы состоит из трех этапов.

    1. Указываете фразу, которую нужно найти в файлах. Это можно сделать при помощи поля, расположенного между значком дерева каталогов и значком поиска. На рис. 5.5 в данном поле введено значение a + b,c,d.

    2. После этого выбираете каталоги для поиска. Это делается довольно необычным способом. Сначала нужно открыть окно Выбор папок для поиска (при помощи команды Файл > Выбор папок, сочетания клавиш Ctrl+D либо значка дерева каталогов). Затем в правой панели отобразившегося окна выберите нужную папку из дерева, после чего методом Drag & Drop перенесите ее в поле на вкладке Выбранные папки (рис. 5.6).

    Рис. 5.6. Выбор папок для поиска


    3. Нажмите кнопку поиска либо воспользуйтесь сочетанием клавиш Ctrl+F. Это приведет к началу поиска.

    После выполнения поиска список файлов, в содержимом которых была найдена нужная фраза, будет отображен в правой области программы. В левой же области будет отображаться содержимое найденных файлов. При этом та фраза, которую вы ищете, будет автоматически выделяться (рис. 5.7).

    Рис. 5.7. Результаты выполненного поиска


    Огромным достоинством программы является то, что она автоматически определяет тип файла, в котором выполняется поиск.

    Например, как можно видеть из рис. 5.7, исполняемые файлы считаются обычными текстовыми файлами. Поэтому их содержимое отображается в левой области программы в виде текста. Если из результатов поиска выбрать какой-либо файл с расширением HTM, то программа обработает его как HTML-файл и вместо его содержимого (форматирования) отобразит в левой области сам HTML-файл (без рисунков и анимации, просто текстовые блоки).

    Программа может обрабатывать следующие типы файлов: текстовые файлы, HTML-файлы, файлы электронной почты, новостей, RTF-файлы. При этом, если вы обнаружите, что программа отображает содержимое какого-либо файла в неправильном формате, то вручную можете указать ей тот тип файла, в соответствии с которым она должна выполнять обработку. Это делается при помощи переключателя меню Вид.

    Если же вы хотите просмотреть содержимое найденного файла в виде HEX-таблицы, то воспользуйтесь командой меню Вид > Вид Hex.

    Следует также обратить внимание на следующие команды меню Параметры.

    0 С учетом регистра – позволяет определить, будет ли учитываться регистр при поиске введенной фразы внутри файлов. По умолчанию регистр не учитывается.

    0 Проверять файлы RTF – дает возможность указать, будет ли вестись поиск внутри RTF-файлов. По умолчанию поиск не ведется.

    0 Проверять файлы в архивах – позволяет задать, будет ли выполняться поиск введенной фразы внутри файлов, расположенных в архивах. По умолчанию данная возможность включена. При этом архивами программа считает файлы со следующими расширениями: ZIP, RAR, ARJ, PAK, ZOO, LHA, LZH, ARC, TAR, GZ, Z, BH, EXE.

    И последнее, о чем следует упомянуть, – это три команды контекстного меню правой области окна программы (помимо них, в контекстном меню правой области окна программы присутствуют и другие команды).

    0 Копировать все файлы в – позволяет скопировать все найденные файлы в другую папку.

    0 Сохранить список – сохраняет список всех найденных файлов.

    0 Загрузить список – загружает список всех найденных файлов, сохраненных ранее при помощи команды Сохранить список. При этом загружается не только список найденных файлов, но и фраза, по которой вы искали. Иными словами, после загрузки списка найденных файлов с ним можно будет работать точно так же, как будто вы их только что нашли (например, при отображении содержимого конкретного файла в левой области программы также будут выделяться все фразы, по которым данный файл был найден).


    Effective File Search

    Сайт: http://www.sowsoft.com/search-ru.htm.

    Статус: Shareware, без регистрации работает до 30 дней.

    Размер: 964 Кбайт.

    Язык: русский, украинский, английский и многие другие.

    С помощью данной программы можно искать как по части названия файла, так и по содержанию файла. При этом программа обладает следующими достоинствами.

    0 Поиск в содержимом файла при помощи регулярных выражений.

    0 Определение папок, в которых поиск файлов никогда не будет производиться. Это делается при помощи команды Администрирование меню Опции.

    0 Создание сценариев, управляющих работой программы.

    0 Поиск в результатах предыдущего поиска.

    Основное окно программы представлено на рис. 5.8. Как можно заметить, окно состоит из трех вкладок: Главная, Дата и размер и С текстом.

    На вкладке Главная расположены все настройки для поиска по части названия файла или папки. При помощи поля Папка этой вкладки можно определить основную папку для поиска файлов. Благодаря полю Папки можно определить дополнительные папки для поиска файлов (рис. 5.8). Кроме того, на этой вкладке присутствует раскрывающийся список Искать в, при помощи которого можно выбрать область текущего поиска. Так, в этом списке присутствуют следующие элементы:

    0 Папка – искать файлы только в папке, указанной в поле Папка;

    0 Папки – искать файлы только в папках, указанных в поле Папки;

    Рис. 5.8. Окно программы Effective File Search


    0 Папка + Папки – искать файлы в папках, указанных как в поле Папка, так и в поле Папки;

    0 Результаты – поиск файла среди результатов предыдущего запроса.

    При помощи вкладки Дата и размер можно определить размер искомого файла (можно указывать диапазоны вида «от размера до размера»), а также дату создания, изменения или последнего доступа (можно указывать диапазоны вида «от даты до даты»).

    С помощью вкладки С текстом можно определить фразу (либо несколько фраз, объединенных операторами И, Или или Исключающее или), которую программа будет искать внутри файлов. Причем вы можете указывать как текстовую фразу, так и HEX-код строки.


    Google Desktop

    Сайт: http://desktop.google.com/ru/index.html.

    Статус: Freeware.

    Размер: 1,7 Мбайт.

    Язык: русский.

    Программа уникальна уже потому, что создана всемирно известной компанией Google, специализирующейся на поиске в Интернете. Поэтому было бы странно, если бы с ее помощью можно было выполнять поиск только на локальном компьютере. Естественно, используя эту программы, можно выполнять поиск и в Интернете, однако эту ее возможность мы рассмотрим чуть позже.

    Приведу основные достоинства программы:

    0 быстрый вызов строки поиска при помощи двойного нажатия клавиши Ctrl;

    0 поиск среди индекса, созданного службой Поиск Windows операционной системы Windows Vista;

    0 бесплатная боковая панель с набором мини-приложений (еще называемых гаджетами);

    0 возможность просмотра результатов поиска в стиле поисковой системы Google (то есть, помимо самого найденного файла, отображается его часть, где была встречена фраза, по которой выполнялся поиск);

    0 сортировка результатов поиска по релевантности (соответствие содержимого документа искомой фразе).

    После установки программы перед вами отобразится окно с ее основными настройками. С его помощью можно изменить следующие параметры: определить, будет ли производиться поиск при помощи дополнительных сервисов Google (Gmail, истории веб-поиска, а также по удаленным файлам), а также указать, будет ли разрешено использование боковой панели Google. Впоследствии вы сможете переопределить эти настройки, поэтому серьезно задумываться над их установкой не стоит.

    Локальный поиск. Сразу же после установки программы Google Desktop можно начинать использование ее возможностей поиска. Проще всего сделать это при помощи двойного нажатия клавиши Ctrl. После этого откроется окно, представленное на рис. 5.9 (на рисунке приведено окно с уже начатым поиском по фразе te).

    Рис. 5.9. Окно быстрого поиска


    Как только вы начнете вводить в этом окне искомую фразу, программа станет отображать содержимое индекса (стандартного индекса операционной системы Windows Vista), удовлетворяющего вводимой фразе. Рассмотрим элементы списка результатов поиска.

    0 В самом верху списка результатов поиска находится команда Поиск в Интернете, при помощи которой можно начать поиск введенной фразы в Интернете с помощью поисковой системы Google.

    После выбора этой команды (достаточно просто нажать клавишу Enter, так как команда активна по умолчанию) будет запущен ваш браузер и отобразятся результаты поиска в Интернете с помощью Google.

    0 Далее идет команда Поиск на Desktop. После ее выбора также будет запущен ваш браузер и отобразится список результатов поиска (рис. 5.10). Но не стоит переживать – в этом случае поиск был выполнен не в Интернете, а на вашем локальном компьютере при помощи локальной поисковой системы, которая была установлена при установке программы Google Desktop. Заметить это можно по строке адреса браузера: адрес начинается на http://localhost:4664.

    Рис. 5.10. Пример работы локальной поисковой системы Google


    0 Далее идет список результатов выполненного поиска, всегда содержащий не более шести элементов.

    Чтобы открыть найденный файл, просто щелкните на нем кнопкой мыши. Можно также открыть папку, в которой находится найденный файл. Для этого достаточно открыть контекстное меню найденного элемента и выбрать команду Открыть папку.

    0 Если результатов поиска по введенной фразе более шести, то в самом низу списка результатов будет присутствовать ссылка, начинающаяся с Просмотреть все результаты поиска. Ее выбор приведет к тому же, что и выбор команды Поиск на Desktop.

    Помимо окна поиска, вызываемого двойным нажатием клавиши Ctrl, программа Google Desktop поддерживает еще два способа поиска.

    0 Поиск локальных файлов при помощи окна браузера и установленной локальной поисковой машины (рис. 5.11, вверху). Использование данного метода подобно применению поисковой системы Google при поиске в Интернете. Например, откройте контекстное меню значка программы Google Desktop, расположенного в области уведомления, после чего выберите команду Поиск на Desktop.

    0 Маленькая панель поиска, которая может отображаться либо слева от значка программы Google Desktop в области уведомлений, либо в любом месте Рабочего стола пользователя (рис. 5.11, снизу). Чтобы отобразить панель поиска в первом месте, нужно выбрать команду Панель поиска из контекстного меню значка программы Google Desktop, расположенного в области уведомления. Если же вы хотите воспользоваться вторым видом панели поиска, то воспользуйтесь командой Свободная панель поиска все того же контекстного меню значка программы Google Desktop.

    Рис. 5.11. Два дополнительных варианта поиска


    Боковая панель. Помимо возможностей поиска, в поставку программы Google Desktop входит боковая панель, на которой могут располагаться специальные маленькие программы, называемые мини-приложениями. Она аналогична стандартной боковой панели Windows Vista.

    В поставку программы Google Desktop входят следующие мини-приложения: Веб-подборки, Акции, Новости, Дни рождения участников Orkut, Блокнот, Электронная почта, Быстрый просмотр, Фотографии, Карты, Задачи, Системный монитор.

    Мы не будем рассматривать возможности боковой панели Google Desktop, так как это никак не относится к теме книги. Однако стоит сказать, что по умолчанию боковая панель отображается. Если же вы хотите ее скрыть, то просто выберите команду Нет из контекстного меню значка программы Google Desktop, расположенного в области уведомления. Можно также воспользоваться командами Панель поиска или Свободная панель поиска. Дело в том, что в один момент времени на экране может отображаться либо боковая панель, либо панели для поиска.

    Настройки программы. Перед использованием данной программы желательно настроить некоторые параметры ее работы. Это делается при помощи команды Настройки контекстного меню значка программы Google Desktop, расположенного в области уведомления.

    После того как вы выберете эту команду, откроется окно браузера, в котором будет загружена форма для изменения настроек программы. Рассмотрим самые важные из них.

    0 Использование расширенного индекса. При этом выполняется резервное копирование документов. Тем самым достигается возможность просмотра предыдущих версий документов. Кроме того, при включении расширенного индекса будут создаваться мини-копии картинок, видеофайлов и просмотренных вебстраниц.

    0 Выбор индексируемых данных. Например, вы можете определить, будут ли добавляться в индекс такие данные, как письма электронной почты и сообщения чата, история веб-поиска, мультимедийные файлы, текстовые файлы, файлы из пакета Microsoft Office, контакты, календари, задачи, примечания, дневники и архивные файлы.

    Если возможности индексирования приведенных типов данных вам мало, то воспользуйтесь ссылкой страницу загрузки подключаемых модулей, чтобы загрузить модули для индексирования других типов данных. Эта ссылка располагается под набором флажков для выбора типов индексируемых данных.

    0 Выбор разделов диска и отдельных каталогов, содержимое которых не будет либо, наоборот, будет индексироваться (по умолчанию выполняется индексирование содержимого всех локальных дисков).

    0 Отключение действия двойного нажатия клавиши Ctrl.

    0 Выбор максимального количества результатов, отображаемых при поиске в окне быстрого поиска (то есть в окне, открываемом после двойного нажатия клавиши Ctrl).

    Поиск в почтовых клиентах. Если вы установили программу Google Desktop до того, как прочитали о почтовом клиенте Microsoft Outlook, то, должно быть, заметили, что после установки программы к основному окну почтового клиента Microsoft Outlook была добавлена новая панель – панель Google Desktop для быстрого поиска в содержимом писем. Такая же панель добавляется и к другим популярным почтовым клиентам (кроме Почты Windows).


    «Персональный поиск Яндекса»

    Сайт: http://desktop.yandex.ru/.

    Статус: Freeware.

    Размер: 4,4 Мбайт.

    Язык: русский.

    Это последняя программа локального поиска при помощи индексирования файлов, которую мы рассмотрим. Она создана еще одной компанией, специализирующейся на поиске в Интернете, – «Яндекс». Программа по праву считается одной из лучших, предоставляющих возможности морфологического поиска в содержимом документов на русском и английском языках. По сути своей работы она напоминает программу Google Desktop, хотя и имеет более аскетичный интерфейс. Например, программа «Персональный поиск Яндекса» имеет только одну форму поиска – при помощи страницы браузера http://127.0.0.1:9375/.

    Обратите внимание на кнопку Настроить, отображаемую на последнем шаге мастера установки программы «Персональный поиск Яндекса». С ее помощью можно непосредственно до первого запуска программы изменить ее настройки. Для этого предназначено окно Персональный поиск Яндекса, состоящее из следующих вкладок.

    0 Где искать – позволяет определить папки, почтовые клиенты и кэши браузеров, содержимое которых будет индексироваться для осуществления поиска.

    Индексация содержимого компьютера запускается автоматически, если в течение 30 секунд не происходит обращений к клавиатуре или мыши (при выполнении индексации значок программы, расположенный в области уведомлений, начинает переливаться). Почтовая база Outlook и Thunderbird индексируется только в то время, когда запущен почтовый клиент. База Outlook Express и TheBat! индексируется вне зависимости от состояния клиента. На данный момент индексация вложений любых типов поддерживается лишь в Outlook, Thunderbird и TheBat!. Индексация кэшей Internet Explorer и Opera происходит всегда, в независимости от того, запущен браузер или нет. Индексация кэша Firefox происходит только в том случае, если он запущен.

    0 Типы файлов – программа может искать в содержимом следующих типов файлов: PDF, EML, MHT, HTML, TXT, ASC, RTF, RAR, ZIP, CHM, SWF, файлы OpenOffice, DjVu, Word, Excel, PowerPoint.

    0 Прочие настройки – позволяет выбрать сочетание клавиш для отображения окна поиска, количество результатов поиска, отображаемых на одной странице, расположение индекса программы и т. д.

    Как и рассмотренная ранее программа от Google, «Персональный поиск Яндекса» после установки и запуска добавляет свой значок в область уведомления. С помощью данного значка и выполняется работа с программой. Так, чтобы отобразить поле для поиска, нужно дважды щелкнуть кнопкой мыши на значке. Кроме того, отобразить форму поиска можно, нажав сочетание клавиш Windows+Z (рис. 5.12).

    По умолчанию программа отображает все результаты поиска, однако воспользовавшись ссылками Документы, Музыка, Письма, Кеш и Файлы, вы можете отфильтровать результаты выполненного поиска.

    Рис. 5.12. Страница поиска программы «Персональный поиск Яндекса»


    Результаты поиска по введенному запросу группируются на нескольких вкладках. Так, файлы с расширениями DOC, DOCX, XLS, XLSX, PPT, SXW, SXC, SWF, PDF, RTF, HTML TXT, MHT, CHM, EML, DjVu, ZIP, RAR и TAR отображаются на вкладке Документы; MP3 и OGG – на вкладке Музыка; письма из почтовых баз Outlook, Outlook Express, Thunderbird и TheBat! – на вкладке Письма; а все страницы из кэшей браузеров Internet Explorer, Firefox и Opera – на вкладке Кеш.

    Программа «Персональный поиск Яндекса» поддерживает поиск с учетом всех команд, которые поддерживает и поисковая система «Яндекс» (эти команды мы рассмотрим в разд. 5.3). Кроме того, она поддерживает команду subject=(TeKCT), с помощью которой можно выполнять поиск в теме письма.

    5.2. Поиск в сети

    Для тех, кто досконально изучил возможности поиска на локальном компьютере, не составит труда выполнить поиск и на всех компьютерах сети. Однако для этого, скорее всего, придется воспользоваться сторонними программами, так как возможности операционной системы Windows в сфере поиска в локальной сети ограничены.


    Возможности Windows Vista

    В операционной системе Windows Vista поиск в локальной сети практически ничем не отличается от поиска на локальном компьютере. Для этого также применяется окно Результаты поиска. Единственное отличие состоит в том, что при поиске в локальной сети вы должны указать не папку локального компьютера, а общий ресурс сетевого компьютера.

    Это делается при помощи окна Выбор мест для поиска, которое открывается после выбора элемента Выбрать места для поиска раскрывающегося списка Папка поля Расширенный поиск. В этом окне нужно перейти к значку Сеть и выбрать в нем общие ресурсы компьютеров, на которых нужно выполнить поиск.


    Сторонние программы

    Существует два способа поиска в локальной сети: только по именам файлов и папок в общих каталогах либо в индексе, создаваемом сервером поисковой машины из содержимого всех файлов, доступных в сети.


    LanSeeker

    Примером программ первого типа может быть LanSeeker (рис. 5.13). Она бесплатна и «весит» всего около 100 Кбайт. Ее основные возможности вы можете увидеть из рисунка, поэтому что-то еще рассказывать не имеет смысла.

    Рис. 5.13. Основное окно программы LanSeeker


    Archivarius 3000

    Эта программа относится ко второму типу.

    Сайт: http://www.wizetech.com/ru/document-search/.

    Статус: Shareware, 30 дней и 17 запусков, стоимость 900 рублей.

    Размер: 3,43 Мбайт.

    Язык: русский.

    Одной из программ с серверным режимом для поиска в индексе является Archivarius 3000. Рассмотрим основные возможности данной программы.

    0 Средняя скорость индексирования составляет 1 Гбайт/час.

    0 Объем создаваемого индекса примерно равен 25 % от всех проиндексированных данных.

    0 Поддерживает индексирование следующих форматов файлов: TXT, LEX, ASC, WRI, DOC, DOT, XLS, PPT, PM4, PM5, PM6, P65, PMD, SAM, WPS, WPD, RTF, PDF, W&D, HTM, HLP, STD, CHI, EML, MSG, MBX, DBX, TBB, MHT, ACE, ARC, ARJ, BH, CAB, GZ, JAR, LHA, RAR, TAR, ZIP, ZOO, а также письма всех версий Outlook, Outlook Express, The Bat!.

    0 Поддерживает поиск в таких кодировках, как DOS (850, 852, 866), WIN (1250, 1251, 1252), Unicode, UTF-8, KOI-8, ISO (8859-1, 8859-2, 8859-5), MAC, IBM-1125 (RUSCII).

    0 Позволяет вести поиск с учетом морфологии для таких языков, как английский, русский, немецкий, французский, украинский, белорусский.

    После того как вы установите и запустите программу, перед вами отобразится мастер создания области индексирования. Дело в том, что программа Archivarius 3000 может искать только в индексе, то есть без него она работать не может, а значит, должна быть создана хотя бы одна область индекса.

    Мастер создания нового индекса состоит из восьми шагов, в процессе которых вы определите как расположение индексируемых файлов (каталог или почтовые программы), так и расширения, файлы которых должны входить в индекс. Кроме того, нужно еще выбрать языки, на которых будут встречаться документы в индексе, чтобы программа смогла правильно использовать словарь морфологии.

    На первом шаге мастера перед вами будет стоять нелегкий выбор – нужно выбрать элементы, которые попадут в индекс. Проще всего не думать над переключателями этого шага, а просто нажать Далее. В результате вы перейдете ко второму шагу мастера, на котором намного проще выбрать индексируемые места (рис. 5.14).

    Следует заметить, что намного удобнее создать несколько индексов. В дальнейшем это позволит вам более гибко управлять полученными индексами: удалять их, перестраивать, редактировать настройки.

    После того как вы создадите первый индекс, перед вами отобразится главное окно программы (рис. 5.15). В нем расположены четыре вкладки: Поиск, Индекс, Сервер и Помощь. Возможно, вы уже заметили несоответствие – на изображении главного окна программы видна пятая вкладка Другое. На самом деле это не вкладка, а меню, при помощи которого можно изменить настройки программы, используемый язык и т. д.

    Рис. 5.14. Второй шаг мастера создания области индексирования

    Рис. 5.15. Главное окно программы


    Работа с индексом. Раз уж мы находимся на вкладке Индекс, начнем рассматривать программу именно с нее. С помощью данной вкладки можно управлять созданными областями индексирования: удалять их, перестраивать индекс заново (если индексированная область сильно изменилась, например вы увлеклись детективными рассказами и поместили в индексированную область кучу таких рассказов, перед этим удалив из нее всю фантастику, которой увлекались ранее), а также изменять настройки области. Кроме того, при помощи кнопки Создать можно создавать новые области индексирования.

    Как вы уже догадались, мы только что рассмотрели все кнопки на вкладке Индекс. Однако не стоит забывать, что, помимо них, в программах для операционной системы Windows часто используется и контекстное меню. Не забыли о нем и разработчики этой программы. С помощью контекстного меню определенного индекса можно выполнить следующие действия (помимо уже рассмотренных).

    0 Переименовать – переименовывает выбранную область индексирования.

    0 Сжать – дефрагментирует и сжимает содержимое индекса.

    0 Очистить – очищает индекс.

    0 Статистика – выводит подробные сведения о данном индексе и его содержимом. Так, с помощью окна Статистика индекса, отображаемого при выборе этого пункта контекстного меню, можно узнать о количестве файлов определенного расширения, языках содержимого файлов, кодировках, энтропии, частотном распределении слов и т. д.

    0 Лексикон – открывает окно Лексикон индекса, с помощью которого можно выполнить поиск внутри выбранного индекса и узнать количество слов, которые соответствуют тому или иному запросу. Кроме того, можно узнать длину этих слов, частоту их обнаружения и количество документов, в которых они встречаются.

    Но и это еще не все. Обратите внимание на нижнюю область данной вкладки программы. С ее помощью можно создать назначенное задание, используя которое программа будет периодически переиндексировать содержимое выбранного индекса. Это очень просто сделать – с помощью окна Планировщик обновления индекса, отобразить которое можно при помощи команды Добавить.

    Локальный поиск. Перейдем к вкладке Поиск. С ее помощью можно выполнить поиск в индексах локального компьютера. Для этого достаточно либо просто воспользоваться полем Введите запрос, либо также нажать кнопку Атрибуты поиска и настроить дополнительные параметры поиска в отобразившейся области (рис. 5.16).

    Кроме того, для выполнения поиска можно воспользоваться окном Мастер поиска, которое открывается после нажатия кнопки с изображением следа от лапы. Окно Мастер поиска состоит из четырех вкладок. С их помощью вы сможете легко выбрать дату искомого документа, его размер, тип, а также слова, которые должны находиться в документе, и слова, которых там не должно быть.

    Еще один способ локального поиска – использование окна Прямой поиск, открыть которое можно при помощи кнопки с изображением лупы. Это окно позволяет изменить состояние следующих флажков:

    0 Учитывать регистр;

    0 Учитывать пробелы (а также CR, LF и TAB);

    0 Разрешить пустые пробелы;

    0 Разрешить использование масок;

    Рис. 5.16. Дополнительные параметры поиска


    0 Вычислять вес каждого документа;

    0 Использовать атрибуты поиска;

    0 Закрыть окно после успешного поиска.

    Язык поиска. По умолчанию программа выполняет поиск с учетом морфологии. Если же вы хотите выполнить строгий поиск только по определенному слову или фразе, то просто возьмите поисковую фразу в двойные кавычки. Можно также взять поисковую фразу в квадратные скобки ([]). В этом случае также будет вестись строгий поиск, но при этом программа будет искать все документы, в содержимом которых встречаются слова поискового запроса, расположенные в любом порядке на расстоянии не более чем десяти слов друг от друга.

    Помимо обычного поиска, программа Archivarius 3000 поддерживает поиск с использованием логических операторов, а также знаков подстановки ? и *. Как вы, наверное, уже знаете, знак * заменяет любое количество символов в слове, а знак ? – один следующий символ. Например, поиск по слову к?мпания найдет все документы, в которых встречаются слова компания, кампания и еще более экзотические варианты этого слова.

    Из логических операторов программа поддерживает следующие.

    0 | – между двумя словами (или двумя фразами, взятыми в круглые скобки) установлена зависимость «Логическое ИЛИ». Другими словами, будет выполнен поиск всех документов, в которых встречается либо слово, расположенное до этого оператора, либо слово, расположенное после него.

    0 + – также ставится между двумя словами. Он говорит о том, что в документах обязательно должны встречаться сразу оба указанных слова.

    0 – ставится перед словом и говорит о том, что соответствующего слова в документах быть не должно.

    Серверная часть программы. Теперь, наконец-то, перейдем к рассмотрению сетевого поиска. Прежде всего, вспомним, как же он работает. Итак, поиск в локальной сети на основе индекса выполняется следующим образом.

    1. Сначала создаются сами индексы. Для этого придется создать несколько областей индексирования, например одну область для поиска на локальном компьютере (на сервере), а остальные – для поиска на общих ресурсах компьютеров сети.

    2. Потом на компьютере, где были созданы области индексирования, запускается сервер.

    3. После этого любой компьютер сети может обратиться на определенный адрес и выполнить поиск слов при помощи созданных индексов.

    Индексы мы создали, как же теперь запустить сервер? Для этого достаточно воспользоваться вкладкой Сервер программы. Проще всего нажать кнопку Запустить, расположенную на этой вкладке. В результате в поле Ссылка на поисковую страницу сервера отобразится адрес, который необходимо использовать на других компьютерах для доступа к запущенному серверу. Вы можете нажать кнопку Перейти, чтобы открыть поисковое окно сервера на локальном компьютере.

    Кроме того, запустить сервер можно и без запуска самой программы Archivarius 3000. Для этого достаточно воспользоваться параметром – server файла программы Archivarius3000.exe либо просто найти в каталоге, в который была установлена программа, файл StartServer.bat. После запуска этого файла перед вами отобразится окно программы Archivarius 3000 в серверном режиме (рис. 5.17).

    Рис. 5.17. Серверный режим работы программы Archivarius 3000


    После того как вы запустили сервер, любой пользователь сможет выполнить поиск на основе индекса сервера. Для этого ему будет достаточно ввести в окне браузера адрес, который отображался в поле Ссылка на поисковую страницу сервера окна программы Archivarius 3000.

    Например, если еще раз посмотреть на рис. 5.17, то можно заметить, что для подключения к серверу в моей сети нужно использовать адрес http://10.0.0.2:80/. После подключения к данному адресу откроется страница браузера, представленная на рис. 5.18.

    Рис. 5.18. Страница для локального поиска в индексе сервера

    5.3. Поиск в Интернете

    Поиск информации в Интернете считается наиболее сложным типом поиска. Особенно сильно это чувствуется, если нужно найти что-то конкретное. Причина сложности заключается даже не в том, что в Интернете существуют миллиарды страниц, а вам нужно найти лишь одну из них, самую полезную. Причина сложности заключается в релевантности страниц.

    Каждый веб-мастер хочет, чтобы его страница была самой посещаемой на просторах Интернета. Как правило, для реализации этой мечты необходимо только одно – чтобы на как можно большее количество запросов поисковые системы выдавали в первой десятке результатов адрес этой страницы. А как это можно сделать?

    Создатели поисковых систем решили, что это можно сделать только постоянным трудом и как можно более качественным материалом на странице.

    Однако это очень сложный и долгий путь, который не подходит для большинства веб-мастеров. Вместо этого они идут другим путем – пытаются создать такую страницу, которая бы удовлетворяла всем условиям поисковой системы и в результате появилась в первой десятке результатов. Для этого они вставляют в страницу как можно больше ключевых слов и пользуются другими методами, обманывающими поисковые системы.

    В итоге получается такая ситуация, когда в результатах поисках находится множество вроде бы очень интересных и нужных страниц, а при открытии этих страниц выясняется, что там практически нет никакой нужной информации, кроме двух-трех известных всем предложений. Причем, как правило, эти предложения на всех страницах одинаковые. Иначе говоря, веб-мастер ничего не предпринимал, чтобы написать нужную вам статью, а просто взял все с какой-то другой страницы.

    В общем, процесс поиска в Интернете – дело неоднозначное, положительный результат которого не гарантирован, и вам нужно сразу же готовиться к тому, что полной удовлетворенности от найденной в результате информации не будет.

    Поисковые системы. Для поиска в Интернете предназначены специальные сайты, называемые поисковыми системами. Таких систем существует огромное множество. Все они делятся на два типа: поисковые системы для общего поиска и специализированные поисковые системы. Поисковые системы для общего поиска хранят сведения обо всех страницах Интернета, независимо от их содержания или назначения. Специализированные же поисковые системы собирают сведения лишь о тех сайтах и страницах, которые посвящены отдельному направлению развития человечества либо отдельному продукту. Например, существуют специализированные поисковые системы, которые содержат ссылки на описания различных медицинских препаратов.

    Работа всех поисковых систем основана на так называемых поисковых роботах. Поисковым роботом называется сценарий, который индексирует содержимое страниц Интернета. Делается это очень просто: как только поисковый робот загружает какую-либо страницу, он по каким-то определенным правилам, которые знают лишь создатели конкретной поисковой системы, индексирует ее содержимое, выставляя ему уровни релевантности при поиске с помощью различных запросов. После того как он проиндексирует содержимое страницы, он ищет ссылки, которые есть на этой странице, и переходит по ним на другие страницы (предпочтение отдается тем ссылкам, по которым находятся еще никогда не индексированные роботом страницы). В результате получается, что, однажды запустив поискового робота (указав ему первый адрес для индексации), можно больше и не заботиться о нем.

    ПРИМЕЧАНИЕ

    Как правило, индексация содержимого тегов <SCRIPT> не выполняется.

    Но что же такое релевантность? Релевантность – это процент соответствия страницы поисковому запросу. Правила, по которым определяется релевантность страницы, индивидуальны для каждой поисковой системы. Некоторые поисковые системы держат эти правила в секрете, некоторые же публикуют правила релевантности на своих сайтах.

    В целом релевантность документа зависит от ряда факторов, в том числе от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т. д.

    Теперь рассмотрим основные популярные поисковые системы, которые доступны русскоязычному пользователю.

    Google

    Дата создания: сентябрь 1998 года.

    Адрес: http://www.google.com.ua (украинский сайт), http://www.google.ru (русский сайт), http://www.google.com/intl/xx-hacker/ (хакерский) и многие другие.

    Данная поисковая система предназначена для поиска информации на любых языках, однако в первую очередь специализируется на поиске веб-страниц на английском языке.

    Большинство старых и уважаемых поисковых систем со временем превращаются в настоящие порталы. Не миновало это и поисковую систему Google. Помимо поиска, она предоставляет следующие возможности.

    0 Desktop – программа Google Desktop, которую мы уже рассматривали при описании программ для локального поиска.

    0 «Блокнот» – позволяет быстро сохранять нужную информацию при просмотре веб-страниц.

    0 «Картинки» – дает возможность поиска изображений в Интернете.

    0 «Каталог» – позволяет выполнять поиск страниц по разделам каталога поисковой системы Google.

    0 «Новости» – свежие новости из многочисленных источников.

    0 «Панель инструментов» – позволяет установить в браузере панель инструментов для быстрого доступа к возможностям поисковой системы Google.

    0 «Поиск по блогам» – позволяет выполнять поиск по блогам поисковой системы Google.

    0 Blogger – с помощью данного проекта вы сами можете создать свой блог для изложения всех своих мыслей и переживаний.

    0 Gmail – почтовая система, возможности которой мы уже рассматривали.

    0 Picasa – позволяет организовывать, редактировать и размещать фотографии в сети.

    0 Talk – дает возможность общаться в чате и звонить друзьям через Интернет.

    0 «Группы» – различные форумы и списки рассылок поисковой системы Google.

    0 «Документы» – позволяет создавать документы и вести совместные проекты.

    0 «Календарь» – сетевой календарь. Доступ к данному календарю можете получить не только вы, но и ваши друзья. Иными словами, они всегда будут в курсе того, что вы делаете сегодня и где вас можно найти.

    0 «Переводчик» – позволяет переводить веб-страницы.

    0 Google Page Creator – дает возможность за считанные минуты создать и опубликовать в Интернете свою собственную страницу. Данный сервис доступен на странице http://pages.google.com.

    Казалось бы, такое количество дополнительных возможностей должно было существенно ухудшить процесс поиска, повысив размер главной страницы поисковой системы до невероятных размеров. Однако это не так – основная страница сайта поисковой системы содержит лишь поле для поиска, а также ссылки на основные сервисы поисковой системы. Весь же список сервисов поисковой системы Google представлен на странице http://www.google.com.ua/intl/ru/options/.


    Правила поиска

    Но перейдем к теме данной главы. Как же правильно искать страницы при помощи Google? Как и в других системах, необходимо ввести слово либо фразу, по которой поисковая система будет выполнять поиск.

    Знаки препинания. Прежде всего, следует понимать, что поисковая система Google не распознает знаки препинания, а также пропускает такие символы, как восклицательные, вопросительные знаки или знак @. Это сделано для того, чтобы поиск проходил как можно быстрее, а результаты были наиболее полными.

    ПРИМЕЧАНИЕ

    Из этого правила есть несколько исключений. Например, поисковая система Google может обрабатывать запросы C++ и $10. В будущем исключений будет больше, так как уже сейчас разработчики этой поисковой системы ищут пути включения в поиск различных терминов вроде C/net.

    Логические операции. Между двумя и более словами искомой фразы можно устанавливать логические связи. Это делается при помощи специальных операторов, большинство из которых должны быть вам известны из школьного курса информатики.

    Например, OR позволяет установить логическую связь ИЛИ, то есть указать, что нужно найти страницы, содержащие либо то, либо другое слово. Проще всего это понять на примере. Так, по поисковому запросу отпуск Лондон OR Париж будут отображены все страницы, в которых встречаются слова отпуск Лондон или отпуск Париж.

    Одиночные цифра, буквы и отдельные слова. По умолчанию поисковая система Google игнорирует отдельные буквы, цифры, а также незначащие слова (например, где, как, the, who, and), которые указываются в запросах. В качестве примера рассмотрим несколько поисковых фраз и то, как они будут обработаны поисковой системой.

    0 The Sound and the Fury – фраза состоит всего из двух слов, поиск которых будет выполняться. Это слова Sound и Fury. Остальные слова данного запроса будут проигнорированы.

    0 Звездные войны эпизод I – в данном случае будет проигнорирован только символ I, то есть поиск будет вестись только по фразе Звездные войны эпизод.

    0 The Who – поскольку данный запрос состоит только из незначащих слов, он будет выполнен «как есть». Иными словами, поисковая система выполнит поиск всей фразы.

    Понимая то, что в некоторых случаях поиск по незначащим словам может быть просто необходим, разработчики поисковой системы включили возможность обхода игнорирования незначащих слов и отдельных символов. Это можно сделать двумя способами: либо поставить перед незначащим словом знак + (например, Звездные войны эпизод либо взять всю поисковую фразу в кавычки (например, «The Sound and the Fury»).

    Знак + говорит о том, что слово либо символ, перед которым стоит данный знак, обязательно должны быть включены в поисковый запрос.

    Ограничение поисковой фразы кавычками используется для того, чтобы найти страницы с точным соответствием введенной фразе. Например, такой способ часто применяется для поиска человека по его имени и фамилии.

    Диапазон чисел. Поисковая система Google поддерживает возможность поиска на страницах не только определенного числа, но и чисел, находящихся в определенном диапазоне. Для этого достаточно поставить между двумя числами, определяющими нижний и верхний порог диапазона, две точки без пробелов. Например, автомобиль вес 1000..3000 кг.

    Знак подстановки. При выполнении поиска в Google можно использовать знак подстановки *. Он применяется для указания того, что между двумя искомыми словами может находиться любое другое слово (либо несколько слов). Например, поисковый запрос витамин * полезный для * диабет выполнит поиск всех страниц, на которых имеется слово витамин, за которым идет фраза полезный для, а после нее встречается слово диабет.

    Калькулятор. Одной из особенностей поисковой системы Google является встроенный в нее калькулятор. Иначе говоря, вы можете ввести в поля для поиска выражение, которое поисковая система самостоятельно посчитает, после чего отобразит результаты по вычисленному выражению. Как правило, поисковая система автоматически определяет выражения, которые нужно подсчитать. Однако вы можете и вручную указать выражение для вычисления. Для этого достаточно поставить после выражения знак =.

    Встроенный калькулятор Google поддерживает следующие операторы.

    0 + – сложение двух чисел.

    0 – вычитание одного числа из другого.

    0 * – умножение одного числа на другое.

    0 / – деление одного числа на другое.

    0 ^ – возведение одного числа в степень, указанную другим числом. Например, 8 во второй степени записывается как 8^2. Более того, для вычисления степени можно использовать выражения, подобные следующему: кв. корень из 2.

    0 % – остаток от деления одного числа на другое.

    0 Choose – количество вхождений одного элемента в другой. Например, 18 choose 4.

    0 th root of – n-ный корень числа. Например, 5th root of 32.

    0 % of – количество процентов от числа. Например, 20 % of 150.

    0 Sqrt(число) – возведение числа в квадрат.

    0 Sin(число), cos(число), tan(число) и т. д. – синус, косинус, тангенс и другие стандартные тригонометрические функции от числа.

    0 ln(число) – логарифм числа по основанию e.

    0 log(число) – логарифм числа по основанию 10.

    0 ! – факториал числа. Например, 5!.

    0 In – преобразование числа в одной системе в другую систему. Например, 5 kilometers in miles или даже 160 лошадиных сил * минуту в калориях. Калькулятор понимает множество систем счисления, причем может распознавать как полные формы названия системы, так и сокращенные. Например, он способен понимать следующие системы: kilometer, kilometers, km, mph, GW, miles, degrees, kg, in roman numerals.

    При использовании функций калькулятора число можно указывать как в десятичной системе счисления, так и в других системах. По умолчанию число считается десятичным, однако вы можете самостоятельно добавить к нему один из префиксов, определяющих его систему счисления: 0x (шестнадцатеричная система счисления), 0o (восьмеричная система счисления), 0b (двоичная система счисления). Например, калькулятор способен вычислять подобные выражения: 0x7f + 0b10010101.

    Конвертер валют. Помимо калькулятора, в поисковую систему Google встроен и конвертер валют, позволяющий автоматически выполнять их конвертацию. Для этого достаточно воспользоваться запросом, подобным следующим:

    0 3,5 USD в RUB по курсу ЦБ;

    0 российская валюта в украинских деньгах;

    0 5 российских рублей в валюте Великобритании;

    0 5 фунтов стерлингов в рублях по курсу ЦБ;

    0 3,2 доллара/галлон в рублях/литр.

    Поиск специальных номеров. Поисковый механизм Google позволяет выполнять поиск по специальным номерам, относящимся к различным гражданским системам, организациям и услугам. Так, с ее помощью можно выполнить поиск следующих номеров:

    0 номера отслеживания UPS – для этого нужно воспользоваться запросом вида 1Z9999W99999999999;

    0 номера отслеживания FedEx – воспользуйтесь запросом вида 999999999999;

    0 номера отслеживания USPS– укажите запрос вида 9999 9999 9999 9999 9999 99;

    0 идентификационные номера транспортных средств (VIN) – для этого нужно воспользоваться запросом вида AAAAA999A9AA99999;

    0 коды UPC – воспользуйтесь запросом вида 073333531084;

    0 номера патентов– укажите запрос вида («patent 5123123»).


    Поисковые команды

    Помимо обычного поиска в содержимом страниц, с помощью Google можно выполнять специальный поиск. Для этого предназначены специальные команды, которые тем или иным образом ограничивают круг результатов поиска. Эти команды имеют следующий формат: <команда>:<искомое слово>. Как правило, команды используются совместно с самой искомой строкой. Другими словами, сначала вы вводите слово, которое нужно искать, а потом уже команду, ограничивающую результаты поиска.

    Поисковая система Google поддерживает следующие команды.

    0 define:<слово или фраза> – поиск определения слова (страницы, которые, как предполагает поисковая система, содержат определение данного слова, будут отображаться первыми в результатах).

    0 allintext:<слова через пробел> – отобразить только те страницы, в содержимом которых встречаются указанные слова (поиск в заголовке страницы и ссылках, которые расположены на странице, вестись не будет).

    0 intext:<слово> – показать только те страницы, в содержимом которых встречается указанное слово (поиск данного слова в заголовке страницы и ссылках, которые расположены на странице, вестись не будет). При использовании данной команды указывается только одно искомое слово – на остальные указанные слова действие команды распространяться не будет.

    Например, при запросе intext: style one design поисковая система отобразит все страницы, в содержимом которых встречается слово style, а также в заголовке, содержимом или в гиперссылках которой встречаются слова one и design.

    0 site:<адрес сайта> – указать поисковой системе, что введенную фразу нужно искать только на страницах, принадлежащих указанному в команде сайту.

    Например, запрос поисковые системы site: www.onestyle.com.ua отобразит все страницы сайта www.onestyle.com.ua, на которых встречается фраза поисковые системы.

    Помимо адреса сайта, в данной команде можно указывать только домен. Например, site: com.

    0 allintitle:<список слов через пробел> – поиск сайтов, в заголовке которых встречаются указанные в команде слова.

    Например, по запросу allintitle: дизайн программирование будут найдены все страницы, в заголовке которых присутствуют слова дизайн и программирование.

    0 intitle:<слово> – поиск сайтов, в заголовке которых встречается указанное в команде слово. От команды allintitle: она отличается тем, что вместе с ней можно указывать слово или фразу, поиск которой будет выполняться в содержимом документа.

    Например, по запросу alltitle: дизайн программирование будут найдены все страницы, в заголовке которых присутствует слово дизайн, а в содержимом – слово программирование.

    0 allinURL:<список слов через пробел> – поиск сайтов, адреса которых содержат указанные слова. Например, команда allinURL: one style отобразит все сайты, в адресе которых встречаются слова one и style.

    0 inURL:<слово> – поиск сайтов, адреса которых включают в себя указанное слово. Вместе с данной командой можно указывать и слова для поиска в содержимом документа.

    Например, команда inURL: one style покажет все страницы, в адресе которых встречается слово one, а в содержимом – слово style.

    0 cache:<адрес страницы> – будет отображена указанная страница, хранящаяся в кэше поисковой системы Google. Над выведенной страницей будет указана последняя дата ее индексации.

    Данную команду можно использовать в том случае, если вы хотите получить доступ к документу, который уже был удален с сайта, однако остался в базе данных Google (был проиндексирован).

    Например, команда cache: www.onestyle.com.ua дизайн отобразит указанную страницу www.onestyle.com.ua и выделит на ней все слова дизайн.

    0 аll inlinks:<слова через пробел> – отобразить только те страницы, в именах которых встречаются указанные слова.

    0 link:<адрес страницы> – показать все страницы, на которых встречается ссылка на сайт с указанным адресом.

    0 related:<адрес страницы> – отобразить все страницы, которые похожи на указанную (то есть содержат такой же или похожий текст).

    0 info:<адрес сайта> – может использоваться как заменитель команд related:, cache:, link:. Она отображает ссылку на указанную страницу, под которой будут находиться ссылки, с чьей помощью можно выполнить следующие действия:

    • показать сохраненную в Google версию;

    • найти похожие страницы;

    • найти страницы, ссылающиеся на данную;

    • найти страницы на данном сайте;

    • найти страницы, упоминающие данную.

    0 filetype:<расширение>– в качестве результатов поиска отображать только файлы с заданным расширением. Поисковая система Google индексирует файлы со следующими расширениями:

    • веб-страницы (HTM и HTML);

    • Adobe Portable Document Format (PDF);

    • Adobe PostScript (PS);

    • Lotus 1-2-3 (WK1, WK2, WK3, WK4, WK5, WKI, WKS, WKU);

    • Lotus WordPro (LWP);

    • MacWrite (MW);

    • Microsoft Excel (XLS);

    • Microsoft Word (DOC);

    • Microsoft PowerPoint (PPT);

    • Microsoft Works (WKS, WPS, WDB);

    • Microsoft Write (WRI);

    • Rich Text Format (RTF);

    • Shockwave Flash (SWF);

    • Text (ANS, TXT).

    Например, команда filetype: doc inurl: www.microsoft.com Vista выведет список всех файлов с расширением DOC, найденных на сайте www.microsoft.com и содержащих слово Vista.

    Обратите внимание на ссылку В виде HTML, отображаемую напротив некоторых результатов поиска в поисковой системе Google. C ее помощью можно будет просмотреть содержимое найденного файла в виде HTML-страницы.


    Результаты поиска

    Итак, перед вами отобразились результаты поиска (рис. 5.19). Если вы искали по каким-то популярным фразам, то, скорее всего, количество результатов будет достигать миллиона. Сразу хочется сказать, что весь миллион результатов поиска вы просмотреть не сможете (хотя это, конечно, никому и не нужно) – разработчики поисковой системы Google ввели ограничение, по которому пользователи могут просматривать только первую тысячу результатов поиска.

    Рис. 5.19. Один из результатов поиска


    Предупреждение безопасности. При открытии некоторых страниц из результатов поиска может появиться сообщение о том, что данные страницы представляют угрозу для вашего компьютера. Оно появляется при попытке открытия страницы сайта, который определен поисковой системой как содержащий вредоносный код. Поэтому следует внимательно относиться к таким предупреждениям и трижды подумать перед тем, как открыть страницу, для которой отображается предупреждение.

    Проверка орфографии. Поисковая система Google автоматически проверяет орфографию во фразе, которую вы ищете. Это проявляется в результатах поиска. Так, если вы неправильно ввели какое-либо слово для поиска, то над результатами отобразится ссылка Возможно, вы имели в виду: <правильный запрос>. Щелкнув кнопкой мыши на этой ссылке, вы сможете выполнить поиск по скорректированному запросу.

    Элементы поиска на главной странице. И напоследок рассмотрим элементы поиска, отображаемые на главной странице поисковой системы (рис. 5.20). Например, на странице www.google.com.ua.

    0 Мне повезет! – наверное, вы уже обратили внимание на то, что напротив кнопки для обычного поиска расположена еще одна кнопка – Мне повезет!. Она ведет вас прямо на первую страницу результатов, которые поисковая система Google найдет по указанному запросу.

    Рис. 5.20. Главная страница поисковой системы


    0 Языковые инструменты – с помощью данной ссылки можно перевести нужную страницу на один из множества языков, а также перейти на главную страницу поисковой системы, созданную специально для вашей страны либо созданную под определенный стиль (например, специально для хакеров).

    0 Настройки – используя эту ссылку, можно определить языки, на которых написаны страницы, отображаемые в результатах поиска; определить количество результатов, отображаемых на одной странице (но не больше 100); указать, будет ли при отображении результатов выводиться ссылка Возможно, вы имели в виду: <правильный запрос> и т. д. Кроме того, с помощью данной ссылки можно установить режим безопасного поиска. При использовании данного режима из результатов поиска будут исключаться все страницы, содержащие порнографию и материалы явно выраженного сексуального характера.

    0 Расширенный поиск – с помощью этой ссылки можно определить язык, регион, домен, формат искомых файлов, дату изменения и т. д. Другими словами, при помощи данной ссылки можно активизировать использование по умолчанию основных команд поисковой системы Google, которые мы уже рассмотрели.


    Программа Google Desktop

    Теперь ненадолго вернемся к программе, работу которой мы разобрали при рассмотрении возможностей локального поиска. С помощью данной программы можно выполнять поиск не только на локальном компьютере, но и в Интернете. Поиск в Интернете выполняется аналогично обычному поиску, поэтому описывать его я не буду. Однако хотелось бы обратить ваше внимание на две настройки данной программы.

    0 Поиск Google Desktop– эта вкладка окна настройки программы позволяет определить адреса сайтов, на которых поиск выполняться не будет.

    0 Другие – на этой вкладке того же окна присутствует флажок Включить безопасный просмотр. С его помощью можно установить режим, при котором программа будет выдавать сообщение, если просматриваемый сайт является мошенническим или небезопасным для компьютера.


    ICQ бот 56544550

    Вы еще не забыли, что выполнять поиск в поисковой системе Google можно и при помощи ICQ бота с номером 56544550? Для этого достаточно отправить данному боту команду Google <поисковый запрос>.


    «Яндекс»

    Дата создания: 1997 год.

    Адрес: http://www.yandex.ru (полная версия), http://www.ya.ru/ (только поле поиска), http://dzen.yandex.ru/ (только кнопка поиска, для случайного поиска) и т. д.

    Если вам нужно выполнить поиск страниц на русском языке, то лучше всего воспользоваться поисковой системой «Яндекс». Уже сейчас эта поисковая система считается одной из лучших систем для поиска страниц на русском и английском языках.

    Особенностью «Яндекса» является полная поддержка всех правил морфологии русского языка (она и у поисковой системы Google, однако на данный момент не может похвастаться полнотой и правильностью работы). Таким образом, вам не нужно задумываться над тем, в какой форме или падеже указывать искомое слово. Например, если вы выполните поиск по слову компьютер, то поисковая система отобразит перед вами все страницы, на которых встречаются слова компьютер, компьютера, компьютеры и т. д.

    С технической точки зрения данная поисковая система работает следующим образом. Поисковый робот просматривает страницу и составляет предварительный индекс ее содержимого. После этого все русские слова приводятся в нормальную форму (например, для существительных это именительный падеж единственного числа, а для глаголов – неопределенная форма), определяется их расположение на странице и характеристики. Все полученные таким образом сведения заносятся в базу данных индексированных страниц. Благодаря тому что перед индексацией слова переводятся в нормальную форму, достигается сокращение размера базы данных индекса на 30 %.


    Правила поиска

    По умолчанию запрос, состоящий из нескольких слов, трактуется следующим образом: найти все страницы, которые содержат слова запроса, расположенные недалеко друг от друга. При этом не учитывается фактическое расположение слов поискового запроса. Например, запрос красная шапочка приведет к отображению всех страниц, в которых слово красная и слово шапочка находятся в пределах нескольких предложений, причем совершенно не важно, какое из этих слов будет идти первым.

    Расстояние между словами. Если же нужно еще больше расширить область поиска и выполнить поиск страниц, в которых введенные слова встречаются в пределах всей страницы, то следует поставить между словами искомой фразы символы &&.

    Вместо оператора && можно воспользоваться оператором <<. Он также расширяет область поиска и выполняет поиск страниц, в которых введенные слова встречаются в пределах всей страницы. Однако при этом слово, которое находится справа от оператора <<, не будет влиять на ранжирование страниц результатов запроса.

    Вы можете точно определить максимальное количество предложений, которые будут отделять одно искомое слово от другого. Для этого между словами запроса нужно поставить структуру вида &&/<максимальное количество слов>. Например, по запросу культура &&/2 Россия отобразятся все страницы, в которых слово Россия отделяется от слова культура не более чем двумя предложениями.

    Кроме того, поисковая система позволяет искать страницы, в которых введенные слова встречаются в одном предложении. Для этого достаточно поставить между словами искомой фразы символы &. Например, по запросу культура & Россия отобразятся все страницы, содержащие в одном предложении и слово культура, и слово Россия.

    Более того, вы можете точно определить максимальное количество слов, которые будут отделять одно искомое слово от другого. Для этого между словами вашего запроса нужно поставить оператор /<максимальное количество слов>. Например, по запросу культура /2 Россия отобразятся все страницы, в которых слово Россия отделяется от слова культура не более чем одним словом.

    Усложняя задачу, можно прийти к еще одному виду операторов поисковой системы «Яндекс»: /(<минимальное количество слов> <максимальное количество слов>). С помощью такого оператора выполняется поиск фраз, в которых между словами может находиться не более определенного количества слов и не менее другого такого же определенного количества слов. Например, запрос космическая /(2 3) станция найдет страницы, на которых могут присутствовать фразы вида космическая орбитальная станция, космическая российская орбитальная станция, но при этом не будут найдены страницы, на которых есть фразы вида космическая станция.

    Если же вы хотите выполнить поиск по жесткой фразе (то есть найти страницы, содержащие точную фразу, которая совпадает с введенной), то следует взять искомую фразу в кавычки. Например, «красная шапочка».

    Порядок слов. Если для вашего запроса важен порядок расположения слов искомой фразы, то при его создании следует воспользоваться несколькими дополнительными возможностями поисковой системы «Яндекс».

    Так, чтобы найти слова, которые идут в определенном порядке, достаточно поставить между ними знак + (в прямом порядке) или – (в обратном порядке). Например, при запросе Иван + Тургенев будут найдены все страницы, содержащие фразы вида Иван Тургенев и ни одной страницы с фразами вида Тургенев Иван.

    Одной из особенностей поисковой системы «Яндекс» является возможность объединения операторов изменения расстояния между словами и операторов изменения порядка слов. Для этого достаточно поставить оператор порядка слов после знака / операторов изменения расстояния между словами. Например, немного усложним предыдущий запрос: Иван / + 2 Тургенев. С его помощью будут найдены все страницы, в которых между словами Иван и Тургенев находится одно слово. Причем, слово Иван всегда должно стоять перед словом Тургенев.

    Теперь взгляните на еще один запрос: Васисуалий /(-1 +2) Лоханкин. Данный запрос отобразит перед вами только те страницы, которые содержат одну из фраз следующего вида:

    0 Лоханкин Васисуалий;

    0 Васисуалий Лоханкин;

    0 Васисуалий <слово> Лоханкин.

    Логические операторы. Поисковая система «Яндекс» способна обрабатывать логические операторы типа ИЛИ и НЕ.

    Так, для того чтобы выполнить поиск или слова 1, или слова 2, нужно поставить между ними знак |. Например, по поисковому запросу отпуск Лондон | Париж будут отображены все страницы, в которых встречаются слова отпуск Лондон или отпуск Париж.

    Если же нужно найти все страницы, на которых нет определенного слова, то следует перед этим словом поставить оператор ~~. Например, запрос компьютерный журнал – CHIP отобразит все страницы, на которых встречаются слова компьютерный и журнал, но нет слова CHIP.

    Кроме того, поисковая система «Яндекс» поддерживает еще одну разновидность логического оператора НЕ. Вы можете выполнить поиск страниц, на которых определенное слово не встречается рядом с другими словами поискового запроса (в пределах одного предложения). Иными словами, данное слово может встречаться на странице, однако оно не должно находиться рядом с одним из других слов поискового запроса. Для выполнения такого поиска применяется оператор ~. Например, команда дизайн уроки – услуги выполнит поиск всех страниц, на которых встречаются слова дизайн, уроки или услуги и при этом слово услуги не встречается рядом со словами дизайн или уроки.

    Настройка морфологии. По умолчанию поиск всех слов, которые вы указываете, выполняется с учетом морфологии. Если же необходимо выполнить поиск без использования морфологии, то следует поставить перед искомым словом символ !. Например, поиск по фразе ! день отобразит все страницы, на которых присутствует слово день. Такие же страницы, на которых встречаются слова дня, дней, дни (а также деть, денешь и т. д., ведь слово день является и одной из форм слова деть) в результаты поиска не попадут.

    Одной из проблем поиска с учетом морфологии является то, что формы некоторых слов могут совпадать. Например, форма день слова день и форма день слова деть. Чтобы решить эту проблему, достаточно указать поиск по слову в нормальной форме. Для этого нужно поставить оператор !! перед словом, расположенным в нормальной форме. Например, запрос !!день найдет все формы данного слова (дня, дню, днем и т. д.) и не найдет форм слова деть.

    Зависимости между фразами. Мы рассмотрели способы установления зависимостей между отдельными словами, однако, помимо этого, можно определять зависимости между целыми фразами либо даже между зависимостями слов. Это несложно – достаточно взять отдельную фразу в круглые скобки.

    В качестве примера рассмотрим такой запрос: мумие && (лечение | лечебный | болезни)—(цена | прайс | рубли | доллар | фирма | магазин). По данному запросу будут найдены все страницы, на которых присутствует слово мумие, а также одно из слов, символизирующих его лечебные качества. При этом на страницах не должно быть слов, связанных с покупкой этого предмета.

    Изменение правил релевантности. Еще одной интересной особенностью поисковой системы «Яндекс» является возможность изменения релевантности отдельных слов в поисковом запросе.

    Так, чтобы изменить вес отдельного слова, нужно поставить после него оператор :<вес>. Например, запрос поисковые механизмы:5 говорит о том, что на результирующих страницах более важно слово механизмы, а не слово поисковые.

    Кроме того, поисковая система позволяет определить уровень нестрогого поиска (коэффициент «мягкости»). Иными словами, вы можете определить, будут ли в результаты поиска включаться страницы, которые содержат не все из тех слов, что вы указали в запросе (пассажи). Для этого предназначены запросы вида (слова через пробел)//<число от 1 до 100>. По умолчанию поиск ведется с коэффициентом мягкости, равным 6.

    При коэффициенте мягкости, равном 50, количество найденных документов должно быть примерно равно среднему геометрическому чисел найденных документов при поиске всех возможных неполных пассажей. Подробнее о коэффициенте мягкости можно прочитать на странице http://company.yandex.ru/articles/romip2004.xml.


    Команды поиска

    Помимо обычных запросов, поисковая система «Яндекс» может обрабатывать и специальные, сформированные при помощи особых команд. Рассмотрим основные команды.

    0 $title (искомые слова) – искать указанные слова только в заголовке страниц. Например, взгляните на такой сложный запрос: Максвелл << $title (биография).

    0 $anchor (искомые слова) – выполнить поиск указанных слов только в именах страниц. Например, запрос $anchor (one style) отобразит только те страницы, в имени которых встречаются слова one и style.

    0 #keywords=(искомые слова) – искать указанные слова только в ключевых словах страниц (то есть внутри тега <meta name="keywords" content=""> страницы).

    0 #abstract=(искомые слова) – выполнить поиск указанных слов только в описании страниц (то есть внутри тега <meta name="description" content=""> страницы).

    0 #image="название" – искать только изображения, имеющие указанное название.

    0 #hint=(искомые слова) – искать только изображения, в подписях к которым встречаются указанные слова.

    0 #url="имя сайта" – выполнить поиск только на данном сайте. Например, запрос поисковые системы #url = «www.onestyle.com.ua» отобразит все страницы сайта www.onestyle.com.ua, на которых встречается фраза поисковые системы.

    0 host="имя сайта" – выполнить поиск только на данном сайте, а также на всех его зеркалах.

    Помимо оператора host, можно использовать оператор rhost. Он аналогичен оператору host во всем, кроме записи имени сайта, – имя сайта при его использовании записывается в обратном порядке. Например, rhost="ru.yandex.*".

    0 #link="имя сайта" – выполнить поиск ссылок на указанный сайт.

    0 #mime="тип файла" – в качестве результатов поиска отображать только файлы с заданным расширением. Например, команда Vista #mime="doc" отобразит список всех файлов с расширением DOC, содержащих слово Vista. При поиске страниц с несколькими расширениями правильнее было бы использовать запрос следующего вида: (инструкция && микроволновая печь) << (mime="pdf" | mime="rtf"), то есть запретить ранжирование страниц результата запроса по расширениям.

    Поисковая система «Яндекс» индексирует содержимое файлов со следующими расширениями: HTML, PDF (Adobe Portable Document Format), DOC (Microsoft Word), PPT (Microsoft PowerPoint), XLS (Microsoft Excel), RTF (Rich Text Format), SWF (Macromedia Flash).

    0 lang="язык" – выполнить поиск только среди страниц, написанных на указанном языке. Например, вы можете искать на страницах со следующими языками: ru (русском), uk (украинском), be (белорусском), en (английском), fr (французском), de (немецком).

    0 like="имя страницы" – искать на страницах, похожих на указанную.

    0 domain="домен" – выполнить поиск на страницах, которые принадлежат данному домену. Например, Vista domain="ru".

    0 date="ГГГГММДД" – искать на страницах, дата изменения которых удовлетворяет заданной дате. Помимо конкретного дня, года или месяца, можно указывать знак *. В этом случае день, год или месяц учитываться не будут.

    Вместо знака = в данной команде можно использовать следующие знаки: >, <, >=, <=.

    0 cat=(ID региона или темы) – выполнить поиск только среди страниц, зарегистрированных в «Яндекс. Каталоге», тематическая рубрика или регион которых совпадают с указанными.

    Идентификатор региона можно получить, прибавив к коду региона смещение 11 000 000. Идентификатор тематической рубрики получается прибавлением к коду темы смещения 9 000 000.

    Например, зяблик << cat=(11000051).


    Настройка поиска

    Вместо специальных команд поиска вы можете воспользоваться специальными формами для настройки и формирования запроса поиска. Таких форм всего две: это страница Расширенный поиск (http://www.yandex.ru/advanced.html) и Настройка результатов поиска (http://www.yandex.ru/cgi-bin/customize.pl).

    Расширенный поиск. С помощью данной страницы можно определить следующие параметры поиска:

    0 область поиска (везде либо только в заголовке страницы);

    0 указать, будет ли использоваться механизм проверки морфологии (или будет выполнен поиск слова/фразы только в той форме, которую вы ввели);

    0 задать, как будет интерпретироваться расположение искомых слов друг от друга (слова идут подряд; должны встречаться в одном предложении; должны находиться недалеко друг от друга; должны находиться на одной странице);

    0 указать, на каких языках должны быть написаны страницы, отображаемые в результатах поиска;

    0 дата изменения страниц, отображаемых в результатах поиска;

    0 страница, на которую должны быть похожи файлы, отображаемые в результатах поиска;

    0 страна, в которой должны находиться сайты, страницы которых будут выводиться в результатах поиска;

    0 сайт, страницы которого будут отображаться в результатах поиска;

    0 указать, файлы каких типов должны отображаться в качестве результатов поиска;

    0 максимальное количество результатов, отображаемых на одной странице (но не больше 50).

    Настройка результатов поиска. С помощью данной страницы можно настроить формат отображения результатов поиска (количество результатов на странице, будут ли выводиться пиктограммы сайтов и картинки, будет ли поисковая форма отображаться внизу страницы и т. д.), а также определить язык, на котором будет выполняться поиск страниц. Кроме того, на этой странице можно включить использование семейного фильтра (из результатов поиска будут исключаться все страницы, содержащие порнографию и материалы явно выраженного сексуального характера).


    Другие проекты

    Проекты. Помимо поиска в Интернете, портал «Яндекс» поддерживает работу ряда других проектов. Рассмотрим некоторые из них.

    0 «Яндекс. WiFi» – список бесплатных точек беспроводного доступа, поддерживаемых «Яндексом».

    0 «Рефераты» (http://referats.yandex.ru/) – довольно занимательный проект, который позволяет самостоятельно создать реферат по одной из предопределенных дисциплин путем нажатия всего нескольких кнопок.

    0 «Кубки» – турниры по поиску в Интернете, придуманные «Яндексом».

    0 «Яндекс. Директ» (http://direct.yandex.ru/) – размещение рекламы в результатах поиска.

    0 «Яндекс. Почта» (http://mail.yandex.ru/) – мы уже рассматривали возможности данного почтового сервера.

    0 «Яндекс. Деньги» (http://money.yandex.ru/) – одна из лучших на Российской территории платежных систем. О ее использовании и возможностях мы поговорим в гл. 6.

    0 «Народ. Ру» (http://narod.yandex.ru/) – предоставляет бесплатный хостинг. Иными словами, с его помощью вы бесплатно сможете разместить в Интернете свою собственную страницу. Адрес созданной таким образом страницы будет иметь вид <ваше имя>.narod.ru. Приятной особенностью данного хостинга является то, что объем дискового пространства, которое вы можете использовать, неограничен.

    0 «Мой Круг» (http://www.moikrug.ru/) – предназначен для поиска одноклассников, коллег и знакомых. Он также поможет упорядочить ваши контакты, предоставив вам доступ к своей адресной книжке из любого места, где возможен доступ к Интернету.

    0 «Закладки» (http://zakladki.yandex.ru/) – позволяет создавать закладки на любимые страницы Интернета. При этом созданные закладки будут автоматически периодически проверяться на работоспособность. Еще одной особенностью данного проекта является его интеграция с программой «Яндекс. Бар», благодаря чему доступ к вашим закладкам будет возможен из данной панели инструментов.

    0 «Яндекс. Лента» (http://lenta.yandex.ru/) – дает возможность объединять RSS-потоки в одну ленту и читать их в виде одной-единственной страницы (вместо того чтобы постоянно заходить на разные сайты).

    0 «Фотки» (http://fotki.yandex.ru/) – позволяет публиковать свои фотографии, участвовать в конкурсах, а также смотреть, комментировать и выбирать лучшие фотографии других пользователей.

    0 «Находки» (http://nahodki.yandex.ru/) – дает возможность быстро сохранять поисковые запросы и просмотренные результаты.

    0 «Города» (http://goroda.yandex.ru/) – формирует интернет-индексы городов (на основе сотрудничества этих городов с компанией «Яндекс»).

    0 «Новости» (http://news.yandex.ru/podpiska/login.pl) – показывает местные новости (ваше местоположение определяется по IP-адресу), а также позволяет подписаться на свежие новости.

    0 «Маркет» – ряд магазинов для покупок в режиме on-line.

    Программы. Поисковая система «Яндекс» также предоставляет ряд созданных ею продуктов, которые непосредственно касаются темы, рассматриваемой в книге.

    0 Яndex.Server (http://company.yandex.ru/technology/products/yandex-server.xml) – приложение для поиска по веб-сайту или локальной сети с учетом морфологии русского языка (рис. 5.21).

    Рис. 5.21. Страница Яndex.Server


    0 «Персональный поиск Яндекса» (http://desktop.yandex.ru/) – программа, предназначенная для полнотекстового поиска с учетом морфологии русского языка в файлах локального компьютера (по файлам, письмам и кэшам браузеров). Как вы помните, возможности этой программы мы уже рассмотрели ранее.

    0 «Яндекс. Бар» – панель инструментов для различных браузеров, с помощью которой можно быстро получить доступ к основным сервисам поисковой системы «Яндекс».

    0 «Яндекс. Спамооборона» (http://so.yandex.ru/) – серверное приложение для фильтрации спама, предназначенное для корпоративных пользователей. Загрузить пробную версию данного приложения можно по адресу http://so.yandex.ru/companies/download.xml#new.

    «Рамблер»

    Дата создания: сентябрь 1996 года.

    Адрес: http://www.rambler.ru (главная страница), http://www.r0.ru/ (только форма для поиска), http://pda.rambler.ru/index.jspx (главная страница для карманных компьютеров).

    Данная поисковая система была создана фирмой «Стек» для реализации поиска по русскоязычным сайтам, находящимся в домене ru, а также в доменах некоторых стран СНГ. Она считается третьей в тройке лидеров русскоязычных поисковых систем (Google, «Яндекс», «Рамблер»).

    Особенность данной поисковой системы в том, что она индексирует только содержимое страниц, находящихся в доменах ru, su, ua, by, kz, kg, uz, ge. Другими словами, она индексирует только содержимое русскоязычных страниц, игнорируя страницы с других доменов.

    Следует также учитывать, что индексации подлежит только «видимое» содержимое страниц. Например, содержимое комментариев и тегов <meta> не индексируется. Не индексируется и текстовая информация из флэш-объектов.


    Правила поиска

    Прежде всего, следует заметить, что, в отличие от предыдущих поисковых систем, «Рамблер» может обрабатывать знаки препинания. А вот стоп-слова (незначащие слова, например предлоги, частицы и артикли) по умолчанию игнорируются. Если же вы хотите выполнить поиск с учетом какого-либо незначащего слова, то поисковую фразу нужно взять в двойные кавычки.

    Если слово или фраза взяты в двойные кавычки, то поисковая система ищет их как есть, то есть для такой фразы морфологический поиск не выполняется. Кстати, «Рамблер» может выполнять поиск с учетом морфологии только для русского и английского языков.

    Расстояние между словами. По умолчанию поисковая система игнорирует регистр слов поискового запроса. Однако из этого правила есть одно исключение. Если поисковый запрос состоит из 2–4 слов, каждое из которых начинается с прописной буквы, то для такого запроса автоматически изменяется максимально возможное расстояние между словами запроса (это расстояние становится равным (n-1)*2, где n – количество слов в запросе). Другими словами, такой запрос позволяет найти страницы, на которых между словами запроса находится не более одного лишнего слова.

    В остальных случаях поисковая система ищет страницы, в которых между словами запроса находится не более 40 слов. Чтобы изменить это правило, достаточно воспользоваться запросом вида (число, запрос), где число определяет максимальное количество лишних слов, которые могут находиться между словами запроса.

    Логические операторы. Поисковая система «Рамблер» способна обрабатывать три основных логических оператора: И, ИЛИ и НЕ.

    Поиск сразу всех слов (логическое И) выполняется при помощи оператора AND (либо оператора &, являющегося его аналогом), который нужно поместить между словами. Например, по запросу собака AND кошка найдутся только те документы, которые содержат и слово собака, и слово кошка. Оператор AND используется поисковой системой по умолчанию, поэтому его можно не указывать.

    Поиск одного из нескольких слов (логическое ИЛИ) выполняется при помощи оператора OR (либо оператора |, являющегося его аналогом), который также нужно поместить между словами. Например, по запросу собака OR кошка найдутся все документы, в которых встречается либо слово собака, либо слово кошка.

    Поиск документов, которые не содержат определенное слово (логическое НЕ), выполняется при помощи оператора NOT. Его нужно поместить перед словом, которое не должно присутствовать в документе.

    Операторы AND и NOT имеют более высокий приоритет, чем оператор OR, поэтому поисковая система при обработке запроса сначала выполняет группировку по операторам AND и NOT и лишь потом по операторам OR. Изменить порядок группировки можно при помощи круглых скобок.


    Команды поиска

    Помимо обычных запросов, «Рамблер» поддерживает возможность использования команд. А точнее, одной команды: ${counter=ID}. С помощью команды данного вида можно выполнить поиск страниц в одном из рейтингов «Рамблера». Рейтинг определяется словом counter, вместо которого можно использовать следующие слова: top100, toplist, spylog или hotlog. Раздел же рейтинга определяется словом ID, которое представляет собой номер раздела.

    Например, для поиска в разделе открыток рейтинга top100 используется оператор ${top100=193680}.


    Результаты поиска

    В качестве результатов поиска «Рамблер» отображает одну строку содержимого найденной страницы, которое удовлетворяет введенному поисковому запросу. Рядом с этой строкой также отображается несколько ссылок, с помощью которых можно выполнить дополнительные действия.

    0 Восстановить текст – показывает страницу, хранящуюся в кэше поисковой системы Google.

    0 Всего – выводит все страницы данного сайта, удовлетворяющие запросу. В частности, данную ссылку можно использовать для поиска правильной страницы сайта, если она содержит фреймы и текущая ссылка на страницу отображает только один из фреймов страницы.

    По умолчанию результаты поиска выдаются в порядке соответствия запросу, однако можно выбрать и другой порядок поиска (по релевантности отдельных страниц или по дате). Это делается на странице результатов поиска.

    Расширенный поиск. При помощи страницы расширенного поиска (http://www.rambler.ru/cgi-bin/advanced.cgi?set=www) можно выполнить поиск с применением следующих возможностей:

    0 определить область поиска: в содержимом страницы, в названии страницы или в ссылках страницы;

    0 задать отношения слов поисковой фразы: поиск всех слов (логическое И), поиск хотя бы одного слова (логическое ИЛИ) либо поиск точной фразы;

    0 определить, будет ли ограничиваться расстояние между словами;

    0 указать слова, которые не должны встречаться на найденных страницах;

    0 определить язык документа (русский, английский или украинский);

    0 задать формат документов, внутри которых можно выполнять поиск (HTML-страницы, DOC-файлы, PDF-файлы);

    0 указать дату модификации документов;

    0 определить сайт, на страницах которого нужно выполнить поиск.

    «Апорт»

    Дата создания: 1995 год.

    Адрес: http://www.aport.ru (главная страница), http://www.au.ru/ (только форма поиска без рекламы), http://pda.aport.ru/ (версия для карманных компьютеров), http://www.aport.ru/wap (версия для мобильных телефонов).

    Данная поисковая система является проектом фирмы «Агама» при поддержке российского отделения Intel. Она предназначена для поиска в российской части Интернета, а также на русскоязычных серверах СНГ.


    Правила поиска

    Как и предыдущие поисковые системы, «Апорт» позволяет выполнять поиск слов с учетом морфологии, игнорируя при этом различные незначащие слова (взяв поисковую фразу в кавычки, можно отменить игнорирование незначащих слов).

    Логические операторы. «Апорт» поддерживает те же логические операторы, что и «Рамблер».

    Так, поиск сразу всех слов выполняется при помощи оператора AND или оператора &, который является его аналогом. Например, собака AND кошка.

    Поиск одного из нескольких слов выполняется при помощи оператора OR или оператора |, который является его аналогом. Например, собака OR кошка.

    Поиск документов, которые не содержат определенное слово, выполняется при помощи оператора NOT или оператора ~, который является его аналогом.


    Команды поиска

    Помимо обычных запросов, поисковая система «Апорт» поддерживает возможность использования следующих команд.

    0 text (<искомые слова>) – искать указанные слова только в содержимом страниц.

    0 title (<искомые слова>) – выполнять поиск указанных слов только в заголовке страниц.

    0 keywords (<искомые слова>) – искать указанные в команде слова только в теге <meta name="keywords" content=""> страницы.

    0 description (<искомые слова>) – выполнять поиск указанных слов только в теге <meta name="description" content=""> страницы.

    0 a1t (<искомые слова>) – искать указанные слова в комментариях к картинкам.

    0 anchor (<искомые слова>) – искать указанные слова в тексте ссылок на страницах.

    0 url=<имя сайта> – выполнять поиск только на данном сайте.

    0 СЛN (искомые слова) – выполнять поиск всех страниц, на которых искомые слова расположены в пределах N слов друг от друга. Например, при помощи запроса СЛ23 (дизайн программирование структурирование) выполняется поиск всех страниц, на которых искомые слова встречаются на расстоянии не более 23 слов друг от друга.

    Вместо команды (искомые слова) можно использоваться ее аналоги CN (искомые слова), WN (искомые слова) или [N, искомые слова].

    Nigma

    Дата создания: 12 апреля 2005 года.

    Адрес: http://www.nigma.ru/ (главная страница), http://www.nigma.ru/index.php?view=lite

    (только форма поиска).

    Данный проект является самым новым из рассмотренных поисковых систем, однако он очень быстро набирает популярность. И все потому, что с его помощью можно выполнять поиск сразу по нескольким поисковым системам. Если точнее, то с помощью данного проекта можно выполнять поиск в индексах следующих поисковых систем: Google, Yahoo, Msn, «Яндекс», «Рамблер», AltaVista, «Апорт», Nigma (то есть, оказывается, у них тоже есть свой собственный индекс страниц Интернета). По умолчанию поиск ведется во всех перечисленных поисковых системах, а результаты такого поиска объединяются между собой.

    Правила поиска. Они являются самыми примитивными из всех, рассмотренных ранее. Остается только надеяться, что в будущем будут добавлены новые операторы поиска.

    0 AND. Как вы, наверное, уже догадались, с помощью данного оператора выполняется поиск страниц, которые содержат все слова запроса, объединенные оператором AND.

    Вместо оператора AND можно использовать оператор +, так как он выполняет аналогичные действия. Можно и вообще не использовать никаких операторов, так как по умолчанию действие пробела между искомыми словами также аналогично действию оператора AND.

    0 OR. С помощью данного оператора можно найти страницы, которые содержат одно из двух слов (между которыми этот оператор находится).

    0 – . Позволяет исключить из результатов поиска страницы, где есть слово, перед которым в поисковом запросе установлен данный оператор. Иначе говоря, оператор – аналогичен оператору NOT или ~ других рассмотренных нами поисковых систем.

    0 site:<имя сайта>. Позволяет отобразить лишь страницы, которые принадлежат указанному сайту.

    На этом закончим рассмотрение поисковых систем. Я привел лишь самые популярные, хотя есть еще очень много специальных порталов для поиска. При желании вы сможете найти их сами.