Untitled Page

Исследование технологии работы поисковой системы

1. Поисковая система
1.1. Определение "Поисковая система"
1.2. Составные компоненты поисковой системы
1.3. Основные параметры поисковой системы
1.4. Работа механизмов поиска
1.5. Модели поиска
1.6. Направления поиска
2. Компания
2.1. Выбор компании
2.2. Миссия и цели компании Google
2.3. Технология работы
2.4. Жизненный цикл запроса Google
3. Поисковая система Google
3.1. Основные сведения о поиске Google: страница результатов поиска
4. Заключение
5. Список литературы

1. Поисковая система

Что же такое поисковые системы, как они помогают нам найти нужную информацию и кто ими пользуется?

Электронный учебник определяет задачу поисковых систем так: «Задача поисковых машин - обеспечивать детальное разыскание информации в электронной вселенной, что может быть достигнуто только за счет учета (индексирования) всего содержания максимально возможного числа web-страниц.» Они функционируют в автоматизированном режиме и имеют одинаковый принцип действия.

Поисковые системы выводят на экран ту информацию, в которой содержатся ключевые слова запроса. Язык запросов - это специальный набор команд, которые позволяют конкретизировать вводимое поисковой системе ключевое слово с применением простых логических методов обобщения. Уровень сервисных услуг, которые предоставляет поисковая система, обычно оценивается по двум критериям: первый – размер базы данных поисковой машины (т.к., чем больше база данных, тем большее сайтов известно данному поисковику, а значит, сам поиск точнее) и информативность выдаваемых результатов. Конечно, зарубежные поисковые машины, превосходят российские поисковые сервисы по размеру базы данных, т.к. они пытаются охватить весь мировой Интернет.

Кто пользуется поисковыми машинами?
Около 40 % жителей Америки ищут информацию с помощью поисковиков. Около115 млн. граждан США используют поисковые системы. Это является почти 80 % активного населения страны. В настоящее время Российский Интернет составляет менее 1% от мирового и охватывает около 2 млн. пользователей. Из всех пользователей процент людей, которые общаются на «ты» с поисковыми системами – не более 10 % общего населения. Но и эта немаленькая цифра неуклонно растет. Сеть увеличивается как по широте охвата, так и по объему хранящейся в ней информации, которая распределяется по миллионам компьютеров.

В последние времена в России становится наиболее популярным Google. Многие, как выясняется, не осведомлены, что Google - многоязычная поисковая система. Если набирать www.google.com, происходит перенаправление на www.google.ru, т.к. Google проверяя IP запрос, определяет, что это IP адрес провайдера из России и открывается русскоязычный раздел.

1.1. Определение «поисковая система»

По версии словаря терминов представленного на сайте Sitebrief.com:

«Поисковая система в Интернете – это программный комплекс, цель которого – обеспечить пользователю поиск нужной информации в Интернете».

Пользователь сети вводит запрос в строчку поиска, стартует поиск, после он получает список ссылок, соответствующих запросу. Самые популярные в России поисковые системы - Yandex, Rambler, Aport, Mail.ru, Google.

Наиболее общее определение:

поисковая система — веб-сайт, который предоставляет возможность поиска информации в Интернете.

Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet. Как правило, основной частью поисковой системы является поисковая машина (поисковый движок). Так называют комплекс программ, обеспечивающий её функциональность. Основными критериями качества работы поисковой машины являются релевантность (степень соответствия запроса и найденного), полнота базы, учёт морфологии языка. Индексация информации осуществляется специальными поисковыми роботами. Недавно появился новый тип поисковых движков, основанных на технологии RSS, а также среди XML-данных разного типа.

1.2. Составные компоненты поисковых систем

Поисковые системы обычно состоят из трех компонентов:

  • агент (паук или кроулер), который перемещается по Сети и собирает информацию; так же можно встретить и другие названия такие, как паук или кроулер
  • база данных, которая содержит всю информацию, собираемую пауками;
  • поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.
1.3. Основные параметры поисковых систем

К основным параметрам поисковых систем относятся:

  1. объем индексных файлов (число проиндексированных серверов и отдельных документов);
  2. степень оперативности обновления базы данных за счет включения сведений о новых материалах и удаления устаревших;
  3. возможности для составления запроса;
  4. интеллектуальность системы ранжирования результатов поиска;
  5. наличие дополнительных сервисных функций, облегчающих работу пользователя.

Первая величина является ключевой, устанавливает широту охвата материала и определяется числом проиндексированных документов. Сейчас эта цифра для лидеров мирового сетевого поиска колеблется в пределах от 2 до 4 с лишним миллиардов.
Возможности поискового механизма выражать запрос максимально точно в значительной степени предопределяют долю релевантных документов в перечне полученных результатов. Каждая машина имеет свою собственную лексику, которая по-разному позволяет детализировать поисковое предписание.
Все поисковые машины обладают модулем ранжирования результатов поиска. Создание таких модулей - целая область программирования, в которой конкурируют сложнейшие алгоритмы, созданные разными компаниями. Перечень факторов, принимаемых во внимание при определении места документа в перечне ссылок, необычайно широк: от местоположения слова на странице до рейтинга (авторитета) страниц, имеющих ссылки на найденный документ.
Не последнюю роль играет и простота интерфейса, наличие дополнительных сервисных функций, как, например, возможность перевода текста документа на иностранный язык, способность выделять все документы с определенного сайта, сужение критериев в ходе поиска, нахождение документов "по образцу" и т.д.

1.4. Работа механизмов поиска

Средства поиска и структурирования используются для того, чтобы помочь людям найти информацию, в которой они нуждаются. Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Интернет. Это специальные программы, которые занимаются поиском страниц в Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных. Каждый поисковый механизм имеет собственный набор правил, определяющих, как cобирать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют ссылки к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просматривать, прежде всего, наиболее популярные страницы.

  • Агенты - самые "интеллектуальные" из поисковых средств. Они могут делать больше, чем просто искать: они могут выполнять даже транзакции от Вашего имени. Уже сейчас они могут искать сайты специфической тематики и возвращать списки сайтов, отсортированных по их посещаемости.
  • Общий поиск информации в Сети осуществляют программы, известные как пауки. Пауки сообщают о содержании найденного документа, индексируют его и извлекают итоговую информацию. Также они просматривают заголовки, некоторые ссылки и посылают проиндексированную информацию базе данных поискового механизма.
  • Кроулеры просматривают заголовки и возращают только первую ссылку.
  • Роботы могут быть запрограммированы так, чтобы переходить по различным ссылкам различной глубины вложенности, выполнять индексацию и даже проверять ссылки в документе. Из-за их природы они могут застревать в циклах, поэтому, проходя по ссылкам, им нужны значительные ресурсы Сети.

Когда кто-либо хочет найти информацию, доступную в Интернет, он посещает страницу поисковой системы и заполняет форму, детализирующую информацию, которая ему необходима. Здесь могут использоваться ключевые слова, даты и другие критерии. Критерии в форме поиска должны соответствовать критериям, используемым агентами при индексации информации, которую они нашли при перемещении по Сети.
База данных отыскивает предмет запроса, основанный на информации, указанной в заполненной форме, и выводит соответствующие документы, подготовленные базой данных. Чтобы определить порядок, в котором список документов будет показан, база данных применяет алгоритм ранжирования. Поиск может считаться хорошим, если удастся найти необходимую информацию на одной из первых страниц результатов поиска. В этом смысле важную роль играет грамотная сортировка по релевантности.

Основные принципы определения релевантности:

  1. Количество ключевых слов запроса в тексте документа (т.е. в html-коде).
  2. Тэги, в которых эти слова располагаются.
  3. Местоположение искомых слов в документе.
  4. Удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа.
  5. Эти принципы применяются всеми поисковыми системами. Но есть еще и другие, которые используются в основном в зарубежных поисковых системах.
  6. Время - как долго страница находится в базе поискового сервера. Если же сайт существует довольно долго, значит, владелец весьма опытен в данной теме. И больше подойдет пользователю тот сайт, который два года распространяет, например, кулинарные рецепты, чем тот, который появился две недели назад с той же самой темой.
  7. Индекс цитируемости - как много ссылок на данную страницу ведет с других страниц, зарегистрированных в базе поисковика.

База данных выводит ранжированный подобным образом список документов с HTML и возвращает его человеку, сделавшему запрос. Различные поисковые механизмы также выбирают различные способы показа полученного списка - некоторые показывают только ссылки; другие выводят ссылки c первыми несколькими предложениями, содержащимися в документе или заголовок документа вместе с ccылкой. Когда Вы щелкаете на ссылке к одному из документов, который вас интересует, этот документ запрашивается у того сервера, на котором он находится.
Выдача результатов осуществляется с помощью специального модуля, который производит интеллектуальное ранжирование результатов. При этом берется в расчет местоположение термина в документе (название, заголовок, основной текст), частота его повторения, процентное соотношение искомого термина к остальному тексту страницы, а также число и авторитетность внешних ссылок на данную страницу с других сайтов.
Поиск иллюстраций поисковой системой зависит как от имени файла, так и от подписи, относящейся к этой иллюстрации.
Замечание: Существуют мета-поисковые системы предназначены для выполнения наиболее простых запросов (одно-два слова.
Но и в работе с поисковыми системами существует проблема. В своей статье А.В. Шаталов пишет: «Исследования показали, что пользователь может просмотреть не более 40 найденных в результате поиска материалов, а поисковые машины выдают порой сотни, тысячи, десятки и сотни тысяч ссылок, просмотреть которые в разумные сроки не представляется возможным». Это проблема, как правило, решается ужесточением условий поиска. Распространено мнение: “Лучше потратить значительное время на формулировку запроса. Зато получить выборку нужных документов”. Однозначно верная позиция, если пользователь ищет документ, в существовании которого в сети, абсолютно уверен. Если же нужная информация находится в распределенном виде в нескольких источниках, то точная формулировка запроса скорее всего даст возможность получить раннее подготовленную кем-то информацию по данной теме: обзоры, статьи.

1.5. Модели поиска

  1. Векторная модель.
  2. Самой первой моделью, которая присутствует сегодня во всех система, является векторная модель поиска. Её изобрёл Дж. Сэлтон в 60-х годах. Большинство машин работают по принципу наличия в релевантном документе всех терминов запроса, учета их встречаемости в документах и их средней языковой частотности. Эта модель используется при обработке запросов на естественном языке, особенно на поисковых страницах сайтов; она же применяется для поиска похожих документов.

  3. Булева модель.
  4. Активно используется булева модель поиска, которая позволяет вводить в запрос логические операторы, контекстные ограничения на расстояние между словами, строить разветвленные мощные запросы, использовать стоп-словарь и лексические шаблоны аналогично регулярным выражениям в скриптовых языках. Профессиональные системы, в дополнение к перечисленным базовым моделям, предоставляют поиск с использованием нечеткой булевой модели поиска, позволяющей поисковой машине доставлять документы, которые она считает релевантными, даже если некоторые «слабые» элементы запроса в них не встречаются.

  5. Поиск с использованием тезаурусов.
Для семантического поиска широко используются тезаурусы, за счет которых происходит расширение запроса. Например, при поиске документов по автотранспортным происшествиям, запрос «ДТП» имеет фактор расширения 1:150, т. е. из одной лексемы системой фактически генерируется 150 лексем для сервера поиска. Активное использование тезаурусов русского языка сдерживается сегодня отсутствием актуальных словарей синонимов.

1.6. Направления поиска

В одном из своих интервью Гари Флэйк (руководитель исследовательской лаборатории Yahoo!) сказал: «Если бы Web-поиск был совершенен, он бы выдавал ответ на каждый запрос, и это происходило бы так, будто на вопрос отвечает умнейший человек в мире, у которого есть под рукой вся справочная информация, и все это выполняется меньше, чем за мгновение». Пока же современные системы предоставляют визуальный интерфейс для анализа «препарированной» ими подборки документов.

  1. Навигация по сети.
  2. Альтернативным способом поиска является поиск объектов и их взаимосвязей, выделенных автоматически из текста документов в фазе ETL-процесса. Этот способ позволяет исследовать связи объектов из документов без указания контекстного критерия на фильтрацию документов. Например, можно произвести поиск взаимосвязей объекта «Чейни» с другими объектами (рис. 1). Это можно использовать для навигации к нужным объектам, для получения и анализа документов о связях этих объектов. Дальнейшее развитие методов анализа связей объектов связано с решением задач типизации связей между объектами. В свою очередь, их решение ограничено качеством синтаксических анализаторов русского языка и тезаурусов.

    Очень полезен метод навигации в подборке документов с использованием OLAP-технологии. Система «на лету» строит многомерное представление полученной подборки документов с измерениями из полей карточки: рубрики, авторы, дата публикации, источники. Аналитик может погружаться в элементы разных измерений (например, в регионы федерального округа), просматривать документы в ячейках с нужными значениями частот и др. Дополнительно могут использоваться общие методы анализа и прогноза данных. На рис. 3 показана схема получения списка публикаций из ячейки двумерного распределения публикаций по регионам и подрубрикам рубрики «Политика». Этот метод используется при анализе динамики публикаций и факторов, ее определяющих

  3. Автоматическое аннотирование.
Открытые источники информации делают доступными огромное количество публикаций и тем самым ставят проблему эффективной работы с большими объемами документов. Предоставление сжатого смысла первоисточников в виде аннотаций в несколько раз повышает скорость анализа. Однако, наш опыт показывает, что аннотации — статичный результат, он используется при анализе «бумажных» документов, а при анализе коллекций электронных документов более наглядное и структурированное представление содержания одного или коллекции электронных документов дает интерактивная семантическая карта взаимосвязей тем документов. Современные системы аналитической обработки текстовой информации обладают средствами автоматического составления аннотаций. При этом существует два подхода к решению этой задачи.

  1. В первом подходе программа-аннотатор извлекает из первоисточника небольшое количество фрагментов, в которых наиболее полно представлено содержание документа. Это могут быть предложения, содержащие термы запроса; фрагменты предложений с окружением термов несколькими словами и др. В более развитых системах выделяются предложения, прямо содержащие ключевые темы документа (но не кореферентные ссылки на них).
  2. В) При втором подходе аннотация представляет собой синтезированный документ в виде краткого содержания. Аннотация, сформированная в соответствии с первым подходом, качественно уступает получаемой при синтезе. Для повышения качества аннотирования необходимо решить проблему обработки кореферентных ссылок в русском языке. Еще одной проблемой, возникающей при синтезе аннотаций, является отсутствие средств семантического анализа и синтеза текста на русском языке, поэтому сервисы аннотирования ориентированы либо на узкую предметную область, либо требуют участия человека.

Большинство программ-аннотаторов построены по принципу выделения фрагментов текста. Так, исследовательская система eXtragon ориентирована на аннотирование Web-документов. Для каждого предложения документа вычисляется вес на основе информации о ключевых словах, значимых словосочетаниях, их месте в тексте и присутствии в запросе, после чего предложения ранжируются, и из нескольких фраз с максимальным весом составляется реферат. В системе «Аналитический курьер» аннотация документа автоматически формируется из его фрагментов, а ее объем зависит от главных тем документа и настроек. В аннотацию по объектам или проблемам могут включаться анафорические предложения документа. Кроме этого, имеется компонент создания общей аннотации на основе взаимосвязей тем в семантической сети этой подборки документов.

2. Компания

2.1. Выбор компании

Рассматривать основные принципы действия поисковых систем мы будем на конкретном примере. Для начала найдем популярную поисковую систему. Долгое время Yahoo! была лидером среди поисковых систем, ведь в 2001 году по ссылкам в поисковых результатах Yahoo! переходили почти 40% пользователей, в а через Google — всего лишь 11,93%. Сегодня же ситуация кардинально изменилась, хотя обе названные системы по-прежнему остались в числе лидеров: Google теперь используют для поиска информации свыше 41% посетителей, с некоторым отставанием за Google и Yahoo! следуют MSN и AOL (рис. 1, таблица 1).

Таблица 1. Топ поисковых систем для Интернет-пользователей
Поисковые системы Степень популярности ( %)
Google41,6
Yahoo!31,5
MSN27,4
Aol13,6
Ask Jeaves7
Overture5,1
My Way.com4,4
Information.com4
Lycos Networks3,7
WebSearch.com3,7
Info Space Networks3,1
Netscape Search3
Alta Vista2,7

Итак, первая по популярности в мире поисковая система, обрабатывающая более 40 миллиардов запросов в месяц – Google. Поисковой системой Google владеет корпорация Google Inc.


2.2. Миссия и цели компании Google

Миссия Google состоит в организации мировой информации, обеспечении ее доступности и пользы для всех.

Цели компании:
  1. Вывести обслуживание пользователей на еще более высокий уровень, предоставляя необходимую информацию всем, кто ее ищет: будь то офисный служащий в Бостоне, водитель на дорогах Бонна или турист, прогуливающийся по Бангкоку. С этой целью Google постоянно ищет новые методы и расширяет границы существующих технологий, чтобы предоставлять быструю, точную и простую в использовании службу поиска, доступ к которой можно получить всегда и везде. Предоставить пользователям максимально удобную и эффективную службу. Компания Google неизменно и последовательно отказывается вносить изменения, которые не принесут пользы посетителям сайта. Интерфейс прост и понятен.
  • Страницы загружаются мгновенно. Места в результатах поиска никогда и никому не продаются. Рекламные объявления на сайте должны предлагать релевантное содержание, а не отвлекать пользователя от поиска.

В качестве первого шага на пути к поставленным целям основатели Google Лэрри Пейдж и Сергей Брин разработали новый подход к веб-поиску, который быстро стал популярным среди пользователей Интернета во всем мире. Сегодня Google имеет широкое признание как одна из крупнейших в мире система поиска и представляет собой бесплатную и простую в использовании службу, обычно показывающую релевантные результаты поиска, для получения которых требуются меньше секунды. На веб-сайте www.google.com и на других доменов Google пользователи могут осуществлять поиск информации на разных языках, проверять котировки акций, искать карты и заголовки новостей или просматривать записи телефонных книг по каждому городу США… Кроме того, компания предоставляет возможность доступа ко всей этой информации, не заходя на главную страницу Google. Панель инструментов Google позволяет выполнять поиск Google из любого места в Интернете. Практичность и простота в использовании сделали Google одним из наиболее известных в мире брендов. Эту известность практически полностью обеспечили довольные пользователи. Основную прибыль компания Google получает от предоставления рекламодателям возможности размещения за умеренную плату веб-рекламы, которая соответствует информации, отображаемой на текущей странице. Это позволяет сделать рекламные объявления полезными и более эффективными. При этом Google не продает места в результатах поиска и не позволяет людям платить нам за то, чтобы их объявления получили более высокий рейтинг.

2.3. Технология работы поисковой системы Google

Что же мы знаем о работе компании Google?

Google – единственная компания, сосредоточившая свои усилия на разработке "идеальной поисковой системы", которая, по словам соучредителя компании Лэрри Пейджа, "точно определит, что подразумевает пользователь, и покажет именно те результаты, которые ему нужны". С этой целью Google непрестанно ищет новые методы и отказывается смиряться с ограничениями существующих технологий. В итоге Google разработала собственную инфраструктуру и революционную технологию PageRank, которая изменила подход к выполнению поиска.
С самого начала разработчики Google понимали, что для более быстрого получения наиболее точных результатов необходим новый способ настройки сервера. Большинство поисковых систем использовали несколько больших серверов, которые часто работали медленно при пиковых нагрузках. Компания Google задействовала связанные ПК, позволяющие быстро находить ответы на все запросы. Внедрение этой инновационной технологии привело к сокращению времени отклика, повышению масштабируемости и снижению расходов. С тех пор все остальные компании копируют эту идею, в то время как Google продолжает постоянно улучшать внутреннюю технологию с целью повышения ее эффективности.
Программное обеспечение, используемое для реализации технологии поиска Google, проводит ряд одновременных вычислений, которые занимают не больше доли секунды. Традиционные поисковые системы в большей степени основываются на том, как часто слово появляется на веб-странице. Google же изучает всю структуру веб-ссылок и определяет, какие страницы наиболее важны, с помощью PageRank. Затем проводится анализ соответствия гипертекста и выбор страниц, наиболее подходящих для конкретного поиска. На основании общей значимости и соответствия запросу Google отображает в первую очередь наиболее релевантные и достоверные результаты.
Технология PageRank: PageRank объективно оценивает значимость веб-страниц, основываясь на уравнении, включающем более 500 миллионов переменных и 2 миллиарда терминов. Вместо того, чтобы подсчитывать прямые ссылки, PageRank рассматривает ссылку со страницы А на страницу Б как голос в пользу страницы Б от страницы А. Затем по количеству полученных голосов PageRank определяет значимость данной страницы. PageRank также оценивает важность каждой страницы, принимающей участие в голосовании. При получении голосов от страниц с большей значимостью ссылка становится более ценной. Значимые страницы получают более высокий рейтинг PageRank и отображаются в начале результатов поиска. Технология Google использует совокупные интеллектуальные веб-средства, чтобы определить значимость страницы. Человеческий фактор или подтасовка результатов невозможны, и именно поэтому пользователи доверяют Google как источнику объективной информации, в результатах поиска которого отсутствуют проплаченные рекламные объявления.
Анализ соответствия гипертекста: поисковая система Google, как и другие системы, также анализирует содержание страницы. Однако вместо простого сканирования текста страницы (который может выполнить веб-издатель с помощью метатегов – HTML- или XHTML-теги, предназначенные для предоставления структурированных метаданных о веб-странице.) технология Google анализирует все содержание страницы, особенности шрифтов, разбивки текста и точное расположение каждого слова. Google также анализирует содержание соседних веб-страниц, чтобы убедиться в том, что полученные результаты наиболее точно соответствуют запросу пользователя.
Инновационные технологии Google распространяются не только на настольные ПК. Компания Google поставила перед собой задачу донести результаты своего точного и быстрого поиска до пользователей, работающих в Интернете через мобильные устройства. С этой целью Google разработала первую в своем роде технологию беспроводного поиска для мгновенного преобразования HTML в форматы, оптимизированные для WAP, i-mode, J-SKY и EZWeb. В настоящее время беспроводная технология Google используется множеством лидирующих на рынке компаний, включая AT & T Wireless, Sprint PCS, Nextel, Palm, Handspring и Vodafone.

2.4. Жизненный цикл запроса Google

Время поиска Google обычно занимает менее чем полсекунды, однако эта процедура включает в себя ряд действий, без которых результаты поиска не будут доставлены пользователю.

Этапы запроса Google:

  1. Веб-сервер отправляет запрос на серверы индексации. Содержимое серверов индексации соответствует содержанию в конце книги – в нем сообщается, на каких страницах представлены слова, соответствующие запросу.(Google Web Server - Index Servers)

  2. Запрос отправляется на серверы, которые осуществляют поиск хранящихся документов. Для описания каждого результата поиска создаются фрагменты (Index Servers - Doc Servers).

  3. Всего лишь доля секунды требуется для получения результатов поиска.(Doc Servers - Google User)

 

"Идеальная поисковая система, — говорит один из основателей компании Google Лэрри Пейдж (Larry Page), — точно определит, что подразумевает пользователь, и покажет именно те результаты, которые ему нужны". Учитывая текущий уровень развития технологии поиска, для этого нужно смотреть далеко вперед, проводить исследования, разработку и внедрение новейших методов работы. Google прилагает все усилия к тому, чтобы прокладывать новые пути в этой области. Несмотря на то, что Google уже признана ведущей компанией мира, занимающейся технологией поиска.

( Вся информация о компании взята с официального сайта Google Inc; http://www.google.com/corporate/)

3. Поисковая система Google

Google не только позволяет с легкостью получать доступ к миллиардам веб-страниц, но и предлагает множество специальных функций, которые помогут вам найти именно то, что нужно. Правда, Google ограничивает объем индексации части в документах в пределах 101 Кб. Ниже представлены некоторые из наиболее популярных функций поисковой системы Google.

1. Запросы на каждый день

  • Погода

Чтобы узнать погоду в каком-нибудь городе мира, введите в окне поиска слово "погода", а затем название города и страну (для городов США укажите город, штат и индекс).

  • Часовые пояса.

Чтобы узнать часовой пояс одного из множества городов мира, просто введите "часовой пояс" и название города в строку поиска.

2. Справочные инструменты.

  • Калькулятор.

Чтобы воспользоваться функцией встроенного калькулятора Google, просто введите в окно поиска вашу задачу.

  • Преобразование единиц измерения.

С помощью Google можно переводить единицы длины, веса, массы и т. п. из одной системы мер в другую. Просто введите нужные данные в окно поиска, а об остальном мы сами позаботимся.

3. Языковые инструменты

  • Словарные определения

Поиск Google позволяет найти определение слова в словарях или на других сайтах. Для поиска по словарям, напечатайте "define:", а затем слово или словосочетание. Чтобы посмотреть, как слово определяется на других сайтах, просто уберите двоеточие после "define". Поиск также можно осуществлять и по словосочетаниям.

  • Проверка правописания.

Программа проверки правописания Google автоматически проверяет орфографию запроса. Если обнаружится ошибка, появится строка "Возможно, вы имели в виду" и вам будет предложен самый распространенный вариант написания. Нажмите на этот вариант, чтобы запустить по нему поиск.

4. Локальный поиск.

Если вы ищете магазин, ресторан или другое местное предприятие, укажите в окне поиска вид организации и ее местоположение – и на этой же странице вы получите список подходящих организаций с контактной информацией, обзорами и картой.

  • Расписание киносеансов.

Чтобы найти рецензии на фильмы и расписание сеансов в близлежащих кинотеатрах, напечатайте слово фильмы (кино) или название идущего в кинотеатрах фильма в окне поиска. Если вы уже сохранили свое местоположение при предыдущем поиске, для выбранного фильма первыми будут показаны сеансы в кинотеатрах, расположенных неподалеку от вас.

5. Планирование поездки.

  • Конвертация валют.

Чтобы воспользоваться встроенной функцией конвертера валют, достаточно ввести данные в окно поиска Google – ответ появится прямо на странице результатов поиска.

  • Карты

Нужна карта? Напечатайте в окне поиска название улицы, города или страны и слово карта – и Google найдет соответствующую карту. Нажав на уменьшенное изображение, вы перейдете к ее полномасштабной версии на Картах Google.

6. Уточнение запроса.

  • Оператор Плюс (+)

Система Google игнорирует общие слова и символы, такие как "где" и "как", а также некоторые другие цифры и буквы, которые замедляют поиск, но никак не влияют на качество результатов. Если вам не обойтись без общего слова, поскольку от него зависят результаты поиска, поставьте перед ним знак плюс "+".

  • Подстановка слов.

Если вы не уверены, какие слова использовать в запросе, можно использовать подстановочный символ "звездочка". Он ставится на месте одного или нескольких слов, которые система должна подставить в ваш запрос.

3.1. Основные сведения о Поиске Google: Страница результатов поиска

На странице с результатами поиска находится море информации. Ниже предлагается краткое руководство по ее расшифровке. Каждый подчеркнутый элемент — это результат поиска, который поисковый сервер Google нашел по Вашему запросу. Первый элемент (не считая результатов поиска в новостях) является самым релевантным из найденных, второй — почти таким же релевантным, и так далее в нисходящем порядке. Нажав подчеркнутый элемент, можно перейти на соответствующую веб-страницу. Но сначала мы рассмотрим образец страницы с результатами поиска и дадим краткие разъяснения по разным типам информации, на ней представленным.

Расшифровка букв, указанных на рисунке, приведена ниже.

  1. Основные ссылки.
  2. Кнопка "Поиск". Эта кнопка позволяет ввести еще один запрос. Кроме того, это можно сделать, нажав клавишу "Enter".
  3. Расширенный поиск. Это ссылка на страницу, где можно выполнить более точно сформулировать запрос.
  4. Поле поиска. Чтобы выполнить поиск на сайте Google, достаточно просто ввести несколько слов, описывающих искомую информацию, а затем нажать клавишу "Enter" или кнопку "Поиск".
  5. Настройки. Это ссылка на страницу, где можно задать личные настройки поиска, включая язык и, число результатов на странице, а также настроить фильтр SafeSearch, чтобы исключить из результатов материалы "только для взрослых".
  6. Панель статистики. Здесь описывается поиск, указывается общее число результатов, а также время, затраченное на поиск.
  7. Совет. Эта информация помогает вести поиск более эффективно и плодотворно, поскольку описывает функции и инструменты Google, позволяющие оптимизировать запрос.
  8. Результаты OneBox. Типичные результаты OneBox — это новости, котировки акций, погода и местные веб-сайты, связанные с данным поиском.
  9. Название страницы. В первой строке любого результата указано название найденной веб-страницы. Если вместо названия указан URL, это значит, что у страницы нет названия, либо мы еще не просканировали ее содержание полностью, но ее рейтинг в нашем индексе говорит о том, что она в достаточной мере соответствует Вашему запросу.
  10. Фрагмент. Это описание страницы результатов или ее фрагмента, где условия запроса выделены полужирным шрифтом. Если мы расширили диапазон поиска за счет технологии поиска по основе слова, то полужирным шрифтом также выделяются все варианты запроса.
  11. URL результата. Веб-адрес полученного результата.
  12. Размер. Это число указывает на размер текстовой части веб-страницы и дает некоторое представление о том, насколько быстро она загрузится. Это значение указывается только для полностью проиндексированных сайтов.
  13. Из КЭШа. Нажав эту ссылку, можно посмотреть, как выглядела страница во время последнего индексирования. Если по какой-то причине ссылка на сайт не позволяет перейти на страницу с актуальными данными, для поиска необходимой информации можно воспользоваться версией, сохраненной в кэше.
  14. Похожие страницы. При нажатии ссылки "Похожие страницы" для определенного результата Google автоматически ищет веб- страницы, похожие на этот результат.
  15. Результат с красной строки. Когда Google находит несколько результатов на одном и том же веб-сайте, наиболее релевантный результат помещается на первой строке, а другие похожие страницы этого сайта выводятся под ним с отступом.
  16. Дополнительные результаты. Если с одного сайта было получено более двух результатов, оставшиеся результаты можно просмотреть, нажав кнопку "Дополнительные результаты с…"

К достоинствам поисковой системы Google относится также свойство учитывать запросы, состоящие из одной – двух букв, при условии наличия перед ними знака «+».

У поисковой системы Google есть свои недостатки. Одним из них является отсутствие возможности искать с его помощью мультимедиа файлы.

Hosted by uCoz

4. Заключение

Компьютерные технологии играют огромную роль в нашей жизни. Сегодня компьютер есть почти в каждом доме. Большую часть информации мы ищем в Интернете, без Всемирной паутины человек, как без рук. А для того, чтобы уверенно себя чувствовать в Глобальной сети Интернет люди пользуют поисковые системы. Их главная функция – предоставить пользователю ПК наиболее качественную информацию. Поэтому каждый пользователь сети должен знать, что это такое и как ими пользоваться. Компания Google предоставляет качественные услуги по поиску информации, но вы не обязательно должны пользоваться именно этой поисковой системой. Используйте ту поисковую машину, которая наиболее точно отражает Ваши запросы и позволяет наиболее быстро и полно получить требуемый результат. Не стоит обращать большое внимание на бренд, лучше попробовать все системы, и отобрать те, которые дают наилучшие для Вас результаты.

5. Список литературы

  1. Калинина А.Э. Интернет-бизнес и электронная коммерция: Учебное пособие. — Волгоград: Изд-во ВолГУ, 2004. — 148 с.
  2. Павел Храмцов "Поиск и навигация в Internet".
    http://www.osp.ru/cw/1996/20/12057/
  3. Журнал « КомпьютерПресс»
    http://www.compress.ru/article.aspx
  4. Статья «Эффективная технология работы с растущими потоками несистематизированной текстовой информации.» Шаталов А.В., Информбюро, Москва
    http://www.osp.ru/os/2006/06/2700556/_p3.html
  5. Интернет- учебник «Интернет в профессиональной информационной деятельности». 2002 - 2004 Вадим Степанов
    http://textbook.vadimstepanov.ru/index.html

Hosted by uCoz