Команда "Перезагрузка"
Четверг, 16 Май 2024, 18:23
Приветствую Вас Гость | RSS
 
Главная Каталог статей к урокамРегистрацияВход
Меню сайта
Категории
Материалы к урокам [15]
Презентации к урокам [1]
Видео к урокам [1]
Вход
Статистика
Всего пользователей: 16
Онлайн всего: 1
Гостей: 1
Пользователей: 0
Партнеры сайта
Соц. закладки
Главная » Статьи » Материалы к урокам

Поисковые системы
Поисковые системы

В Интернете имеется огромное количество полезной информации. Главная трудность при работе в сети – найти необходимый материал. Именно этим и занимаются поисковые системы. Наиболее популярны следующие:
1. "Рамблер" (http://rambler.ru). 
Поисковая машина "Рамблер" начала работу в октябре 1996 года, на стартовом этапе содержала всего 100 тысяч документов. "Рамблер" не был первой отечественной поисковой системой, однако в первый год своего существования (когда весь русский веб с приемлемой степенью правдоподобия индексировался "Рамблером", "Апортом", "Русской поисковой машиной", а также шведской и калифорнийской AltaVista) вынес основной груз поисковых запросов. Вторая версия "Рамблера" начала разрабатываться летом 2000 года, в марте нынешнего года приняла достаточно законченные очертания. В нее были введены функции, давно уже имевшиеся в конкурирующих системах. Она учитывает координаты слов, обучена строгой и нечеткой морфологии, связывает поиск с каталогом, в качестве которого используется Top100 (http://top100.rambler.ru/), группирует результаты поиска по сайтам, ищет по числам. Достаточно удачная архитектура продукта позволяет "Рамблеру" иметь для поисковика количество серверов в 2 раза меньшее, чем у "Яндекса", и в 3 раза меньшее, чем у "Апорта".
2. "Апорт" (http://aport.ru).
Поисковая машина "Апорт" была впервые продемонстрирована в феврале 1996 года на
пресс-конференции "Агамы" по поводу открытия "Русского клуба". Тогда она искала только по сайту russia.agama.com. Потом она начала искать по четырем, потом по шести серверам... Короче, день рождения и фактический старт системы сильно "размазались" по времени, а официальная презентация "Апорта" состоялась только 11 ноября 1997 года. К тому времени в 59
его базе был проиндексирован первый миллион документов, расположенных на 10 тысячах серверов. Создателем системы выступила компания "Агама" - разработчик программного обеспечения для платформы Windows, главным из которых являлся корректор орфографии "Пропись". Лингвистические разработки "Агамы" использовались при создании поисковой машины, в которой, скажем, в отличие от "Рамблера", изначально учитывалась морфология слов и осуществлялась по желанию клиента проверка орфографии запроса.
3. "Яндекс" (http://yandex.ru).
В 1996 году компанией CompTek, созданной со стопроцентным американским участием, на
выставке Internetcom было официально объявлено о существовании "Яндекса". Это была морфологическая приставка к "Альтависте", которую отличало быстродействие и умение строить гипотезы. Пословный индекс для незнакомых слов организован так же, как и для словарных - этим "Яндекс" отличается от других поисковиков. 23 сентября 1997 года "Яндекс" стал интернет-проектом. Релевантность документов вычислялась в зависимости от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и так далее. В октябре 1999 года в интервью "ИнфоБизнесу" Аркадий Волож указал: "Финансирование "Яндекса" всегда было не ниже сегодняшнего финансирования "Апорта". В результате, 6 июня 2000 года была
представлена вторая версия системы, а нынешняя версия функционирует с 23 мая 2001 года. Ее главное нововведение, которое потребовало неизбежной перестройки ядра, - ранжирование по ссылкам. Другие нововведения относятся, главным образом, к переформулированию системой запросов пользователя: "что такое предмет" преобразуется в "предмет - это...", а если запрос начинается на слово "как", то в результатах в первую очередь пытаются выдать FAQ или иной справочный документ. Новый "Яндекс" стал "понимать" альтернативную лексику, которая входит в 5 процентов запросов. Только в последней версии Яндекса индекс цитируемости стал непосредственно использоваться поисковой машиной [14]. В настоящее время "Яндекс" обладает самой полной базой документов среди русских искалок, а также самой узнаваемой маркой. Если мы посмотрим на рейтинг Российских поисковых систем (по данным SpyLog) (http://seop.ru/se_ratings.html), то увидим, что наибольшей популярностью пользуется именно Яндекс.
4. "Гугл” (http://google.ru).
Этот поисковик – один из самых молодых в Сети. Впервые о нем заговорили примерно в 2000 году. «Гуглу» удалось невероятное — к 2001 году он превратился из просто популярной поисковой машины в самую популярную, вытеснив с первого места знаменитую «Альтависту». И хотя сегодня доля запросов, которые проходят через Google, и остается меньше, чем у монстров-каталогов типа Yahoo, его лидерство — факт признанный и необсуждаемый. Яндекс Во многом популярность Google как раз и объясняется тем, что его поисковая база формировалась значительно позже, чем у его коллег: в результате она оказалась свободна от массивного балласта «мертвых» ссылок на давно не существующие странички. Ведь добавить страницу или сайт в базу можно за пару минут, а чтобы обновить информацию о нем, понадобятся месяцы... Внесли свою лепту и новый механизм индексирования страничек, и оригинальный алгоритм поиска — один из козырей Google. Результаты поиска по этой системе отличаются высокой степенью релевантности (соответствия результатов поиска реальному состоянию дел в Сети) — велика вероятность, что уже на первых строчках в списке результатов вы найдете ссылки на
нужные вам сайты. В отличие от других поисковых систем, в «первой десятке» Google, вы не встретите никакого информационного мусора и случайных сайтов: место сайта в списке напрямую связано с количеством ссылок на него с других серверов аналогичной тематики. Интересной особенностью Google является наличие второй кнопки рядом со строкой поиска. Если первая кнопка запускает традиционный механизм, то вторая кнопка сразу же перебросит пользователя на сайт, который, по мнению Google, максимально отвечает его запросам. И кстати, частенько этот прием срабатывает!


Если этих поисковых систем Вам покажется мало, то можно предложить следующие:

  • Yahoo! http://ru.yahoo.com
  • GoGo.Ru http://gogo.ru
  • MetaBot.ru http://metabot.ru
  • M.RU http://go.km.ru
  • Nigma http://nigma.ru
  • Alloy.Ru http://alloy.ru
  • Turtle Черепаха http://turtle.ru
  • Мамонт http://mmnt.ru
  • Лупа http://lupa.ru
  • Bing http://bing.com
  • RAGY http://ra-gu.net

Поисковые системы, специализирующиеся на поиске книг:

Российские поисковые системы доступны с сайта «Поисковые системы Интернета» (http://puler.ru).

Для поиска информации в специальном поле ввода поисковой системы вводят ключевое
слово или несколько слов. Различные поисковые системы при вводе одних и тех же ключевых слов могут давать разные результаты поиска. Например, на сайтах http://yandex.ru и http://rambler.ru, как правило, выдаются разные списки найденных по запросу пользователя сайтов. По этой причине не помешает использовать две и более поисковые системы для получения необходимой информации. При использовании поисковой системы мы часто получаем результат поиска на тысячах и миллионах страниц. Просмотреть все страницы невозможно, поэтому надо точнее составить запрос. Существенно ограничить количество найденных страниц – взять слова в кавычки. Тогда поисковая система ищет в точности такое словосочетание.

            Для более точного поиска существует язык запросов. Описание этого языка для поисковой системы «Яндекс» можно посмотреть на странице http://help.yandex.ru/search/?id=481939.

Согласно этому языку:
  • Ограничить поиск страницами, где слова запроса находятся в пределах предложения, вы можете, соединив слова оператором &.
  • Если вам нужны документы, где присутствуют заданные слова — неважно, на каком расстоянии и в каком порядке — соедините их оператором &&.
  • Вы можете указать максимально допустимое расстояние между двумя любыми словами запроса, поставив после первого слова символ /, сразу за которым идет число, означающее расстояние.
  • Если вы точно знаете не только расстояние, но и порядок слов запроса, в котором они должны идти в тексте интересных вам страниц, укажите между символом / и числом-расстоянием символ + для прямого порядка слов или - для обратного.
  • В некоторых поисковых задачах слова могут идти в разном порядке, причем между ними может быть от n слов (минимум) до m (максимум). Добавив между словами запроса оператор /(n m), вы получите интересующие вас страницы.
  • Вы можете указать Яндексу найти любое из заданных слов. Это полезно, например, когда для нужного вам термина есть много синонимов. Достаточно поставить между словами символ |, и вы получите страницы, где содержится хоть одно из слов запроса.
  • Яндекс позволяет исключать страницы, где есть определенные слова. Для этого используется оператор ~~, слева от которого вы пишите «что искать», а справа - какие страницы исключать из поиска.
  • Иногда допустимо, чтобы слово встречалось на странице, но нельзя, чтобы оно встретилось в том же предложении. С этой целью используйте оператор ~.
  • Вы можете строить сколь угодно сложные конструкции, подставляя в каждом из операторов вместо отдельного слова целые выражения. Чтобы Яндекс при этом правильно понимал вас, заключайте выражения в круглые скобки.
  • Все слова, которые вы приводите в запросе, по умолчанию ищутся с учетом морфологии. Чтобы отключить ее, используйте оператор ! перед словом (без пробела).
  • Если наличие в тексте слова обязательно, то поставьте перед ним без пробела знак +.
  • Если необходимо исключить документы, где встречается данное слово, то поставьте перед ним без пробела знак -.
           Для сохранения найденной Вами страницы нажмите в меню браузера Файл, далее – Сохранить как. В диалоговое окне запишите имя файла (можно оставить имя страницы по умолчанию), выберите директорию для сохранения и нажмите Сохранить. С сохранённой страницей можно работать в автономном режиме, т.е. без подключения к сети Интернет.
Категория: Материалы к урокам | Добавил: Cemnatasha (31 Май 2011)
Просмотров: 407 | Рейтинг: 0.0/0
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Поиск по сайту
Календарь
Праздники
Copyright MyCorp © 2024