Как выбрать поисковую систему
Поисковые системы интернета - список: все поисковики мира и России, какие есть и существуют, бывают кроме Яндекса и Гугла
Всем привет! Сегодня будет статья про поисковые системы мира, какие вообще существуют, когда появились, что рулит конкретно в России, а что на всём земном шаре. Статья получилась огромная, поэтому присаживайтесь поудобнее, желательно заранее приготовив термос с чаем 🙂
Для того чтобы стать специалистом в любом деле, недостаточно лайфхаков, какими бы полезными они ни были. Необходимо основательно разбираться в вопросе и постоянно расширять кругозор.
Думали ли вы о том, как появилось то, что мы используем каждый день? Какие есть поисковые системы помимо Google и Яндекса? И почему все сео-студии и люди выбирают именно последние? Да, но не нашли ответы? Они в этой статье.
Содержание статьи:
Пару слов из истории поисковиков
Очень давно, когда в Интернете все только начиналось…
Люди обходились малым, они сохраняли ссылки на сайты в «Закладках». Но время шло и вместе с ним увеличивалось количество этих самых закладок. В итоге человеку стало сложно разбираться в своей же системе.
Для того чтобы хоть немного навести порядок были разработаны каталоги Yahoo, DMOZ и т.д. К слову, некоторые из них не канули в лету до сих пор. Каталог – это что-то вроде библиотеки. В нем можно не только сохранять, но и разделять на группы ссылки на сайты.
Всемирная Сеть разрасталась с невероятной скоростью и каталоги перестали отвечать потребностям посетителей. Тогда программисты приступили к работе над поиском внутри каталогов, а потом и над первой поисковой системой.
Wandex – поисковая система-первопроходец
Поисковой системой, ставшей первопроходцем, является Wandex (нет, это не «отец» Яндекса, между ними нет никаких «родственных» связей). Она, как и все остальные поисковики, была настолько далека от идеала, что выдавала буквально все подряд, а не то, что больше всего подходит под запрос. Никаких алгоритмов ранжирования не было.
Первой системой, которая была создана для поиска информации в интернете, стала Wandex, ее уже не существует. Она была создана World Wide Web Wanderer – ботом на языке Perl, разработанным Мэтью Грэем из Массачусетского технологического института в 1993 году. Он также участвовал в создании Apache, разработке сайта MIT и других проектов. Сегодня Мэтью Грей является сотрудником компании Гугл.
В 1993 году во всем интернете было лишь 623 сайта, поэтому работы у Вандекса было поменьше, чем у современных поисковых систем. Более того, благодаря таким скромным меркам, для создания индексов и отображении результатов не нужны были мощные сервера с многоступенчатой кластеризацией, сложная работа алгоритмов поиска и способы по их оптимизации.
Wandex и другие первые сервисы обладали несовершенной системой поиска. При запросе слова они отображали не самые актуальные ссылки, а все страницы, их данные, без анализа и ранжирования. Поэтому некоторое время настоящими конкурентами поисковых систем были каталоги страниц – веб-площадки с вручную отобранными категориями ссылок на веб-источники.
Восстановление Вандекса
31 декабря 2011 года стало известно о возрождении этой системы. 1 января 2012 года поисковый бот World Wide Web Wanderer был зарегистрирован владельцами многих сайтов, что стало причиной для дискуссий. Сегодня на главной странице находится поисковая строка с надписью Wandex.
Буква Х изображена в виде перекрещенных линий, одна из которых имеет форму лупы – часто применяемый символ в поисковике.
Самые популярные поисковики Интернете в мире и России
Самые популярные поисковики может назвать даже школьник 1-го класса. Это Гугл и Яндекс. Можно дни и ночи напролет спорить о том, какой из них лучше. Но зачем? Они разные, и в какой из них заходить, зависит от ваших целей. Для вас я подготовил большой список из 16 поисковых систем, это практически все поисковики, которые есть на данный момент или существовали ранее.
Начнём с поисковых систем на русском языке и самых популярных в России, а затем перейдём к мировым.
Яндекс
Если верить тому, что пишут в LiveInternet, то именно Яндексу отдает предпочтение большая часть россиян. Впрочем, разница между ним и Гуглом составляет всего лишь один процент.
Среди тех, кто занимается созданием и SEO-продвижением сайтов, бытует мнение, что Яндекс заточен под коммерческие запросы, что в нем их в несколько раз больше, чем у конкурента. На мой взгляд, это очередной домысел. Как показывает практика, региональность определяет размер и структуру целевой аудитории.
История появления Яндекса началась в конце 1980-х – с создания поисковых технологий в компании Аркадия, которая потом вошла в группу CompTek. Создатели придумали несколько поисковых программ – Международный классификатор изобретений и поиск по Библии, учитывающий морфологию русского языка. Метод поиска получил название Яndex.
Первая активная версия поискового приложения под названием Yandex возникла в 1993 году, в 1995 году компьютеры компании-создатели поисковика были подсоединены к интернету, а в 1996 году стала велись работы по доработке методов поиска.
Официальным днем рождения поисковика Яндекс.ру является 23 сентября 1997 года. В этот день система была представлена на выставке Softool в Москве. Яндекс 1997 года учитывал морфологию русского языка, расстояние между словами и умел распределять документы на основе их релевантности заданному запросу.
В 1998 году на портале впервые возникла контекстная реклама – реклама, которая соответствует запросу потенциального пользователя. При таком методе показа рекламу видит только целевая аудитория. Контекстная реклама стала одним из важных ответов на вопросы пользователей, а в дальнейшем – главной бизнес-моделью компании Яндекс.
Компания Яндекс была основана в 2000 году. Ее учредителями стали акционеры КомпТек. Организация ru-Net Holdings вложила в Яндекс более 5 миллионов долларов, ее прибыль составила 35%. Среди акционеров были менеджеры Яндекса и ее главные разработчики поисковой системы.
Генеральным директором компании стал Аркадий Волож, а директором – Илья Сегалович – он же отвечал за внедрение и разработку технологий. Команда Яндекса состояла из 25 человек, а вся информация находилась на одном сервере.
В 2013 году российский поисковик Яндекс вышел на четвертое место в мире по количеству обрабатываемых запросов, обогнав Микрософт и уступив лидирующие места Гугл, Яху и Байду. Доход поиска Яндекса на отечественном рынке составляет 61,6%. Количество международной аудитории портала составляет 93,1 миллионов человек. Чистый доход компании за 2013 год вырос на 80%.
Гугл правит балом во всех странах мира, кроме России. Он пришел к нам относительно недавно, в 2004 году, когда Яндекс уже уверенно стоял на ногах.
Google распространился настолько, что слово «загуглить» стало нарицательным, им обозначают поиск чего-то в Интернете. Забавно, но когда я прошу маму что-то «загуглить», она все равно открывает Яндекс. Может быть, не догадывается, какие есть другие поисковые системы.
Компания Гугл впервые появилась в качестве развития научного проекта Ларри Пейджа и Сергея Брина. В 1996 году студенты Стэнфорда трудились над проектом цифровой библиотеки (SDLP). Он был целью Разработки новых технологий для общей, интегрированной и универсальной цифровой библиотеки. Финансирование осуществлялось за счет Национального научного фонда.
Чтобы найти тему для диссертации Пейдж рассматривал среди другой информации изучение математических свойств Интернета, представляя структуру ссылок в виде большого графа. Его научный руководитель, Терри Виноград, посоветовал ему выбрать эту идею (позже Пейдж отметил, что это был самый лучший совет, который он когда-либо получал), и он полностью погрузился в проблему выяснения, какие сайты ссылаются на эту страницу, рассматривая количество и характер обратных ссылок.
Скоро к нему присоединился аспирант Стэнфорда Сергей Брин, который был лучшим другом Пейджа. Вместе они создали алгоритм PageRank. После определения результатов BackRub, состоящих из списка URL, отсортированного по количеству обратных ссылок на этот URL, они поняли, что поисковик, созданный на PageRank, принесет им высокие результаты.
Такую технологию ранжирования страницы и ее рейтинга уже изучил Робин Ли, создавший в 1996 году маленькую поисковую систему RankDex. Данная технология была запатентована и применялась позже после основания Baidu в Китае.
Первое инвестирование в Гугл было зафиксировано в августе 1998 года в сумме 100 тысяч долларов от Энди Бехтольштейма, одного из разработчиков Sun Microsystems. Официально компания была зарегистрирована 4 сентября 1998 года в гараже друга в Менло-Парк, штат Калифорния. Имя Гугл возникло от слова «гугол», обозначающего цифру 1 и сто нолей. В конце 1998 года Гугл проиндексировал более 60 миллионов страниц.
На главной странице по-прежнему была отметка БЕТА, но поисковая система уже получала положительные отклики: показатели поиска Google были выше, чем у других систем, высокие технологические инновации, чем у перегруженных веб-порталов.
Поисковик Гугл привлекает огромное количество интернет-пользователей своим минимализмом и доступным интерфейсом. В 2000 году Гугл стала продавать рекламу, связанную с ключевыми запросами поиска. Реклама состояла из текста, поэтому не нагружала оформление страницы и не снижала скорость ее загрузки.
Ключевые запросы реализовывались на базе сочетания стоимости предложения и числа переходов, стоимость начиналась от 0,05$ за переход. Данная модель реализации рекламы по ключевикам была впервые предложена goto.com. В отличие от своих конкурентов, Гугл удалось выйти на новый рынок Интернета.
Те, кто находится в тени
Если вы, как и моя мама, не знаете, какие есть другие поисковые системы, то смотрите. Их много!
Доля Mail.ru небольшая, но она постепенно растет. В первую очередь, за счет почты, Одноклассников и других сервисов от этого поисковика.
История Мейл.ру началась в 1998 году, когда группа программистов из Питера разработала почтовый сервис mail.ru и отправила в интернет для тестирования. В мае 2005 года была создана компания mail.ru Group. Она продвигает общую интегрированную площадку коммуникационных и развлекательных интернет-сервисов.
Компания владеет лидирующим почтовым сервисом, одним из самых посещаемых площадок в Рунете, популярными социальными сетями – Вконтакте и Одноклассники, крупными играми Warface, Armored Warfare, Skyforge и Perfect World, сервисом maps.me – офлайн-картами и навигацией для мобильных гаджетов на базе OpenStreetMap, сервисом доставки еды Delivery Club, торговым местом китайской продукции Pandao.
Rambler
Rambler – одна из самых старых поисковых систем. Она могла стать самой популярной в Рунете, но не сложилось. Сейчас этот поисковик и не поисковик вообщем-то, а несколько сервисов, которые сделаны на движке Yandex.
Посещаемости Rambler могут позавидовать новички – она превышает один миллион человек в день.
У Rambler существует облегченная версия, называется Rambler Lite. В ней все тоже самое, только нет надоедливой рекламы, новостей и погоды.
В 1996 году был впервые создан поисковый сервер Рамблер. Поэтому годом открытия поисковой системы является эта дата. 8 октября, после успешного прохождения тестирования, Рамблер стал функционировать в качестве поисковой системы.
Данное название у поисковика возникло не случайно. При переводе с английского означает бродяга, что точно выявляет метод работы поисковика. Он безгранично бродит по интернету и самостоятельно собирает данные о всех найденных документах.
В 1997 году впервые появился рейтинг-классификатор Rambler’s Top100, который позволяет на базе объективной информации делать оценку популярности веб-ресурса. Появление такого счетчика способствовало оживлению среди веб-мастеров, которые стали уделять большее внимание качеству разрабатываемых сайтов.
Несмотря на то, что Рамблер считается самой старой поисковой машиной Интернета, он постоянно модернизируется. Новые версии поисковой машины позволяют намного поднять скорость поиска. Обновление поискового индекса осуществляется каждый день, что позволяет находить актуальные новости.
Рамблер постоянно модернизируется и остается одним из самых востребованных поисковиков. Пока пользователи интернета будут нуждаться в поиске нужной информации, данная система будет разгуливать по интернету и собирать важную информацию.
В 2011 году Рамблер полностью отказался от продвижения и поддержки собственного поиска. Он заключился соглашение с Яндексом. С этого момента он работает совместно с Яндексом и больше не является самостоятельной поисковой машиной.
Нигма
В настоящее время непросто удивить, но этой поисковой системе удалось. Nigma умеет решать задачи по математике и химии, а также предлагает поиск по музыке, играм, книгам и торрентам.
Нигма является интеллектуальной поисковой системой, разработанной российскими разработчиками Владимиром Чернышевым и Виктором Лавроненко. Все началось с их встречи в 2004 году, а потом началось плодотворное сотрудничество по созданию качественного нового проекта для Рунета.
Несмотря на то, что сервис применяет при выдаче источники самых популярных поисковиков, у нее есть очень много интересных задумок.
Как возник поиск от Нигма?
Эта поисковая система осуществляет поиск не только по собственному индексу, но и по индексам своих коллег – Яндекс, Яху, Рамблер, Бинг. Что касается Гугл, то в программе создания алгоритмов для Нигмы приняла участие в 2007 году профессор Стэндфордского университета Гектор Гарсия-Молина, который в свое время был научным руководителем основателей этого самого востребованного на сегодняшний день поисковика.
По состоянию на февраль 2009 года у Nigma в сумме индексов с привлекаемыми поисковыми системами было более 7 миллиардов документов. Это первая кластеризующая система Рунета, но давайте вместе разбираться.
Когда вы указываете запрос в поисковике, Нигма формирует перечень документов, разделяя его на кластеры. Каждое из их множество может быть отклонено, тогда поиск будет выполняться с высокой релевантностью. Например, запросы, полученные из интернет-магазинов, создают отдельный кластер – если вас не интересуют такие документы, то просто исключите их из результатов.
Возможности сервиса Nigma: математика, химия, музыка
Нигма.ру обладает своими уникальными характеристиками, например, применяет умные поисковые подсказки. Чтобы сориентироваться, поисковик выдает их еще на момент ввода самого запроса. Их условно можно разделить на три группы: короткие, точные запросы и энциклопедическая справка.
Нигма помогает быстро найти торрент-трекеры без регистрации и рекламных баннеров. Просто укажите название фильма и слово торрент для этого. Можно вместо этого указать скачать фильм с указанием его названия и также получить ссылки на источники torrent. Это очень интересная специализация, с помощью которой можно не потеряться в мире кинематографа.
Нигма еще имеет характернее особенности. Но более детально рассмотрим ее специализацию на решении разных задач по математике, химии, физике – это универсальный помощник для школьников.
Нигма-математика
Это сервис, с помощью которого можно в режиме онлайн решать разные математические задачи и воспроизв
vysokoff.ru
8 поисковиков, которые лучше, чем Google
1. DuckDuckGo
Что это
DuckDuckGo — это довольно известная поисковая система с открытым исходным кодом. Серверы находятся в США. Кроме собственного робота, поисковик использует результаты других источников: Yahoo, Bing, «Википедии».
Чем лучше
DuckDuckGo позиционирует себя как поиск, обеспечивающий максимальную приватность и конфиденциальность. Система не собирает никаких данных о пользователе, не хранит логи (нет истории поиска), использование файлов cookie максимально ограничено.
DuckDuckGo не собирает личную информацию пользователей и не делится ею. Это наша политика конфиденциальности.
Гэбриел Вайнберг (Gabriel Weinberg), основатель DuckDuckGo
Зачем это вам
Все крупные поисковые системы стараются персонализировать поисковую выдачу на основе данных о человеке перед монитором. Этот феномен получил название «пузырь фильтров»: пользователь видит только те результаты, которые согласуются с его предпочтениями или которые система сочтёт таковыми.
DuckDuckGo формирует объективную картину, не зависящую от вашего прошлого поведения в Сети, и избавляет от тематической рекламы Google и «Яндекса», основанной на ваших запросах. При помощи DuckDuckGo легко искать информацию на иностранных языках, тогда как Google и «Яндекс» по умолчанию отдают предпочтение русскоязычным сайтам, даже если запрос введён на другом языке.
DuckDuckGo →
2. not Evil
Что это
not Evil — система, осуществляющая поиск по анонимной сети Tor. Для использования нужно зайти в эту сеть, например запустив специализированный браузер.
not Evil не единственный поисковик в своём роде. Есть LOOK (поиск по умолчанию в Tor-браузере, доступен из обычного интернета) или TORCH (один из самых старых поисковиков в Tor-сети) и другие. Мы остановились на not Evil из-за недвусмысленного намёка на Google (достаточно посмотреть на стартовую страницу).
Чем лучше
Ищет там, куда Google, «Яндексу» и другим поисковикам вход закрыт в принципе.
Зачем это вам
В сети Tor много ресурсов, которые невозможно встретить в законопослушном интернете. И их число будет расти по мере того, как ужесточается контроль властей над содержанием Сети. Tor — это своеобразная сеть внутри Сети со своими социалками, торрент-трекерами, СМИ, торговыми площадками, блогами, библиотеками и так далее.
not Evil →
3. YaCy
Что это
YaCy — децентрализованная поисковая система, работающая по принципу сетей P2P. Каждый компьютер, на котором установлен основной программный модуль, сканирует интернет самостоятельно, то есть является аналогом поискового робота. Полученные результаты собираются в общую базу, которую используют все участники YaCy.
Чем лучше
Здесь сложно говорить, лучше это или хуже, так как YaCy — это совершенно иной подход к организации поиска. Отсутствие единого сервера и компании-владельца делает результаты полностью независимыми от чьих-то предпочтений. Автономность каждого узла исключает цензуру. YaCy способен вести поиск в глубоком вебе и неиндексируемых сетях общего пользования.
Зачем это вам
Если вы сторонник открытого ПО и свободного интернета, не подверженного влиянию государственных органов и крупных корпораций, то YaCy — это ваш выбор. Также с его помощью можно организовать поиск внутри корпоративной или другой автономной сети. И пусть пока в быту YaCy не слишком полезен, он является достойной альтернативой Google с точки зрения процесса поиска.
YaCy →
4. Pipl
Что это
Pipl — система, предназначенная для поиска информации о конкретном человеке.
Чем лучше
Авторы Pipl утверждают, что их специализированные алгоритмы ищут эффективнее, чем «обычные» поисковики. В частности, приоритетными источниками информации являются профили социальных сетей, комментарии, списки участников и различные базы данных, где публикуются сведения о людях, например базы судебных решений. Лидерство Pipl в этой области подтверждено оценками Lifehacker.com, TechCrunch и других изданий.
Зачем это вам
Если вам нужно найти информацию о человеке, проживающем в США, то Pipl будет намного эффективнее Google. Базы данных российских судов, видимо, недоступны для поисковика. Поэтому с гражданами России он справляется не так хорошо.
Pipl →
5. FindSounds
Что это
FindSounds — ещё один специализированный поисковик. Ищет в открытых источниках различные звуки: дом, природа, машины, люди и так далее. Сервис не поддерживает запросы на русском языке, но есть внушительный список русскоязычных тегов, по которым можно выполнять поиск.
Чем лучше
В выдаче только звуки и ничего лишнего. В настройках можно выставить желаемый формат и качество звучания. Все найденные звуки доступны для скачивания. Имеется поиск по образцу.
Зачем это вам
Если вам нужно быстро найти звук мушкетного выстрела, удары дятла-сосуна или крик Гомера Симпсона, то этот сервис для вас. И это мы выбрали только из доступных русскоязычных запросов. На английском языке спектр ещё шире.
Если серьёзно, специализированный сервис предполагает специализированную аудиторию. Но вдруг и вам пригодится?
FindSounds →
6. Wolfram|Alpha
Что это
Wolfram|Alpha — вычислительно-поисковая система. Вместо ссылок на статьи, содержащие ключевые слова, она выдаёт готовый ответ на запрос пользователя. Например, если ввести в форму поиска «сравнить население Нью-Йорка и Сан-Франциско» на английском, то Wolfram|Alpha сразу выведет на экран таблицы и графики со сравнением.
Чем лучше
Этот сервис лучше других подходит для поиска фактов и вычисления данных. Wolfram|Alpha накапливает и систематизирует доступные в Сети знания из различных областей, включая науку, культуру и развлечения. Если в этой базе находится готовый ответ на поисковый запрос, система показывает его, если нет — вычисляет и выводит результат. При этом пользователь видит только нужную информацию и ничего лишнего.
Зачем это вам
Если вы, например, студент, аналитик, журналист или научный сотрудник, то можете использовать Wolfram|Alpha для поиска и вычисления данных, связанных с вашей деятельностью. Сервис понимает не все запросы, но постоянно развивается и становится умнее.
Wolfram|Alpha →
7. Dogpile
Что это
Метапоисковик Dogpile выводит комбинированный список результатов из поисковых выдач Google, Yahoo и других популярных систем.
Чем лучше
Во-первых, Dogpile отображает меньше рекламы. Во-вторых, сервис использует особый алгоритм, чтобы находить и показывать лучшие результаты из разных поисковиков. Как утверждают разработчики Dogpile, их системы формирует самую полную выдачу во всём интернете.
Зачем это вам
Если вы не можете найти информацию в Google или другом стандартном поисковике, поищите её сразу в нескольких поисковиках с помощью Dogpile.
Dogpile →
8. BoardReader
Что это
BoardReader — система для текстового поиска по форумам, сервисам вопросов и ответов и другим сообществам.
Чем лучше
Сервис позволяет сузить поле поиска до социальных площадок. Благодаря специальным фильтрам вы можете быстро находить посты и комментарии, которые соответствуют вашим критериям: языку, дате публикации и названию сайта.
Зачем это вам
BoardReader может пригодиться пиарщикам и другим специалистам в области медиа, которых интересует мнение массовой аудитории по тем или иным вопросам.
BoardReader →
В заключение
Жизнь альтернативных поисковиков часто бывает скоротечной. О долгосрочных перспективах подобных проектов Лайфхакер спросил бывшего генерального директора украинского филиала компании «Яндекс» Сергея Петренко.

Сергей Петренко
Бывший генеральный директор «Яндекс.Украины».
— Что касается судьбы альтернативных поисковиков, то она проста: быть очень нишевыми проектами с небольшой аудиторией, следовательно без ясных коммерческих перспектив или, наоборот, с полной ясностью их отсутствия.
Если посмотреть на примеры в статье, то видно, что такие поисковики либо специализируются в узкой, но востребованной нише, которая, возможно только пока, не выросла настолько, чтобы оказаться заметной на радарах Google или «Яндекса», либо тестируют оригинальную гипотезу в ранжировании, которая пока не применима в обычном поиске.
Например, если поиск по Tor вдруг окажется востребованным, то есть результаты оттуда понадобятся хотя бы проценту аудитории Google, то, конечно, обычные поисковики начнут решать проблему, как их найти и показать пользователю. Если поведение аудитории покажет, что заметной доле пользователей в заметном количестве запросов более релевантными кажутся результаты, данные без учёта факторов, зависящих от пользователя, то «Яндекс» или Google начнут давать такие результаты.
«Быть лучше» в контексте этой статьи не означает «быть лучше во всём». Да, во многих аспектах нашим героям далеко до Google и «Яндекса» (даже до Bing далековато). Но зато каждый из этих сервисов даёт пользователю нечто такое, чего не могут предложить гиганты поисковой индустрии. Наверняка вы тоже знаете подобные проекты. Поделитесь с нами — обсудим.
Читайте также 🧐
lifehacker.ru
Как выбрать поисковую систему для браузера
- Подробности
- Категория: Интернет
- Опубликовано 21.05.2015 13:54
- Просмотров: 499
Дорогие посетители сайта GeoDum.ru!
Какая самая популярная операция в вашем браузере? Наверное, это поиск. Если еще нет, то вы многое теряете. Ведь Интернет — это бесконечное море, даже океан разнообразной информации на все вкусы и случаи жизни. И этим надо пользоваться. Как пользоваться — почитайте одну из старых статей на этом сайте «Поиск информации в сети Интернет».
Сегодня же я хочу показать вам, как выбрать или заменить поисковую систему по умолчанию в вашем браузере. И сделаю это на примере двух наиболее распространенных браузеров — Google Chrome и Mozilla Firefox.
Google Chrome
Открываем Настройки браузера, нажав на значок в правом верхнем углу и в конце видимой части страницы видим настройку поиска:
Открываем раскрывающийся список и выбираем нужную нам систему. Можно и иначе. Кликаем на Настроить поисковые системы и видим такое окно:
В нем по умолчанию видим, к примеру, Google. Если нам нужна другая система, например, Яндекс, кликаем по соответствующей строке и возникает выбор ее по умолчанию.
Mozilla Firefox
Опять же находим в верней строке значок Настройки и кликая по нему, поучаем окно настроек. Выбираем вкладку Поиск и перед нами возможность выбора одной из представленных в раскрывающемся списке поисковых систем как системы по умолчанию. Если вас не интересуют некоторые из возможных систем, можете снять птичку в окне ниже и они временно исчезнут из раскрывающегося списка.
Если же вам нужны еще какие-то системы, то внизу есть ссылка Добавить другие поисковые системы.
Вот и вся премудрость. Еще раз напоминаю, что наилучшими из поисковых систем в данное время являются, без сомнения, Яндекс для русскоязычной части Интернета и Google - для англоязычного (хотя последний имеет и русскоязычный интерфейс и включает базу данных и по Рунету). Что касается Рунета, то доля Яндекса в нем сейчас (в мае 2015 года) составляет примерно 57%, доля Гугла - около 34%.
Именно в поисковых системах проявляется все величие и мощь Интернета. Эти системы ежедневно получают миллионы запросов и выдают на них адреса сайтов, на которых имеются ответы на эти запросы, отсортированные по их релевантности (степени соответствия запросу).
Удачного вам поиска!
Удачи вам, до новых встреч на страницах моего сайта.
Чтобы не пропустить ничего из публикуемых материалов, вы можете подписаться на одну из RSS лент: Все новости сайта, Новости раздела «Сказки Старого Юзера» или Новости раздела «Мир Андроида».
Чтобы быть в курсе новинок сайта, рекомендую подписаться на периодическую еженедельную почтовую рассылку «Сказки Старого Юзера» на портале Subscribe.ru.
geodum.ru
структуры, функция, характеристики. Что нужно знать о поисковиках для успешного продвижения сайтов?
Поисковые системы (ПС) уже давно являются обязательной частью интернета и нашей повседневной жизни. Сегодня они громадные и сложнейшие механизмы, которые представляют собой не только инструмент для нахождения любой необходимой информации, но и довольно увлекательные сферы для бизнеса.
Многие пользователи поиска никогда не думали о принципах их работы, о способах обработки пользовательских запросов, о том, как построены и функционируют данные системы. Данный материал поможет людям, которые занимаются оптимизацией и продвижение своих сайтов, понять устройство и основные функции поисковых машин.
Функции и понятие ПС
Поисковая система – это аппаратно-программный комплекс, который предназначен для осуществления функции поиска в интернете, и реагирующий на пользовательский запрос который обычно задают в виде какой-либо текстовой фразы (или точнее поискового запроса), выдачей ссылочного списка на информационные источники, осуществляющейся по релевантности. Самые распространенные и крупные системы поиска: Google, Bing, Yahoo, Baidu. В Рунете – Яндекс, Mail.Ru, Рамблер.Рассмотрим поподробнее само значение запроса для поиска, взяв для примера систему Яндекс.
Запрос обязан быть сформулирован пользователем в полном соответствии с предметом его поиска, максимально просто и кратко. К примеру, мы желаем найти информацию в данном поисковике: «как выбрать автомобиль для себя». Чтобы сделать это, открываем главную страницу и вводим запрос для поиска «как выбрать авто». Потом наши функции сводятся к тому, чтобы зайти по предоставленным ссылкам на информационные источники в сети.
Но даже действуя таким образом, можно и не получить необходимую нам информацию. Если мы получили подобный отрицательный результат, нужно просто переформировать свой запрос, или же в базе поиска действительно нет никакой полезной информации по данному виду запроса (такое вполне возможно при заданных «узких» параметров запроса, как, к примеру, «как выбрать автомобиль в Туле»).
Самая основная задача каждой поисковой системы – доставить людям именно тот вид информации, который им нужен. Приучить же пользователей создавать «правильный» вид запросов к поисковым системам, то есть фразы, которые будут соответствовать их принципам работы, практически, невозможно.
Именно поэтому специалисты-разработчики поисковиков делают такие принципы и алгоритмы их работы, которые бы давали пользователям находить интересующие их сведения. Это означает, что система, должна «думать» так же, как мыслит человек при поиске необходимой информации в интернете.
Когда он вводит свой запрос в поисковую машину, он желает найти то, что ему надо, как можно проще и быстрее. Получив результат, пользователь составляет свою оценку работе системы, руководствуясь несколькими критериями. Получилось ли у него найти нужную информацию? Если нет, то сколько раз ему пришлось переформатировать текст запроса, чтобы найти ее? Насколько актуальная информация была им получена? Как быстро поисковая система обработала его запрос? Насколько удобно были предоставлены поисковые результаты? Был ли нужный результат первым, или находился на 30-ом месте? Сколько «мусора» (ненужной информации) было найдено вместе с полезными сведениями? Найдется ли актуальная для него информация, при использовании ПС, через неделю, либо через месяц?

Для того чтобы получить правильные ответы на подобные вопросы, разработчики поиска постоянно улучшают принципы ранжирования и его алгоритмы, добавляют им новые возможности и функции и любыми средствами пытаются сделать быстрее работу системы.
Основные характеристики поисковых систем
Обозначим главные характеристики поиска:Полнота.
Полнота является одной из главнейших характеристик поиска, она представляет собой отношение цифры найденных по запросу информационных документов к их общему числу в интернете, относящихся к данному запросу. Например, в сети есть 100 страниц имеющих словосочетание «как выбрать авто», а по такому же запросу было отобрано всего 60 из общего количества, то в данном случае полнота поиска составит 0,6. Понятно, что чем полнее сам поиск, тем больше вероятность, что пользователь найдет именно тот документ, который ему необходим, конечно, если он вообще существует.Точность.
Еще одна основная функция поисковой системы – точность. Она определяет степень соответствия запросу пользователя найденных страниц в Сети. К примеру, если по ключевой фразе «как выбрать автомобиль» найдется сотня документов, в половине из них содержится данное словосочетание, а в остальных просто есть в наличии такие слова (как грамотно выбрать автомагнитолу, и установить ее в автомобиль»), то поисковая точность равна 50/100 = 0,5.Чем поиск точнее, тем скорее пользователь найдет необходимую ему информацию, тем меньше разнообразного «мусора» будет встречаться среди результатов, тем меньше найденных документов будут не соответствовать смыслу запроса.
Актуальность.
Это значимая составляющая поиска, которую характеризует время, проходящее с момента опубликования информации в интернете до занесения ее в индексную базу поисковика.К примеру, на следующий день после возникновения информации о выходе нового iPad, множество пользователей обратилась к поиску с соответствующими видами запросов. В большинстве случаев информация об этой новости уже доступна в поиске, хотя времени с момента ее появления прошло очень мало. Это происходит благодаря наличию у крупных поисковых систем «быстрой базы», которая обновляется несколько раз за день.
Скорость поиска.
Такая функция как скорость поиска теснейшим образом связана с так называемой «устойчивостью к нагрузкам». Ежесекундно к поиску обращается огромное количество людей, подобная загруженность требует значительного сокращения времени для обработки одного запроса. Тут интересы, как поисковой системы, так и пользователя целиком совпадают: посетитель хочет получить результаты как можно быстрее, а поисковая система должна отработать его запрос тоже максимально быстро, чтобы не притормозить обработку последующих запросов.Наглядность.
Наглядное представление результатов является важнейшим элементом удобства поиска. По множеству запросов поисковая система находит тысячи, а в некоторых случаях и миллионы разных документов. Вследствие нечеткости составления ключевых фраз для поиска или его не точности, даже самые первые результаты запроса не всегда имеют только нужные сведения.Это значит, что человеку часто приходится осуществлять собственный поиск среди предоставленных результатов. Разнообразные компоненты страниц выдачи ПС помогают ориентироваться в поисковых результатах.
История развития поисковых систем
Когда интернет только начал развиваться, число его постоянных пользователей было небольшим, и объем информации для доступа был сравнительно невеликим. В основном доступ к этой сети имели лишь специалисты научно-исследовательских сфер. В то время, задача нахождения информации не была столь актуальна как сейчас.Одним из самых первых методов организации широкого доступа к ресурсам информации стало создание каталогов сайтов, причем ссылки на них начали группировать по тематике. Таким первым проектом стал ресурс Yahoo.com, который открылся весной 1994-ого года. Впоследствии когда количество сайтов в Yahoo-каталоге существенно увеличилось, была добавлена опция поиска необходимых сведений по каталогу. Это еще не было в полной мере поисковой системой, так как область такого поиска была ограничена только сайтами, входящими в данный каталог, а не абсолютно всеми ресурсами в интернете. Каталоги ссылок весьма широко использовались раньше, однако в настоящее время, практически в полной мере утратили свою популярность.
Ведь даже сегодняшние, громадные по своим объемам каталоги имеют информацию о незначительно части сайтов в интернете. Самым известным и большим каталогом в мире был DMOZ (прекратил работу 14 марта 2017 года) имеет информацию о пяти миллионах сайтов, когда база Google содержит информацию о более чем 25 миллиардов страниц.

Самой первой настоящей поисковой системой стала WebCrawler, возникшая еще в 1994-ом году.
В следующем году появились AltaVista и Lycos. Причем первая была лидером по поиску информации очень длительное время.

В 1997-ом году Сергей Брин вместе с Ларри Пейджем создал машину поисковую Google как исследовательский проект в Стэндфордском университете. Сегодня именно Google, самая востребованная и популярная поисковая система в мире.

В сентябре 1997-ом году была анонсирована (официально) ПС Yandex, которая в настоящий момент является самой популярной системой поиска в Рунете.

Доля поисковых систем
По данным на апрель 2020 года, доли поисковых систем в мире распределены следующим образом:- Google — 70,83 %;
- Bing — 12,61 %;
- Baidu — 11,83 %;
- Yahoo! — 2,30 %;
- Яндекс — 1,41 %;
- DuckDuckGo — 0,42 %;

- Яндекс - 59,10%
- Google - 38,85%
- Поиск.Mail.ru - 1,18%
- Rambler - 0,07%
- Остальные - 0,80%
Принципы работы поисковой системы
В России главной системой поиска является Яндекс, затем Google, а потом Поиск@Mail.ru. Все большие системы поиска имеют свою структуру, которая весьма отличается от других. Но все-таки можно выделить общие для всех поисковиков основные элементы.Модуль индексирования.
Данный компонент состоит из трех программ-роботов:Spider (по англ. паук) – программа которая предназначена для того чтобы скачивать веб-страницы. «Паук» скачивает определенную страницу, одновременно извлекая из нее все ссылки. Скачивается код html практически с каждой страницы. Для этого роботы используют HTTP-протоколы.

«Паук» функционирует следующим образом. Робот передает запрос на сервер “get/path/document” и иные команды запроса HTTP. В ответ программа-робот получает поток текста, который содержит информацию служебного вида и, естественно, сам документ.
Извлекаются все ссылки из тэгов. Вместе с ними обрабатывают редиректы. Любая скачанная страница сохраняется в таком формате:
- URL скаченной страницы;
- дата, когда осуществлялось скачивание страницы;
- заголовок http-ответа сервера;
- html-код, «тела» страницы.
Crawler, исследуя найденные ссылки, ищет новые документы, еще не ставшие известными поисковой системе.
Indexer (робот-индексатор) – это программа, анализирующая страницы, которые скачали пауки.

Индексатор полностью разбирает страницу на составные элементы и проводит их анализ, применяя свои морфологические и лексические виды алгоритмов.
Анализ проводится над разнообразными частями страницы, такими как заголовки, текст, ссылки, стилевые и структурные особенности, теги html и др.
Таким образом, модуль индексирования дает возможность проходить по ссылкам заданного количества ресурсов, скачивать страницы, извлекать ссылочную массу на новые страницы из полученных документов и делать подробный их анализ.
База данных
База данных (или индекс поисковика) - комплекс хранения данных, массив информации в котором сохраняются определенным образом переделанные параметры каждого обработанного модулем индексации и скачанного документа.Поисковый сервер
Это самый важный элемент всей системы, потому что от алгоритмов, лежащих в основе ее функциональности, прямо зависит скорость и, конечно же, качество поиска.Поисковый сервер работает следующим образом:
- Запрос, который идет от пользователя подвергается морфологическому анализу. Информационное окружение любого документа, имеющегося в базе, генерируется (оно и будет в дальнейшем отображаться как сниппет, т.е. информационное поле текста соответствующего данному запросу).
- Полученные данные передают как входные параметры специализированному модулю ранжирования. Они обрабатываются по всем документам, и в итоге для каждого такого документа рассчитывается свой рейтинг, который характеризует релевантность такого документа запросу пользователя, и иных составляющих.
- В зависимости от условий заданных пользователем этот рейтинг вполне может быть подкорректирован дополнительными.
- Затем генерируется сам сниппет, т.е. для любого найденного документа из соответствующей таблицы извлекают заголовок, аннотацию, наиболее отвечающую запросу, и ссылка на этот документ, при этом найденные словоформы и слова подсвечивают.
- Результаты полученного поиска передаются осуществившему его человеку в виде страницы, на которую выдают поисковые результаты (SERP).
uniofweb.ru
Поисковые системы мира: ТОП-10
Поисковые системы мира: ТОП-10
1. Google
Ожидаемо Гугл занял первое место в мировом рейтинге. На его долю приходится более 70% поисковых запросов от жителей со всех уголков Земли. Причем треть всего трафика google.com приходится на граждан США. Кроме того, Гугл является самым посещаемым сайтом в мире. Средняя ежедневная продолжительность использования поисковой системы Гугл составляет 9 минут.
Преимуществом поисковика Гугл является отсутствие лишних элементов на странице. Лишь строка поиска и логотип компании. Фишкой являются анимированные картинки и браузерные игры, приуроченные к популярным и локальным праздникам.
2. Bing
Бинг — поисковая система от Microsoft, ведущая свою историю с 2009 года. С этого момента она стала обязательным атрибутом смартфонов на ОС Windows. Bing также отличает минимализм — помимо шапки с перечнем всех продуктов Microsoft, на странице расположена лишь поисковая строка и название системы. Наиболее популярен Бинг в США (31%), Китае (18%) и Германии (6%).
3. Yahoo!
Третье место закрепилось за одним из старейших поисковиков — Яху. Основная масса пользователей также проживает в США (24%). Складывается впечатление, что весь остальной мир сознательно избегает помощи поисковых роботов… Также поисковик популярен в Индии, Индонезии, Тайване и в Великобритании. Помимо строки поиска, на странице Yahoo! предлагается прогноз погоды в вашем регионе, а также мировые тренды в виде ленты новостей.
4. Baidu
Китайский поисковик, который в России снискал дурную славу. Из-за агрессивной политики и отсутствия перевода на русский или английский языки, расширения этой поисковый системы воспринимаются в качестве вирусов. Их очень сложно удалить до конца и избавиться от всплывающих окон с иероглифами. Тем не менее, этот сайт является четвертым в мире по посещаемости. 92% его аудитории составляют граждане Китая.
5. AOL
AOL — американская поисковая система, чье название расшифровывается как America Online. Ее популярность значительно ниже, чем у предыдущих систем. Ее рассвет приходился на 90-е и 00-е годы. Почти 70% аудитории АОЛ — жители Соединенных Штатов.
6. Ask.com
У этой поисковой системы, ведущей свою историю с 1995, довольно необычный интерфейс. Все запросы она воспринимает в качестве вопросов и предлагает варианты ответов в соответствии с поисковой выдачей. Это чем-то напоминает сервис Ответы.Мэйл. Однако в выдачу попадают не ответы любителей, а полноценные статьи. За последний год сайт потерял около 50 позиций в мировом рейтинге самых популярных интернет-ресурсов и на сегодняшний день занимает лишь 104 место.
7. Excite
Этот поисковик ничем не примечателен, и похож на массу других сайтов. Он предлагает пользователям массу сервисов (таких, как Новости, Почта, Погода, Путешествия и т.д.) Интерфейс сайта также вызывает воспоминания о вэбе 90-х гг и, можно предположить, мало изменился с тех пор.
8. DuckDuckGo
Разработчики сразу предупреждают, что данная поисковая система не отслеживает ваши действия в сети. В наши дни это является весомым аргументом при выборе поисковика. Дизайн сайта выполнен в современной манере, использует яркие краски и забавные картинки. В отличие от других поисковых машин, «утиный поисковик» переведен на русский язык. За последний год сайт отыграл около 400 позиций и в марте 2017г. находится на 504 строчке рейтинга популярности Alexa.
9. WolframAlpha
Отличительной чертой этого поиска является многообразие вспомогательных сервисов, рассчитанных на запросы, связанные с теми или иными знаниями. То есть, в выдаче вы не увидите ссылок на посты в соцсетях или статьи желтой прессы. Вам предложат конкретные цифры и проверенные факты в форме единого документа. Этот браузер идеально подходит школьникам и студентам.
10. Yandex
Поисковик, наиболее популярный в России и странах СНГ. Кроме того, около 3% аудитории сайта являются жителями Германии. Сайт примечателен большим количеством сервисов на все случаи жизни (музыка, радио, расписание общественного транспорта, недвижимость, переводчик и пр.) Также ресурс предлагает большой выбор индивидуального оформления сайта, а также настройку виджетов «под себя». Яндекс занимает 31 место в мире по популярности, потеряв 11 позиций за последний год.
Читайте далее: Где скачать книги бесплатно: ТОП электронных библиотек.
9186748.ru
Поисковые системы Интернета, список Топ 14 лучших поисковиков
[contents]
Мы рассмотрим поисковые системы Интернета, список лучших поисковиков в этой статье. Возможно Вы ещё новичок и не определились, какую именно поисковую систему использовать для поиска информации и работы в Интернете. С помощью этого обзора, Вы точно будете знать, какой поисковик лучше.
Что такое поисковая система в Интернете
Здравствуйте друзья! Существуют огромное количество поисковых систем в Интернете. Они исполняют только одну цель – поиск той или иной информации в Сети. В основном новички ещё не знают, что такое поисковая система в Интернете. Поэтому, подробно об этом расскажу.
Поисковая система – это программно-аппаратный комплекс для поиска различной информации (текст, видео, музыка, картинки, книги). Функции этой системы предназначены для поиска нужной информации, для любого пользователя Интернета.
Например, человек хочет найти какую-нибудь книгу. И вводит поисковый запрос в поисковой строке – «Скачать книги бесплатно». Так же можно написать её название. После этого, мы как обычно нажимаем «Enter» или на значок поиска «Найти» (Скрин 1).
Результат поиска нам выдал 12 000 000 результатов. Выбирать можно любой из них. Вот именно так и работает поисковая система. Дальше, мы будем рассматривать поисковые системы Интернета, список по рейтингу всех основных поисковых систем. Для безопасной работы в Сети, вероятно Вас могут заинтересовать несколько поисковиков, которые будут служить Вам для удобной и комфортной работы в Интернете.
Поисковые системы Интернета, список 2019 года
Перед тем, как пополнить поисковые систем списком, сделаем для начала небольшой обзор на топ 14 лучших поисковых систем 2019 года.
- Поисковая система Google. Она является самой популярной и известной во всём мире в том числе США и Европе.
- Поиск Яндекс. Эта российская поисковая система. В основном она имеет популярность в русскоязычном Интернете.
- Bing. Данный поиск в Интернете был разработан компанией Майкрософт. Его часто используют в США, Германии, и в Китае.
- Поисковик Yahoo. Данная поисковая «машина» Интернета не так популярна в России, как например в странах Индии, США, Индонезии и так далее.
- Китайская поисковая система Baidu. Этим поисковиком пользуются только китайцы. Поскольку у него полностью отсутствует перевод на русский язык.
Низкие по рейтингу поисковые системы
- AOL. Название данного поисковика Америка Онлайн. Это американский поисковик.
- ASK.COM. Такая поисковая система, немного похожа на ресурс Ответы Мейл ру. Только в виде ответов выдаёт полноценные статьи.
- EXCITE. Эта поисковая система, включает в себя не только поиск, но и различные сервисы. Например, Новости, погода, с помощью него можно узнать в какие страны ездят отдыхать и так далее.
- DuckDuckGo. Такая поисковая система позволяет пользователям «сидеть в Интернете» в приватной зоне.
- WOLFRAM ALPHA. Данный поисковик очень хорошо подойдёт студентам. Поскольку он выдаёт информацию на основе различных знаний и поможет Вам написать студенческие работы.
- Спутник. Поисковая система в основном предназначена для поиска в Рунете. Она потеряла свою популярность, поскольку ею никто не пользуется. Но со временем, на неё должны перейти государственные служащие.
- TUT BY. Поисковик относится к белорусской поисковой системе.
- Рамблер. Это встроенный поисковик в систему поиска Яндекса.
- MIL.RU. Русскоязычная поисковая система. Она популярна и её посещают не более чем 54 000 000 пользователей Рунета.
Итак, мы рассмотрели лучшие поисковые системы Интернета, список, которых Вы можете посмотреть здесь (Скрин 2).
Далее, мы эти поисковые системы разберём ещё подробнее.
Обзор поисковых систем Интернета
Выше мы сделали небольшое описание поисковых систем. А здесь, хотелось бы Вам рассказать о них немного подробно. Когда их создали, и какие у них плюсы и минусы:
- Google. Эта поисковая система была создана в США в 1998 году. Её создали программисты Сергей Брин и Ларри Пейдж. Сейчас она включает в себя более 25 миллиардов веб-сайтов и её используют 200 миллионов пользователей из разных стран мира. Плюсы этой поисковой системы в том, что можно найти качественную информацию быстрее, чем не качественную. Минусы – нагрузка на компьютер, так как частое обновление Гугла нагружает оперативную память компьютера.
- ЯНДЕКС. Её создали в 1997 году. Создатели этой поисковой системы – Аркадий Волож и Илья Сегалович. Занимает второе место по популярности в России. Плюсов у этой системы много и из них – использование электронной почты, кошелька Яндекс деньги, и быстрый доступ к любой информации. Компания установила фильтры поиска, но это не спасает пользователей посещать сомнительные сайты в Интернете. Это один главный минус и недостаток этого поисковика.
- YAHOO. Поисковик является более старым из всех поисковых систем, которые мы рассматриваем. Его создание принято считать в 1995 году, предпринимателями Джерри Янгом и Дэвидом Филом. Он является достаточно крупным Интернет порталом и у него есть только один минус – не устанавливается на компьютер, а используется через браузер.
- MAIL.RU. Эту поисковую систему организовали в 1998 году. Её авторы и создатели – Евгений Голанд и Владимир Шутов. Этот портал принадлежит крупной компании – Мейл Ру Групп. Так же включает в себя популярные проекты: Одноклассники, Вконтакте, Мой мир. Пользоваться этим поисковиком удобно. Но минусы в том, что электронная почта от Мейл не имеет хорошей защиты от взлома и нередко браузеры заражаются вирусной рекламой от этой системы.
- BING. Она была создана в 2009 году. Эта поисковая система работает, как на компьютерах, так и на Смартфонах. В большинстве случаев, ей выгодно пользоваться на телефонах, это считается её главным преимуществом.
Менее популярные поисковые системы
- DUCKDUCK.GO. Наличие поисковика на компьютере, позволит Вам использовать его в полной мере и вместе с этим сохранить свои конфиденциальные данные. Её создал предприниматель Гэбриель Вайнберг в 2006 году. Эта система не сохраняет во время поиска кэш и историю браузера.
- СПУТНИК. Как было уже сказано выше, это поисковая система пока ещё не всеми используется. Её создали в 2014 году, и создателем считают компанию Ростелеком. Эту поисковую систему, планирует использовать государство.
- РАМБЛЕР. Самый известный в Рунете поисковый портал. Создатель портала Дмитрий Крюков – 1996 год. Он существовал до 2011 года, и сейчас по-прежнему работает в полной мере, как поисковая система.
- BAIDU. Данную китайскую поисковую систему основали в 2000 году, предприниматели – Робин Ли и Эрик Сю. Этим поисковиком пользуется только китайское население. К нему очень негативное отношение во многих странах из-за рекламного вируса и нет возможности перевода языка.
- TUT BY. Данная поисковая система была создана в Белоруссии в 2000 году. Его основал журналист Сергей Дмитриев. Посещаемость поисковика уже превышает более 2 000 000 пользователей в этой стране.
Известные поисковики за рубежом
- AOL (Американская поисковая система). Была разработана в США в 90-е годы. У неё довольно слабая популярность среди пользователей. Работают с поисковиком, в основном, жители Америки.
- ASK.COM. Создание поисковой системы принято считать в 1995 году. Чтобы пользоваться этой системой, достаточно лишь внести в поисковую строку какой-либо вопрос, и она выдаст результаты. Её поиск распределяет результаты по порядку, и всегда можно найти необходимую информацию и качественную.
- ECITE. Данная поисковая машина, особо ничем от других не отличается. Сайт был запущен в 1994 году и в данный момент принадлежит компании IAC Search Media. Этот сервис может предлагать пользователям различную информацию в виде обмена быстрыми сообщениями, отправка писем по электронной почте, и имеет полную настройку домашней страницы в браузере.
- Wolfram Alpha. Он был запущен в Интернет – 15 мая 2009 года. Имеет огромную базу знаний, и мощные вычислительные алгоритмы для нахождения этой информации в поиске.
Итак, эти поисковые системы на сегодняшний день самые лучшие. Думаю, Вы сможете выбрать для себя подходящий вариант. Часто приходиться использовать несколько поисковиков для эффективного поиска нужной информации.
Заключение
В статье мы рассмотрели вопрос, какие есть поисковые системы Интернета, список этих поисковых систем в том числе. Возможно Вы заинтересуетесь одной из них, или будете использовать несколько. Выбирайте только те, которые имеют защиту и приватные настройки. Ведь работа и поиск в Интернете должны быть максимально безопасны. Спасибо и удачи!
С уважением, Иван Кунпан.
Просмотров: 4167
biz-iskun.ru
СРАВНЕНИЕ ПОИСКОВЫХ СИСТЕМ ЯНДЕКС И GOOGLE
Павел, руководитель компании
вопросы: +7 (922) 849-81-44
Вы хотите продвинуть свой сайт в интернете, но не знаете, в какой поисковой системе это лучше делать? Не знаете, чем они отличаются? Не знаете, как работают алгоритмы поисковых машин? Для ответа на все эти вопросы я подготовил небольшое сравнение поисковых систем.
В основном я буду рассматривать Google и Yandex, как мирового и регионального лидера среди поисковиков. Поскольку Rambler и Mail в оболочке используют поисковый механизм Google, мы коснемся их лишь вскользь.
1. Немного истории
Развитие поисковых систем в Рунете началось с 1996-го года. Решение создать отечественный аналог поисковой машины Rambler, было принято из-за плохого восприятия кириллицы зарубежными поисковиками и слабого индексирования страниц Рунета.
Яндекс был впервые представлен в 1997-м году на выставке программного обеспечения Softool. Уже к середине 1999-го года Yandex был в семерке самых популярных сайтов Рунета.
Интересным фактом для сравнения поисковых систем будет то, что Google появился после отечественных аналогов Rambler и Yandex. Поисковик Google был создан в 1998-м году студентами Стэнфордского университета.
Кстати, Сергей Брин – один из основателей Гугла – родился в Москве в семье математиков. Поэтому можно сказать, что наиболее известные поисковые системы были созданы русскими людьми.
На данный момент Yandex является самой популярной поисковой системой в России. В Украине и Беларуси первое место занимает Google. Доля остальных поисковых индексов не занимает больше 5% рынка (лидируют среди них Rambler и Mail).
2. С кем вам приятнее коротать вечера, с Google и Yandex?
Знайте, что работа этих корпораций не останавливается на развитии поисковых «движков». Помимо поиска они предоставляют множество других услуг в разных сферах IT-технологий. Вот некоторые из них:
Направление | Особенности Google | Особенности Yandex |
---|---|---|
Браузер | GoogleChrome. Минимализм, скорость и функционал – три качества этого браузера. Многие считают, что здесь Google даже перестарался с минимализмом: стандартного набора функций под рукой юзера катастрофически мало. Но их можно добавить через настройки браузера. | Яндекс.Браузер. Хорошо «заточен» под планшеты и мобильные устройства. Пока не может похвастаться таким набором функций, как «Хром», но старается работать в этом направлении. |
Почтовый и облачный сервисы | Gmail и GoogleDrive. Преимущества: 15 ГБ бесплатного пространства, удобное редактирование документов на сервере. | Яндекс.Почта и Яндекс.Диск. 10 ГБ бесплатного пространства, более удобный почтовый сервис. |
Видео | YouTube. Любимое детище Google. Сайты с интегрированным видео из YouTube лучше индексируются и продвигаются в Google | Яндекс.Видео. Сервисом пока пользуются неохотно, поэтому его нельзя назвать полноценным конкурентом YouTube. |
Статистика сайта | GoogleAnalytics. Мощный функционал, широкая сегментация счетчиков: от посещения и отказов, до конверсии и прогноза продаж. | Яндекс.Метрика. Понятный и удобный интерфейс, возможность отправки отчетов по SMS. |
Разумеется, это не все сервисы, разработанные компаниями Google и Yandex, их более 50. Я просто не смогу в рамках одной статьи расписать их полностью. Есть огромное количество дополнений: начиная с контекстной рекламы, заканчивая погодой. И все они имеют свои особенности. По мне, так надо пользоваться обеими системами. Мне, к примеру, очень удобно пользоваться диском от Гугла для онлайн редактирования таблиц и графиков, но большие объемы информации надежнее хранить и распространять через Яндекс.Диск.
2.1. Что еще полезно знать по продвижению сайтов
3. Возможности и особенности поиска
Обе поисковые системы имеют шикарный функционал в запросах, выдаче результатов и поисковых фильтрах.
Вот некоторые особенности поиска:
Направление | Google.com. | Yandex.com. |
---|---|---|
Главная страница | Отличается минимализмом. На главной странице только эмблема и строка поиска. | На главной странице добавлены информативные блоки: новостная лента, телепрограмма, погода. |
Интерактивность | Справа от поиска по запросу высвечиваются карты, краткое описание определений. При поиске известных людей и фильмов вверху выдаются картинки родственных запросов. | Достаточно мощная интерактивность, но хуже, чем у Гугла. При выдаче известных мест, например, стадионов, не отображаются отзывы и карта места. |
Конкуренция при продвижении | Общая конкуренция при продвижении здесь выше, поскольку в день Google индексирует на порядок больше страниц, чем Яндекс. | Конкуренция среди сайтов Рунета почти такая же, как и у Google. |
Преимущества |
|
4. Особенности продвижения в поисковых системах
Продвижение в поисковых системах Google и Yandex сильно отличается. Для сравнения, в Яндексе упор делается на поведенческие факторы: время пребывания на странице и процент отказов (посещений лишь одной страницы сайта).
Для Google важны качественные внешние ссылки: обзоры, аналитика, ссылка из полезного источника.
У поисковиков сложная задача: из тысяч найденных страниц выдать 10 наиболее подходящих. Как определить эти страницы и правильно их ранжировать – вопрос, над которым бьется не одно поколение разработчиков.
В настоящее время на выдачу результатов влияют такие факторы:
- Текстовый фактор: точность совпадения фразы как в заголовке, так и на странице, язык и тематика статьи.
- Ссылочный фактор: цитируемость страницы и ресурса в целом, источник обратной ссылки, PageRank.
- Статистический фактор: посещаемость сайта, популярность запроса.
На ранжирование страницы также влияет возраст сайта, его привязка к региону, тематика и другие факторы.
Для продвижения сайта в Яндексе, первым делом нужно улучшить качество контента и юзабилити ресурса. Для Гугла придется закупать качественные ссылки с подробными обзорами и полезным материалом.
5. Основные алгоритмы поиска и ранжирования сайтов
Поиском в Яндексе занимается алгоритм MatrixNet, который автоматически сканирует и индексирует страницы сайтов.
Алгоритмов ранжирования в Яндексе более 800. Все они учитывают такие факторы:
- Уникальность и полезность контента. Яндекс очень не любит плагиат, поэтому сайт, на котором распространен копипаст может быстро попасть под фильтр и не выводиться в результаты поиска.
- Структура информации. Важно, чтобы каждая страница была в зоне досягаемости 3 кликов.
- Скорость работы. Время загрузки сайта и отклика на запросы также имеет значение для поисковика.
- Цитируемость. Внешние ссылки важны для хорошего ранжирования.
- Наличие или отсутствие спама. Слишком частый повтор ключевых слов может «похоронить» страницу для Яндекса. Оптимальное значение плотности ключей – 3-5%.
- Надежный хостинг. Безопасный и постоянно доступный сервер имеет значение для ранжирования сайта.
Интересно, что Яндекс внедрил алгоритм, прозванный в народе «Бандитом». Это система, подмешивающая в результаты поиска страницы с более низким рейтингом, для получения статистики по таким результатам и обеспечения ротации материала.
Поиск в Google обеспечивает алгоритм Googlebot. Для мобильных устройств и индекса картинок используются различные разновидности этой программы. Googlebot тоже не любит молодые сайты возрастом до 3 месяцев. Для них есть специальный фильтр Sandbox, который не позволяет «молодняку» выбиться в ТОП 10 по ВЧ запросам. При индексации учитывается возраст сайта, а не домена.
Googlebot имеет два индекса: основной и supplemental index, «сопли». Первый индексирует и ранжирует сайты, учитывая фильтры и санкции. Второй индексирует все страницы подряд и выдает неликвидные результаты только при расширенном поиске.
Для ранжирования страниц используется система расчета PageRank. Суть ее заключается в своеобразном голосовании интернет-ресурсов. Если сайт Х разместил ссылку на сайт Y, то он, выражаясь простым языком, проголосовал за него. Чем больше «голосов» получает страница, тем популярнее и релевантнее она становится. Такие страницы попадают в топ Гугла.
В идеале, чтобы повысить популярность своего сайта, необходимо наполнить страницы интересным материалом, на который люди захотят сделать ссылки.
Но поскольку этот подход порождает множество злоупотреблений, поисковик оснастили системой по распознанию мошенника и наложению санкций на такой сайт.
6. Санкции поисковых систем
Сравнение поисковых систем интернета было бы неполным без рассмотрения системы наказаний для SEO-нарушителей. Из-за обилия оптимизаторов, желающих в кратчайшие сроки вывести сайт в топы выдачи поиска с помощью хитростей без улучшения качества ресурса, поисковые машины разработали систему наказания для каждого вида махинаций.
Санкции можно сгруппировать по тематике нарушения.
Вид | Нарушение | Наказание | Yandex | |
---|---|---|---|---|
Текстовые | Переспам ключевых слов | Наложение фильтра на ключевые слова | Фильтр Panda | Фильтр АГС |
Переоптимизация | Уменьшение релевантности сайта | Фильтр Over Optimizzation | Фильтр АГС | |
Ссылочные | Резкое возрастание ссылочной массы | Штраф для продвигаемого сайта. Доноры помечаются, как штрафники, что влияет на их цитируемость. | Фильтр «Too Many Links at once» | Фильтр АГС |
Спам в анкорах | Понижение позиций сайта | Пингвин Google | «Минусинск» Яндекса | |
Ссылочный спам | Понижение позиции либо блокировка сайта для выдачи | Пингвин Google | «Минусинск» Яндекса | |
Поведенческая накрутка | Накликивание с разных IP-адресов | Понижение ранга сайта | Фильтр Panda | Фильтр АГС |
«Взрослый» контент | Размещение порнографических материалов | «Adult-фильтр» и блокировка в выдаче результатов | Adult-фильтр | Adult-фильтр |
Реклама | Назойливая реклама либо ее переизбыток | Понижение релевантности и позиций сайта | Фильтр Panda | Фильтр АГС |
Качество информации | Отсутствие либо низкое качество информации | Понижение позиций сайта | Фильтр Panda | Фильтр АГС |
Партнерки | Сайты, направленные на размещение партнерских ссылок | Понижение релевантности сайта-донора | Пингвин Google | «Минусинск» Яндекса |
Обман поисковой системы |
| Блокировка выдачи поиска | Фильтры «-30», Panda | Фильтр АГС |
Система санкций поисковых машин совершенствуется с каждым обновлением. Это качественно новая стадия борьбы с поисковыми мошенниками.
7. Какую поисковую систему выбрать для оптимизации
В первую очередь нужно учитывать регион, в котором проживает целевая аудитория сайта. Для Ru-, Ua- и Bel-нета лучше продвигать ресурс в обеих поисковых системах: и Google, и Yandex. Обе системы делят по 50% аудитории.
Стоит учитывать бюджет кампании по продвижению ресурса. Если для Яндекса можно ограничиться внутренней оптимизацией и улучшением качества материала на сайте, то для Гугла придется покупать внешние ссылки. А это дорогое удовольствие.
Тем не менее Яндекс – это довольно непредсказуемая система. Каждое обновление может принести настолько кардинальное изменение, что придется пересматривать всю структуру работы над сайтом.
Оптимизаторы моей веб студии имеют значительный опыт продвижения сайтов в Яндексе и в Гугле. Если вы хотите, чтобы ваш сайт был в ТОПе выдачи поисковых систем, я предлагаю воспользоваться нашими услугами. Вы не пожалеете.
8. Заключение
Продвижением ресурса в Google нужно заняться обязательно. Это мировой лидер среди поисковых машин. Кроме того, каждый год появляются новые поисковики, копирующие алгоритмы Гугла.
Если вы продвигаете сайт в Рунете – оптимизируйте его, в том числе, и под Яндекс. Это очень удобная поисковая система, ежегодно привлекающая миллионы новых пользователей.
9. Кейсы по продвижению
СРАВНЕНИЕ ПОИСКОВЫХ СИСТЕМ ЯНДЕКС И GOOGLE
www.seocom.ru
Поисковая система — Википедия
Поиск информации во Всемирной паутине был трудной и не самой приятной задачей, но с прорывом в технологии поисковых систем в конце 1990-х годов осуществлять поиск стало намного удобнейПоиско́вая систе́ма (англ. search engine) — алгоритмы и реализующая их совокупность компьютерных программ, предоставляющая пользователю возможность быстрого доступа к необходимой ему информации при помощи поиска в обширной коллекции доступных данных[1]. Одно из наиболее известных применений поисковых систем — веб-сервисы для поиска текстовой или графической информации во Всемирной паутине. Существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, информацию в группах новостей Usenet.
Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос[2]. Работа поисковой системы заключается в том, чтобы по запросу пользователя найти документы, содержащие либо указанные ключевые слова, либо слова, как-либо связанные с ключевыми словами[3]. При этом поисковая система генерирует страницу результатов поиска. Такая поисковая выдача может содержать различные типы результатов, например: веб-страницы, изображения, аудиофайлы. Некоторые поисковые системы также извлекают информацию из подходящих баз данных и каталогов ресурсов в Интернете.
Поисковая система тем лучше, чем больше документов, релевантных запросу пользователя, она будет возвращать. Результаты поиска могут становиться менее релевантными из-за особенностей алгоритмов (см. «Пузырь фильтров»[⇨]) или вследствие человеческого фактора[⇨]. По состоянию на 2015 год самой популярной поисковой системой в мире является Google, однако есть страны, где пользователи отдали предпочтение другим поисковикам. Так, например, в России «Яндекс» обгоняет Google больше, чем на 10 %[⇨].
По методам поиска и обслуживания разделяют четыре типа поисковых систем: системы, использующие поисковых роботов, системы, управляемые человеком, гибридные системы и мета-системы[⇨]. В архитектуру поисковой системы обычно входят:
- поисковый робот, собирающий информацию с сайтов сети Интернет или из других документов,
- индексатор, обеспечивающий быстрый поиск по накопленной информации, и
- поисковик — графический интерфейс для работы пользователя[⇨].
На раннем этапе развития сети Интернет Тим Бернерс-Ли поддерживал список веб-серверов, размещённый на сайте ЦЕРН[4]. Сайтов становилось всё больше, и поддерживать вручную такой список становилось всё сложнее. На сайте NCSA был специальный раздел «Что нового!» (англ. What's New!)[5], где публиковали ссылки на новые сайты.
Первой компьютерной программой для поиска в Интернете была программа Арчи[en] (англ. archie — архив без буквы «в»). Она была создана в 1990 году Аланом Эмтэджем (Alan Emtage), Биллом Хиланом (Bill Heelan) и Дж. Питером Дойчем (J. Peter Deutsch), студентами, изучающими информатику в университете Макгилла в Монреале. Программа скачивала списки всех файлов со всех доступных анонимных FTP-серверов и строила базу данных, в которой можно было выполнять поиск по именам файлов. Однако, программа Арчи не индексировала содержимое этих файлов, так как объём данных был настолько мал, что всё можно было легко найти вручную.
Развитие и распространение сетевого протокола Gopher, придуманного в 1991 году Марком Маккэхилом (Mark McCahill) в университете Миннесоты, привело к созданию двух новых поисковых программ, Veronica[en] и Jughead[en]. Как и Арчи, они искали имена файлов и заголовки, сохранённые в индексных системах Gopher. Veronica (англ. Very Easy Rodent-Oriented Net-wide Index to Computerized Archives) позволяла выполнять поиск по ключевым словам большинства заголовков меню Gopher во всех списках Gopher. Программа Jughead (англ. Jonzy's Universal Gopher Hierarchy Excavation And Display) извлекала информацию о меню от определённых Gopher-серверов. Хотя название поисковика Арчи не имело отношения к циклу комиксов «Арчи»[en], тем не менее Veronica и Jughead — персонажи этих комиксов.
К лету 1993 года ещё не было ни одной системы для поиска в вебе, хотя вручную поддерживались многочисленные специализированные каталоги. Оскар Нирштрасс (Oscar Nierstrasz) в Женевском университете написал ряд сценариев на Perl, которые периодически копировали эти страницы и переписывали их в стандартный формат. Это стало основой для W3Catalog, первой примитивной поисковой системы сети, запущенной 2 сентября 1993 года[6].
Вероятно, первым поисковым роботом, написанным на языке Perl, был «World Wide Web Wanderer» — бот Мэтью Грэя (Matthew Gray) из Массачусетского технологического института в июне 1993 года. Этот робот создавал поисковый индекс «Wandex». Цель робота Wanderer состояла в том, чтобы измерить размер всемирной паутины и найти все веб-страницы, содержащие слова из запроса. В 1993 году появилась и вторая поисковая система «Aliweb». Aliweb не использовала поискового робота, но вместо этого ожидала уведомлений от администраторов веб-сайтов о наличии на их сайтах индексного файла в определённом формате.
JumpStation[en], [7] созданный в декабре 1993 года Джонатаном Флетчером, искал веб-страницы и строил их индексы с помощью поискового робота, и использовал веб-форму в качестве интерфейса для формулирования поисковых запросов. Это был первый инструмент поиска в Интернете, который сочетал три важнейших функции поисковой системы (проверка, индексация и собственно поиск). Из-за ограниченности ресурсов компьютеров того времени индексация и, следовательно, поиск были ограничены только названиями и заголовками веб-страниц, найденных поисковым роботом.
Первой полнотекстовой индексирующей ресурсы при помощи робота («craweler-based») поисковой системой, стала система «WebCrawler»[en], запущенная в 1994 году. В отличие от своих предшественниц, она позволяла пользователям искать по любым словам, расположенным на любой веб-странице — с тех пор это стало стандартом для большинства поисковых систем. Кроме того, это был первый поисковик, получивший широкое распространение. В 1994 году была запущена система «Lycos», разработанная в Университете Карнеги-Меллон и ставшая серьёзным коммерческим предприятием.
Вскоре появилось множество других конкурирующих поисковых машин, таких как: «Magellan»[en], «Excite», «Infoseek»[en], «Inktomi»[en], «Northern Light»[en] и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими как «Yahoo!». Но поисковые возможности каталогов ограничивались поиском по самим каталогам, а не по текстам веб-страниц. Позже каталоги объединялись или снабжались поисковыми роботами с целью улучшения поиска.
В 1996 году компания Netscape хотела заключить эксклюзивную сделку с одной из поисковых систем, сделав её поисковой системой по умолчанию на веб-браузере Netscape. Это вызвало настолько большой интерес, что Netscape заключила контракт сразу с пятью крупнейшими поисковыми системами (Yahoo!, Magellan, Lycos, Infoseek и Excite). За 5 млн долларов США в год они предлагались по очереди на поисковой странице Netscape[8][9].
Поисковые системы участвовали в «Пузыре доткомов» конца 1990-х[10]. Несколько компаний эффектно вышли на рынок, получив рекордную прибыль во время их первичного публичного предложения. Некоторые отказались от рынка общедоступных поисковых движков и стали работать только с корпоративным сектором, например, Northern Light[en].
Google взял на вооружение идею продажи ключевых слов в 1998 году, тогда это была маленькая компания, обеспечивавшая работу поисковой системы по адресу goto.com[en]. Этот шаг ознаменовал для поисковых систем переход от соревнований друг с другом к одному из самых выгодных коммерческих предприятий в Интернете[11]. Поисковые системы стали продавать первые места в результатах поиска отдельным компаниям.
Поисковая система Google занимает видное положение с начала 2000-х[12]. Компания добилась высокого положения благодаря хорошим результатам поиска с помощью алгоритма PageRank. Алгоритм был представлен общественности в статье «The Anatomy of Search Engine», написанной Сергеем Брином и Ларри Пейджем, основателями Google[13]. Этот итеративный алгоритм ранжирует веб-страницы, основываясь на оценке количества гиперссылок на веб-страницу в предположении, что на «хорошие» и «важные» страницы ссылаются больше, чем на другие. Интерфейс Google выдержан в спартанском стиле, где нет ничего лишнего, в отличие от многих своих конкурентов, которые встраивали поисковую систему в веб-портал. Поисковая система Google стала настолько популярной, что появились подражающие ей системы, например, Mystery Seeker[en](тайный поисковик).
К 2000 году Yahoo! осуществлял поиск на основе системы Inktomi. Yahoo! в 2002 году купил Inktomi, а в 2003 году купил Overture, которому принадлежали AlltheWeb[en] и AltaVista. Затем Yahoo! работал на основе поисковой системы Google вплоть до 2004 года, пока не запустил, наконец, свой собственный поисковик на основе всех купленных ранее технологий.
Фирма Microsoft впервые запустила поисковую систему Microsoft Network Search (MSN Search) осенью 1998 года, используя результаты поиска от Inktomi. Совсем скоро в начале 1999 года сайт начал отображать выдачу Looksmart[en], смешанную с результатами Inktomi. Недолго (в 1999 году) MSN search использовал результаты поиска от AltaVista. В 2004 году фирма Microsoft начала переход к собственной поисковой технологии с использованием собственного поискового робота — msnbot[en]. После проведения ребрендинга компанией Microsoft 1 июня 2009 года была запущена поисковая система Bing. 29 июля 2009 Yahoo! и Microsoft подписали соглашение, согласно которому Yahoo! Search[en] работал на основе технологии Microsoft Bing. На момент 2015 года союз Bing и Yahoo! дал первые настоящие плоды. Теперь Bing занимает 20,1 % рынка, а Yahoo! 12,7 %, что в общем занимает 32,60 % от общего рынка поисковых систем в США по данным из разных источников.
Поиск информации на русском языке[править | править код]
В 1996 году был реализован поиск с учётом русской морфологии на поисковой машине Altavista и запущены оригинальные российские поисковые машины Рамблер и Апорт. 23 сентября 1997 года была открыта поисковая машина Яндекс. 22 мая 2014 года компанией Ростелеком была открыта национальная поисковая машина Спутник, которая на момент 2015 года находится в стадии бета-тестировании. 22 апреля 2015 года был открыт новый сервис Спутник. Дети специально для детей с повышенной безопасностью.
Большую популярность получили методы кластерного анализа и поиска по метаданным. Из международных машин такого плана наибольшую известность получила «Clusty»[en] компании Vivisimo[en]. В 2005 году в России при поддержке МГУ запущен поисковик «Нигма», поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака тегов. «Нигма» тоже экспериментировала[14] с визуальной кластеризацией.
Высокоуровневая архитектура стандартного краулераОсновные составляющие поисковой системы: поисковый робот, индексатор, поисковик[15].
Как правило, системы работают поэтапно. Сначала поисковый робот получает контент, затем индексатор генерирует доступный для поиска индекс, и наконец, поисковик обеспечивает функциональность для поиска индексируемых данных. Чтобы обновить поисковую систему, этот цикл индексации выполняется повторно[15].
Поисковые системы работают, храня информацию о многих веб-страницах, которые они получают из HTML-страниц. Поисковый робот или «краулер» (англ. Crawler) — программа, которая автоматически проходит по всем ссылкам, найденным на странице, и выделяет их. Краулер, основываясь на ссылках или исходя из заранее заданного списка адресов, осуществляет поиск новых документов, ещё не известных поисковой системе. Владелец сайта может исключить определённые страницы при помощи robots.txt, используя который можно запретить индексацию файлов, страниц или каталогов сайта.
Поисковая система анализирует содержание каждой страницы для дальнейшего индексирования. Слова могут быть извлечены из заголовков, текста страницы или специальных полей — метатегов. Индексатор — это модуль, который анализирует страницу, предварительно разбив её на части, применяя собственные лексические и морфологические алгоритмы. Все элементы веб-страницы вычленяются и анализируются отдельно. Данные о веб-страницах хранятся в индексной базе данных для использования в последующих запросах. Индекс позволяет быстро находить информацию по запросу пользователя[16].
Ряд поисковых систем, подобных Google, хранят исходную страницу целиком или её часть, так называемый кэш, а также различную информацию о веб-странице. Другие системы, подобные системе AltaVista, хранят каждое слово каждой найденной страницы. Использование кэша помогает ускорить извлечение информации с уже посещённых страниц[16]. Кэшированные страницы всегда содержат тот текст, который пользователь задал в поисковом запросе. Это может быть полезно в том случае, когда веб-страница обновилась, то есть уже не содержит текст запроса пользователя, а страница в кэше ещё старая[16]. Эта ситуация связана с потерей ссылок (англ. linkrot[en]) и дружественным по отношению к пользователю (юзабилити) подходом Google. Это предполагает выдачу из кэша коротких фрагментов текста, содержащих текст запроса. Действует принцип наименьшего удивления, пользователь обычно ожидает увидеть искомые слова в текстах полученных страниц (User expectations[en]). Кроме того, что использование кэшированных страниц ускоряет поиск, страницы в кэше могут содержать такую информацию, которая уже нигде более не доступна.
Поисковик работает с выходными файлами, полученными от индексатора. Поисковик принимает пользовательские запросы, обрабатывает их при помощи индекса и возвращает результаты поиска[15].
Когда пользователь вводит запрос в поисковую систему (обычно при помощи ключевых слов), система проверяет свой индекс и выдаёт список наиболее подходящих веб-страниц (отсортированный по какому-либо критерию), обычно с краткой аннотацией, содержащей заголовок документа и иногда части текста[16]. Поисковый индекс строится по специальной методике на основе информации, извлечённой из веб-страниц[12]. С 2007 года поисковик Google позволяет искать с учётом времени создания искомых документов (вызов меню «Инструменты поиска» и указание временного диапазона).
Большинство поисковых систем поддерживает использование в запросах булевых операторов И, ИЛИ, НЕ, что позволяет уточнить или расширить список искомых ключевых слов. При этом система будет искать слова или фразы точно так, как было введено. В некоторых поисковых системах есть возможность приближённого поиска[en], в этом случае пользователи расширяют область поиска, указывая расстояние до ключевых слов[16]. Есть также концептуальный поиск[en], при котором используется статистический анализ употребления искомых слов и фраз в текстах веб-страниц. Эти системы позволяют составлять запросы на естественном языке. Примером такой поисковой системы является сайт ask com.
Полезность поисковой системы зависит от релевантности найденных ею страниц. Хоть миллионы веб-страниц и могут включать некое слово или фразу, но одни из них могут быть более релевантны, популярны или авторитетны, чем другие. Большинство поисковых систем использует методы ранжирования, чтобы вывести в начало списка «лучшие» результаты. Поисковые системы решают, какие страницы более релевантны, и в каком порядке должны быть показаны результаты, по-разному[16]. Методы поиска, как и сам Интернет со временем меняются. Так появились два основных типа поисковых систем: системы предопределённых и иерархически упорядоченных ключевых слов и системы, в которых генерируется инвертированный индекс на основе анализа текста.
Большинство поисковых систем являются коммерческими предприятиями, которые получают прибыль за счёт рекламы, в некоторых поисковиках можно купить за отдельную плату первые места в выдаче для заданных ключевых слов. Те поисковые системы, которые не берут денег за порядок выдачи результатов, зарабатывают на контекстной рекламе, при этом рекламные сообщения соответствуют запросу пользователя. Такая реклама выводится на странице со списком результатов поиска, и поисковики зарабатывают при каждом клике пользователя на рекламные сообщения.
Существует четыре типа поисковых систем: с поисковыми роботами, управляемые человеком, гибридные и мета-системы[17].
- системы, использующие поисковые роботы
- Состоят из трёх частей: краулер («бот», «робот» или «паук»), индекс и программное обеспечение поисковой системы. Краулер нужен для обхода сети и создания списков веб-страниц. Индекс — большой архив копий веб-страниц. Цель программного обеспечения — оценивать результаты поиска. Благодаря тому, что поисковый робот в этом механизме постоянно исследует сеть, информация в большей степени актуальна. Большинство современных поисковых систем являются системами данного типа.
- Эти поисковые системы получают списки веб-страниц. Каталог содержит адрес, заголовок и краткое описание сайта. Каталог ресурсов ищет результаты только из описаний страницы, представленных ему веб-мастерами. Достоинство каталогов в том, что все ресурсы проверяются вручную, следовательно, и качество контента будет лучше по сравнению с результатами, полученными системой первого типа автоматически. Но есть и недостаток — обновление данных каталогов выполняется вручную и может существенно отставать от реального положения дел. Ранжирование страниц не может мгновенно меняться. В качестве примеров таких систем можно привести каталог Yahoo[en], dmoz и Galaxy.
- гибридные системы
- Такие поисковые системы, как Yahoo, Google, MSN, сочетают в себе функции систем, использующие поисковых роботов, и систем, управляемых человеком.
- Метапоисковые системы объединяют и ранжируют результаты сразу нескольких поисковиков. Эти поисковые системы были полезны, когда у каждой поисковой системы был уникальный индекс, и поисковые системы были менее «умными». Поскольку сейчас поиск намного улучшился, потребность в них уменьшилась. Примеры: MetaCrawler[en] и MSN Search.
Google — самая популярная поисковая система в мире с долей на рынке 69,24 %. Bing занимает вторую позицию, его доля 12,26 %[18].
Самые популярные поисковые системы в мире[19]:
Поисковая система | Доля рынка в июле 2014 | Доля рынка в октябре 2014 | Доля рынка в сентябре 2017 |
---|---|---|---|
68,69 % | 58,01 % | 69,24 % | |
Bing | 17,17 % | 29,06 % | 12,26 % |
Baidu | 6,22 % | 8,01 % | 6,48 % |
Yahoo! | 6,74 % | 4,01 % | 5,19 % |
AOL | 0,13 % | 0,21 % | 1,11 % |
Excite | 0,22 % | 0,00 % | 0,00 % |
Ask | 0,13 % | 0,10 % | 0,24 % |
Азия[править | править код]
В восточноазиатских странах и в России Google — не самая популярная поисковая система. В Китае, например, более популярна поисковая система Soso.
В Южной Корее поисковым порталом собственной разработки Naver пользуется около 70 % жителей[20]Yahoo! Japan и Yahoo! Taiwan — самые популярные системы для поиска в Японии и Тайване соответственно[21].
Россия и русскоязычные поисковые системы[править | править код]
Яндексом пользуются 53,3 % пользователей в России (Google — 42,9 %)[22].
Согласно данным LiveInternet в декабре 2017 года об охвате русскоязычных поисковых запросов[23]:
- Всеязычные:
- Англоязычные и международные:
- Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском, татарском и других. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что, в основном, индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык, или другими способами ограничивают своих роботов русскоязычными сайтами.
Некоторые из поисковых систем используют внешние алгоритмы поиска.
Количественные данные поисковой системы Google[править | править код]
Число пользователей Интернета и поисковых систем и требований пользователей к этим системам постоянно растёт. Для увеличений скорости поиска нужной информации крупные поисковые системы содержат большое количество серверов. Сервера обычно группируют в серверные центры (дата-центры). У популярных поисковых систем серверные центры разбросаны по всему миру[24].
В октябре 2012 года Google запустила проект «Где живёт Интернет», где пользователям предоставляется возможность познакомиться с центрами обработки данных этой компании[25].
О работе дата-центров поисковой системе Google известно следующее[24]:
- Суммарная мощность всех дата-центров Google, по состоянию на 2011 год, оценивалась в 220 МВт.
- Когда в 2008 году Google планировала открыть в Орегоне новый комплекс, состоящий из трёх зданий общей площадью 6,5 млн м², в журнале Harper’s Magazine подсчитали, что такой большой комплекс потребляет свыше 100 МВт электроэнергии, что сравнимо с потреблением энергии города с населением 300 000 человек.
- Ориентировочное число серверов Google в 2012 году — 1 000 000.
- Расходы Google на дата-центры составили в 2006 году — $1,9 млрд, а в 2007 году — $2,4 млрд.
Размер всемирной паутины, проиндексированной Google на декабрь 2014 года, составляет примерно 4,36 миллиарда страниц[26].
Поисковые системы, учитывающие религиозные запреты[править | править код]
Глобальное распространение Интернета и увеличение популярности электронных устройств в арабском и мусульманском мире, в частности, в странах Ближнего Востока и Индийского субконтинента, способствовало развитию локальных поисковых систем, учитывающих исламские традиции. Такие поисковые системы содержат специальные фильтры, которые помогают пользователям не попадать на запрещённые сайты, например, сайты с порнографией, и позволяют им пользоваться только теми сайтами, содержимое которых не противоречит исламской вере.
Незадолго до мусульманского месяца Рамадан, в июле 2013 года, миру был представлен Halalgoogling[en] — система, выдающая пользователям только халяльные «правильные» ссылки[27], фильтруя результаты поиска, полученные от других поисковых систем, таких как Google и Bing. Двумя годами ранее, в сентябре 2011 года, был запущен поисковый движок I’mHalal, предназначенный для обслуживания пользователей Ближнего Востока. Однако этот поисковый сервис пришлось вскоре закрыть, по сообщению владельца, из-за отсутствия финансирования[28].
Отсутствие инвестиций и медленный темп распространения технологий в мусульманском мире препятствовали прогрессу и мешали успеху серьёзного исламского поисковика. Очевиден провал огромных инвестиций в веб-проекты мусульманского образа жизни, одним из которых был Muxlim[en]. Он получил миллионы долларов от инвесторов, таких как Rite Internet Ventures, и теперь — в соответствии с последним сообщением от I’mHalal перед его закрытием — выступает с сомнительной идеей о том, что «следующий Facebook или Google могут появиться только в странах Ближнего Востока, если вы поддержите нашу блестящую молодёжь»[29].
Тем не менее исламские эксперты в области Интернета в течение многих лет занимаются определением того, что соответствует или не соответствует шариату, и классифицируют веб-сайты как «халяль» или «харам». Все бывшие и настоящие исламские поисковые системы представляют собой просто специальным образом проиндексированный набор данных либо это главные поисковые системы, такие как Google, Yahoo и Bing, с определённой системой фильтрации, использующейся для того, чтобы пользователи не могли получить доступ к харам-сайтам, таким как сайты о наготе, ЛГБТ, азартных играх и каким-либо другим, тематика которых считается антиисламской[29].
Среди других религиозно-ориентированных поисковых систем распространёнными являются Jewogle — еврейская версия Google и SeekFind.org — христианский сайт, включающий в себя фильтры, оберегающие пользователей от контента, который может подорвать или ослабить их веру[30].
Персональные результаты и пузыри фильтров[править | править код]
Многие поисковые системы, такие как Google и Bing, используют алгоритмы выборочного угадывания того, какую информацию пользователь хотел бы увидеть, основываясь на его прошлых действиях в системе. В результате, веб-сайты показывают только ту информацию, которая согласуется с прошлыми интересами пользователя. Этот эффект получил название «пузырь фильтров»[31].
Всё это ведёт к тому, что пользователи получают намного меньше противоречащей своей точке зрения информации и становятся интеллектуально изолированными в своём собственном «информационном пузыре». Таким образом, «эффект пузыря» может иметь негативные последствия для формирования гражданского мнения[32].
Предвзятость поисковых систем[править |
ru.wikipedia.org
Секреты поиска в интернет и необычные поисковики / Программное обеспечение
Большая часть времени, проводимая пользователем в интернете, тратится на поиск интересующей его информации. При этом существует масса способов добыть эти данные - можно заглянуть в онлайновую энциклопедию и попробовать отыскать ответ там, можно подписаться на рассылку по интересующей теме и внимательно изучать приходящую корреспонденцию, а можно посоветоваться с компетентными людьми на форуме, задав им вопрос. Но самый универсальный способ найти что-то в интернете - воспользоваться одной из многочисленных поисковых систем. Сервисы для осуществления поиска на миллионах и миллионах web-сайтов - это, пожалуй, основополагающее звено всемирной Сети. Без Google, Yahoo, Yandex и многих других привычных сегодня поисковых систем пребывание пользователя в Сети скорее напоминало бы хождение слепого по лесу. Значимость поисковых систем для работы в интернете трудно переоценить - у многих пользователей в качестве стартовых страниц указаны адреса поисковых систем, и именно с них для многих начинается бесконечное путешествие по различным ресурсам сети. Однако эффективность интернет-раскопок у всех разная - один человек находит информацию мгновенно, у другого на это уходит очень много времени, ну а третий может и вовсе не найти для себя ничего полезного. В чем же причина? Ответ прост: поиск в интернете сродни рыбалке - нужно знать, где ловить и на что ловить, т.е. где искать и как искать. В сегодняшней статье мы расскажем о том, как лучше всего проводить поиск в интернете, и поведаем, какие для этого существуют поисковые системы, кроме тех, которые "у всех на устах". Однако начнем мы именно с тех систем, которые вы знаете. Если пользователь знает адрес поисковой системы, это еще не означает, что он умеет ею пользоваться. Давайте проверим, насколько вы хорошо разбираетесь в технологии поисковых запросов. То, насколько точные результаты вы получите, прежде всего, зависит от того, насколько умело вы сформировали поисковый запрос. Например, если вы ищете информацию для написания курсовой работы, не нужно вводить ее тему дословно, особенно если работа имеет узкую специализацию. Гораздо больше ценных сведений вы найдете, если попробуете подобрать ключевые слова, то есть те слова, которые обязательно будут встречаться в вашей работе. Если вы ищете утерянную инструкцию для автомагнитолы, то введя номер модели, наверняка получите огромное количество сайтов, предлагающих ее приобрести. Чтобы отсеять ненужные ссылки, можно использовать функцию поиска в найденном или исключить из поиска некоторые слова. Практически в каждом поисковике вы найдете функцию расширенного поиска. Это - еще один хороший способ отсеять ненужные результаты. Среди таких функций может пригодиться поиск страниц, которые недавно обновлялись, поиск страниц только на определенном языке или на сайтах, расположенных в указанной вами доменной зоне. Время, которое тратится на поиск, можно существенно сэкономить, если знать и использовать синтаксис языка запросов. Каждый поисковик имеет тут свои особенности. Например, когда вы ищете что-нибудь на Яндексе, то не лишним будет использовать следующие приемы:- Для поиска слов, которые должны встретиться на странице в одном предложении, поставьте между ними символ &
- Чтобы исключить определенное слово из результатов поиска, добавьте его к своему запросу, поставив перед ним символы ~~
- Чтобы найти страницы, в которых содержится хотя бы одно из слов, указанных в поисковом запросе, разделите их символом |
- Для поиска слова в указанной форме поставьте перед ним восклицательный знак
- Для поиска информации на определенном сайте (и только на нем) введите в поле запроса его адрес, предварив словом site и двоеточием (например, site:http://www.3dnews.ru)
- Для поиска фразы, которая должна встретиться на странице полностью, возьмите ее в кавычки
- Для исключения из результатов поиска страниц, на которых встречается определенное слово, добавьте его к своему запросу, поставив перед ним знак минус
FindSounds.com - ищет звуки
Этот ресурс предназначен для тех пользователей, которые находятся в творческом поиске. Ресурс позволяет искать звуковые файлы разных форматов - wav, mp3, aiff, au. В базе данных ресурса есть самые разнообразные звуки - крики животных, скрежет машин, звон, стук, сирены, жужжание насекомых, грохот взрывов и стрельбы, всплеск воды и т.д. Звуковые файлы могут искаться по разным критериям, например, по размеру, наличию двух или одного каналов звучания (стерео/моно), частоте дискретизации и разрядности звучания. В результатах поиска ресурс показывает не только ссылки на найденные файлы, но и их основные характеристики, а также показывает график амплитуды звука, по которой можно судить о характере звучания данного семпла. База звуковых эффектов FindSounds может найти применение в самых разных областях - от разработки компьютерных игр и прочих приложений, до создания презентаций и всевозможных клипов. Поисковик может пригодиться, например тем, кто создает интерактивную web-графику и желает внести разнообразие на сайт, сопроводив нажатие элементов навигации страниц различными звуками.Gnod.net - подберет музыку, книги и фильмы по вкусу
Когда у человека возникает желание почитать новую книгу, послушать какую-нибудь новую музыку или посмотреть фильм, он, как правило, обращается за советом к своему другу или знакомому, который в его глазах имеет авторитет. Однако найти того, кто согласился бы высказать свое мнение по данному вопросу, не так просто. Во-первых, не все любят давать советы, ведь рекомендуя что-то другому, человек берет на себя долю ответственности, и многих останавливает вопрос "А вдруг фильм, который я посоветую, ему не понравится?" Во-вторых, человек, который дает совет, должен понимать, что именно понравится собеседнику, а что - будет совершенно неинтересно. Ведь на вкус и цвет, как говорится… Но есть более простой способ получить хороший совет - воспользоваться особым поисковиком, который сделан именно для этой цели. Итак, вы захотели послушать новую группу, но нет времени и желания искать хорошую музыку. Ресурс gnod.net поинтересуется у вас несколькими именами музыкальных исполнителей, которые вам нравятся, проведет анализ результатов и предложит свой вариант певца или группы, которая тоже должна вам понравиться. Сервис имеет несколько баз данных - по музыкальным исполнителям, по фильмам, книгам и людям. Таким образом, ресурс вобрал в себя четыре сервиса: Gnod Music, Gnod Books, Gnod Movies и Flork. Последний сервис, Flork - это социальный эксперимент по обнаружению людей, которым интересно общаться друг с другом. Мы с удовольствием протестировали музыкальный раздел этого сервиса и ввели трех исполнителей - Gerry and the Pacemakers, The Beatles и Hollies. Наша подборка не была случайной - эти три группы принадлежат к эпохе шестидесятых, к интересному явлению, которое носит название Британское вторжение (British Invasion). Все эти группы играли бит, и поисковик должен был предложить группу или исполнителя в том же стиле. Так и случилось. Результат, предложенный нам - это группа Archies, которая в конце шестидесятых была на устах у всех американцев со своей веселой песенкой Sugar Sugar. Поиграв с поисковиком какое-то время, мы пришли к выводу, что gnod.net чаще дает правильный совет, а ошибается не очень часто. Для наглядности, результаты своего "совета" поисковик может предоставить в виде анимированного облака с названиями групп, авторов или фильмов. Базу данных можно пополнять самостоятельно, проводя "беседы" с поисковиком и отвечая на его вопросы в стиле "это мне нравится" или "это мне не нравится".Alldll.net - найдет файлы библиотек
Этот поисковик мы рекомендуем вам сразу занести в закладки, так как рано или поздно он обязательно пригодится. Вероятно, каждому доводилось хотя бы раз столкнуться с проблемой отсутствия в системе какой-то библиотеки dll. Обычно это приводит к тому, что программы или игры отказываются запускаться, и на экране появляется сообщение "Couldn't find *****.dll". Причин тому может быть много, например, отсутствие файла может быть вызвано некорректным удалением ранее установленного приложения, случайным повреждением файла и т.д. Кроме того, разработчик мог просто не включить в дистрибутив своего продукта эту библиотеку. Исправить ситуацию очень просто - достаточно найти в интернете недостающий файл, загрузить его и скопировать в директорию той программы, которая отказывается запускаться, либо в папку ..WINDOWSsystem32... Найти и скачать отсутствующий файл можно легко и быстро с помощью данного сервиса. Ресурс www.alldll.net представляет собой поисковую базу данных по наиболее популярным библиотекам dll. Файлы рассортированы по алфавиту, присутствует функция поиска. Искомый файл можно искать, даже если вам известно только приблизительное название библиотеки. Достаточно в поле запроса начать вводить текст, и в нижней части страницы появится огромный список файлов, которые начинаются с тех букв, которые были набраны.Medpoisk.ru - поиск медицинской информации
Несмотря на то, что данная поисковая система использует движок поиска от Google, это ни в коей мере не снижает ее ценность. Medpoisk.ru - это универсальный поисковик, который предназначен для поиска исключительно на медицинских сайтах. Этот сайт - отличный инструмент для каждого медика и всех, кто желает получить ответ на любой вопрос из области медицины. Как лечить ту или иную болезнь, какие противопоказания у того или иного лекарства, к какому врачу обратиться - все это и многое другое можно узнать, "спросив" у поисковика. Поисковик включает в себя биржу труда и может использоваться для поиска работы среди медицинских работников. Ресурс также содержит каталог медицинских учреждений, рассортированных по регионам. Среди этих учреждений адреса клиник, медицинских центров разной направленности, родильные дома, диагностические центры, косметологические салоны и пр. Мы вам искренне желаем, чтобы этим поисковым сервисом вы пользовались исключительно из любопытства, а не по необходимости.Taggalaxy.de - поиск картинок и фотографий
Возможно, вы слышали о популярном сервисе для обмена графическими файлами Flickr.com? Это тот самый сервис, который в 2007 году был заблокирован китайскими властями, после того как на его страницах появились фотографии печальных событий 1989 года на площади Тяньаньмэнь, расположенной в столице Китая Пекине. Flickr.com является одним из первых Web 2.0 сервисов, а число изображений, загружаемых на него пользователями, исчисляется миллиардами. Количество картинок, загружаемых на серверы этого сервиса столь велико, что для того чтобы найти какое-то конкретное изображение в этом океане снимков и картин, необходима отдельная поисковая система. Сервис предлагает услугу поиска по изображениям, однако есть более интересный способ искать картинки - используя необычный поисковик taggalaxy.de. Этот поисковый сервис представляет собой средство для поиска изображений на Flickr.com, с предварительным просмотром. А необычным его делает интерфейс поиска, который полностью сделан трехмерным. Процесс поиска по ключевому слову напоминает какую-то компьютерную игру - в космическом пространстве летают разные небесные тела, между которыми можно перемещаться в виртуальном мире. После того, как будет выполнен запрос по ключевому слову, на экране возникнет система из солнца и планет, которые вращаются вокруг светила. Каждое небесное тело имеет свое предназначение и "подписано" словом. В центре галактики - солнце, ключевой запрос, все остальные тела - это вспомогательные слова, уточнения. Если щелкнуть мышью по солнцу, этот объект приблизится, и со всех сторон на него слетятся и окружат фотографии, содержание которых определено поисковым запросом. Эту трехмерную модель с фотографиями можно поворачивать в виртуальном пространстве, подробно рассматривая и выискивая интересующее изображение. После этого достаточно щелкнуть по картинке, чтобы она увеличилась в размере, и тогда ее можно будет лучше рассмотреть и почитать описание. В процессе работы с этим поисковиком, можно использовать функцию скроллинга - она позволяет приближать или отдалять трехмерные планеты. Остальные планеты, которые видны в интерфейсе поисковика после запроса - это вспомогательные слова, позволяющие уточнить запрос. Например, если ввести в поле поиска "Sky", то среди уточняющих слов-планет будут слова "сlouds", "sunset", "blue" и другие схожие по смыслу тэги, которые пользователи указали при использовании сервиса Flickr.com. Недостатком поисковой системы можно считать то, что taggalaxy.de не поддерживает русский язык, поэтому запросы можно вводить только латиницей.Nigma.ru - фильтрует результаты других поисковых систем
Среди всех поисковых систем, которые можно встретить в интернете, существует особая группа поисковиков. Она отличается от всех остальных тем, что в них реализована функция мультипоиска, то есть одновременного поиска по нескольким поисковым системам. Одной из таких мультипоисковых систем является российский сервис Nigma.ru. Nigma содержит собственную базу ресурсов, но помимо этого позволяет выполнять поиск сразу по всем наиболее популярным поисковым системам, в числе которых - Google, MSN, Yandex, Rambler, AltaVista, Yahoo и Aport. Механизм отбора результатов в этой поисковой машине отличается от большинства принятых методов обнаружения сайтов. Дело в том, что движок этого сервиса использует кластеризацию результатов. Что это означает? Представьте себе, что вы решили для себя выяснить, что такое "рендеринг". Сопоставив результаты в разных поисковых системах, движок Nigma.ru отобрал наиболее вероятные результаты и при этом в левой части окна, рядом со списком результатов поиска, отобразил так называемые кластеры - "визуализация", "создание", "система", "rendering", "процесс", "studio max", "компьютерной графики" и другие слова и словосочетания. Эти кластеры представляют собой тематическую группу найденных документов. Таким образом, можно быстро сузить круг поиска или конкретизировать поисковый запрос. В Nigma.ru можно также использовать рубрики, чтобы ограничить область, из которой будут выбираться результаты - например, выполнять поиск только с учетом музыкальных ресурсов или вывести результаты только для изображений. Еще одна возможность этого сервиса может быть интересна школьникам и студентам. Nigma.ru предлагает сервисы Nigma-математика и Nigma-химия. Первый предназначен для быстрого решения простых уравнений и различных арифметических операций, второй позволяет работать с формулами химических реакций. Поисковый сервис распознает более тысячи физических, математических констант и единиц измерения, позволяя быстро выполнять преобразование из одной размерности в другую.Searchme.com - поисковик с предпросмотром
Всем известно, что для того чтобы найти конкретную информацию в сети, необходимо потратить немало времени. Просматривая результаты поиска, пользователь, в основном, открывает ресурсы наугад, не зная наверняка, найдет ли он на новой странице то, что его интересует, или это будет пустой тратой времени. Создатели поискового сервиса searchme.com задумались над этой проблемой и придумали ее оригинальное решение. Суть этого решения состояла в том, чтобы создать такую поисковую систему, в которой пользователь мог бы посмотреть на приблизительный эскиз страницы еще до ее загрузки. Это позволило бы составить дополнительное мнение о серьезности ресурса и о его содержании. Реализация этой идеи была просто великолепной - созданный поисковик имеет красивый анимированный трехмерный интерфейс и показывает результаты поиска в виде анимированной ленты эскизов, уменьшенных скриншотов web-страниц, включающих в себя ключевое слово поиска. Ленту с результатами, подобно пленке со старыми негативами, можно прокручивать в окне браузера, используя специальный ползунок, расположенный под вереницей изображений. Эскизы мгновенно подгружаются, поэтому никаких "тормозов" с прорисовкой результатов не наблюдается. Особенно удобно работать с результатами поиска в полноэкранном режиме - тогда вполне можно разобрать даже текст статей на эскизах результатов. Чтобы оценить удобство этой системы, достаточно попробовать просмотреть новостные ресурсы. Фотографии к главным новостям на титульной странице web-издания, тут же дадут понять, какую новость на данном ресурсе считают наиболее важной.Torrent-finder.com - поиск торрентов
Несмотря на все старания правообладателей музыки и видео закрыть любые сервисы по обмену мультимедийным контентом, в интернете по-прежнему есть место для тех, кто не видит в этом ничего плохого. Один из способов послушать новый музыкальный альбом или посмотреть недавно вышедший на экраны фильм - скачать себе его на жесткий диск, используя программу, работающую с протоколом BitTorrent. О достоинствах этого способа обмена данных знают практически все - распределенная передача данных между всеми пользователями снижает нагрузку и зависимость от каждого клиента сети. Но вот проблема - для того, чтобы загрузить любой файл при помощи BitTorrent, необходимо скачать файл торрент, который содержит информацию о раздаваемых пользователем файлах. В интернете есть множество ресурсов, которые собирают желающих поделиться с другими своими "сокровищами". Каждый такой ресурс имеет свой трекер - сервер, на котором хранятся файлы-торренты. Чтобы найти тот или иной файл среди тысяч и тысяч раздаваемых архивов, необходимо выполнить поиск соответствующего файла-торрента на этом трекере. Впрочем, интересующего файла может не оказаться. В таком случае придется искать другие трекеры и смотреть уже там, есть ли возможность загрузить разыскиваемый файл-торрент. На перебор сайта за сайтом часто тратится немало времени. Выход - специализированный поисковик торрентов. Сайтов, которые ищут по торрент-ресурсам, в сети немало. Однако torrent-finder.com имеет перед остальными поисковыми системами неоспоримое преимущество - этот сервис позволяет искать файлы на огромном числе трекеров одновременно.Astronet.ru - астрономический поисковый сервис
Этот ресурс предоставляет поиск информации по сайтам, чья тематика, так или иначе, имеет отношение к астрономии. Всего в базе данных поисковой системы около четырех сотен сайтов по астрономической тематике - сайты обсерваторий, любительские странички, библиотеки научной литературы и пр. Тем, чья профессия связана с астрономией, можно только позавидовать - в изучении космических событий есть доля романтики. Ничто не кажется человеку столь интересным, как область неизведанного. Может быть, поэтому он так часто обращает свое внимание к космосу и пытается найти ответ на вечный вопрос "Есть ли жизнь во Вселенной?" Мы тоже не стали отличаться оригинальностью и попробовали задать поисковику легендарный вопрос "Есть ли жизнь на Марсе?" Ответов было так много, и все они были столь интересны, что, позабыв обо всем, мы погрузились в чтение гипотез и рассматривание фотографий и макетов марсианской поверхности. Помимо функции поиска, на сайте есть масса других полезных сервисов, среди которых, например, есть Англо-Русско-Английский Астрономический словарь, биографический справочник с подробными сведениями обо всех ученых, которые внесли свой вклад в развитие астрономии, глоссарий астрономических терминов. Есть также удобная карта звездного неба, которая генерирует положение созвездий, в зависимости от широты и долготы точки наблюдения, а также времени суток.Friv.com - бесплатные игры на любой вкус!
Поисковые сервисы нужны всем - и тем, кто использует их для написания диссертации, и тем, кто хочет узнать прогноз погоды или расписание поездов, и даже тем, кто выкроил пять минут свободного времени и хочет просто, что называется, повалять дурака, поиграть в какую-нибудь незамысловатую компьютерную игру. Для последней категории пользователей этот ресурс будет настоящим кладезем игр. Это - не совсем поисковик, хотя именно так его называют западные обозреватели (Game search engine). Сайт friv.com представляет собой, скорее, каталог, сборник 264 игр на Flash, собранных на одной странице. Нажмите любую из красочных иконок и играйте на здоровье. На friv.com вы найдете любые "офисные забавы" - от тетриса и шахмат до квеста-бродилки и шутера. Сюжет многих игр сделан с большим юмором и, несомненно, понравится не только вам, но и вашим друзьям.VisualWorld.ru - поиск с ассоциативными связями
Методика отбора правильных результатов у каждого поисковика своя, уникальная. Вот, например, эта поисковая система работает по принципу ассоциативности. Данный поисковик старается не только правильно отобрать web-ресурсы, соответствующие определенному запросу, но и подсказать ассоциативными словами направление поиска. Так, если ввести в поле запроса ключевое слово или словосочетание, результат, показываемый поисковой машиной, будет выглядеть как набор ассоциативных слов, семантическое облако, ну, и, разумеется, обычный список сайтов, отобранных поисковиком в результате поиска. Отличительная особенность VisualWorld.ru - это визуализация ассоциативных связей, т.е. составление карты-диаграммы, демонстрирующей связи между словами, которые относятся к схожим темам. Этот граф поначалу может показаться чем-то непонятным и необычным, но после нескольких попыток поиска к нему привыкаешь и используешь его для сужения области поиска. Поисковый сервис VisualWorld.ru может работать не только в режиме ассоциативного поиска, но и обычного. Для более быстрой работы с системой, существует "облегченная" версия сайта - viwo.ru.Briefly.ru - краткое содержание любой книги
Можно долго спорить о том, умрет ли книга или нет, но факт остается фактом - сегодняшний читатель - это не тот, кто листает томик Лермонтова или Толстого, а, скорее, тот, кто еще умеет читать. Скоро библиофилом сможет считать себя каждый, кто знает что Бендер - это плод фантазии Ильфа и Петрова, а не герой "Футурамы", а Гомер - это вовсе не персонаж "Симпсонов", а вполне адекватный грек, живший пару тысяч лет назад. Нам думается, что пропавший интерес к литературе - это явление временное, и наступят времена, когда люди вернутся к книгам. Ну а пока время диктует свои законы, и появляются такие ресурсы, как briefly.ru. Не нужно быть особенно прозорливым, чтобы догадаться, на кого рассчитан данный ресурс - конечно, на школьников и студентов. Зачем читать целую книгу, если можно в двух словах узнать, о чем там писал старина Метерлинк. На сайте briefly.ru собрано большое количество кратких содержаний к разным книгам - от "Божественной комедии" Данте Алигьери до "Гамлета" Шекспира и "Тихого Дона" Шолохова. Содержание произведений рассортировано на сайте по авторам, есть функция поиска. Нужно отдать должное создателям этого ресурса - они очень тщательно подошли к подбору текста для пересказа, поэтому большинство произведений пересказано литературным языком, все понятно и… интересно. Ну что ж, быть может, среди тех, кто ознакомится с содержанием этих книг, найдется и такой, кто захочет узнать книгу, прочитав ее в оригинале. И не с экрана КПК или ноутбука, а с белых листов обычной книги, пока еще есть такая возможность.Videoinet.ru - поиск по видеороликам
Этот сервис выполняет поиск видео по различным онлайновым хранилищам видео, как отечественным, например RuTube.ru, так и по зарубежным. Всем известно, что самый большой видеоархив - это сервис YouTube. Однако на практике оказывается, что наши отечественные сервисы для хранения видеороликов мало в чем уступают, а кое в чем и лучше сервиса, принадлежащего Google. Во-первых, отечественные сервисы более демократичны к выкладываемому видео - к счастью, в нашей стране пока никому не приходит в голову подавать в суд за то, что в сеть на всеобщее обозрение выложен музыкальный клип или фрагмент нового блокбастера. Во-вторых, содержание клипов, которые загружают на сервер наши пользователи, нам более близко и понятно. Вот, например, репортаж с одного из телеканалов, ставший уже документальным, о событиях, предварявших приезд на Украину сэра Пола Маккартни - оказывается, есть на Закарпатье село Битля, в котором местные гуцулы готовят "гарну писню" для одного из "Битлз". А вот - другой ролик, где пьяный преподаватель одного из столичных вузов пытается провести лекцию. Шанс увидеть подобное на YouTube гораздо ниже - это то, что близко нашему зрителю, это - наш менталитет. Поиск на сервисе videoinet.ru можно выполнять по тегам, по рейтингу и ключевым словам, которые имеют отношение к содержанию клипа. Сервис позволяет делать закладки и составлять из видеоклипов списки воспроизведения.Kartoo.com - поиск с картой результатов
В ситуации, когда долгий поиск в Интернете не принес никакого положительного результата, логично предположить, что поисковый запрос был сделан не совсем удачно и его стоит сформулировать как-то по-другому. Но чем дольше пользователь перебирает страницы, тем труднее ему включить воображение и придумать, как иначе описать свою проблему одним-двумя словами. В этом случае нужно просто переключиться и попробовать какой-нибудь совершенно другой поисковый сервис, например, kartoo.com. Одно только наличие необычного интерфейса поискового ресурса может подтолкнуть пользователя к идее сформулировать свой запрос по-новому. А если учесть при этом, что результаты будут совсем не те, что выдавал предыдущий поисковик, можно предположить, что шансы найти ответ в этом случае будут выше. Поисковый сервис совершенно не похож на обычные поисковые машины - его внешний вид больше напоминает окно какого-то приложения. После ввода слова-запроса, в окне "приложения" появляется анимированный персонаж, который развлекает пользователя, пока результаты подготавливаются к выводу на экран. Далее следует построение карты Интернета, которая определяет связи между смысловым содержанием различных ресурсов. По этой карте хорошо видно, какая область ближе всего к тематике выбранного ресурса и где следует искать информацию. Интересно, что показанные на карте связи можно редактировать, определяя тем самым область поиска. На карте интернет-ресурсов сайты отмечены разными иконками - те, которые имеют больший размер иконки, скорее соответствуют поисковому запросу. Пользоваться поисковой системой kartoo.com очень непривычно, особенно вначале. Но, тем не менее, к некоторым возможностям поиска привыкаешь мгновенно - например, очень удобные пиктограммы сайтов, которые дают возможность судить о том, просматривал ты эту страницу или нет. Также поисковая система хранит историю запросов, что очень удобно, если необходимо вернуться к какому-то результату. Для этого можно просмотреть список слов, запрашиваемых в поисковике, и вспомнить, какой именно привел к тому или иному ресурсу. Поисковик, к сожалению, плохо работает с русским текстом. Поиск может производиться в одном из трех режимов - по всему интернету, только по англоязычным страницам и с использованием "родительского" фильтра. Когда страниц, соответствующих запросу, поисковая система обнаруживает много, результаты поиска делятся на страницы (как в любом поисковике) и для каждой из них создается своя карта Интернета. Любая карта результатов может быть сохранена и затем заново использована для поиска.Webbrain.com - конкретизация области поиска
Визуальное представление результатов поиска - это частое явление среди альтернативных поисковых систем. Наиболее близкий и понятный способ демонстрации области поиска - это диаграмма, которую, так или иначе, обыгрывают в необычных интерфейсах создатели альтернативных поисковиков. Сервис webbrain.com - это попытка сделать поисковую систему, в которой пользователь мог бы не только перебирать подряд результаты, но и выбирать направление поиска. Работает поисковый сервис очень просто. Пользователь вводит запрос, после чего в верхней части страницы строится диаграмма слов, определяющих смысловую область поиска, а в нижней части окна браузера показывается стандартный список сайтов, отвечающих требованию запроса. В центре диаграммы ключевое слово, наиболее близко соответствующее тематике запроса. Иногда по центральному слову можно судить, насколько "правильно" поисковая система идентифицировала смысл запроса. Например, если ввести "3dnews.ru", в центр диаграммы система ставит игры. Ну что ж, это верно, хотя, по правде сказать, нам кажется, что логичнее было бы увидеть в центре диаграммы другое слово, например "свежие IT-новости" или "компьютер". Неточность результатов этого поисковика объясняется скудной базой проиндексированных сайтов, однако сама идея интересна и, возможно, когда-нибудь получит продолжение. Для того, чтобы можно было работать с webbrain.com, необходимо иметь установленный компонент Java Virtual Maсhine, Internet Explorer, Firefox или Netscape.Agakids.ru - детский поисковик
Когда ребенок стремится изучать компьютер - это нужно всячески поощрять. Но давать ему самостоятельно искать ответы на свои вопросы в Google или подобном "взрослом" поисковике не стоит. Ведь даже если поисковый движок имеет функцию ограничения результатов поиска с учетом нежелательного содержания, то это означает лишь то, что при включенном фильтре порнография и насилие не исчезнут полностью, а будут встречаться на страницах результатов реже. Гарантировать же полностью "чистый" список результатов не может ни один поисковый сервис. Не решают до конца эту проблему и программы для родительского контроля. Но есть один очень хороший выход из положения - предложить ребенку поработать со специальным детским поисковиком agakids.ru. Этот сервис устроен таким образом, что осуществляет поиск исключительно по тем ресурсам, которые были добавлены в базу данных agakids.ru и были одобрены создателями сервиса. Поисковый сервис может найти полезную информацию и для родителей - расскажет, как правильно воспитывать детей, как заботиться об их здоровье и т.д. На сайте работает и детское интернет-радио, которое транслирует в эфир разные сказки, детские песни, рассказы и многое другое. Чтобы ребенку было интересно использовать этот поисковик, работа с результатами может происходить в режиме визуального поиска, когда найденные странички показываются в виде красивой анимированной серии картинок-скриншотов заглавной страницы сайтов. Взрослым же, наверное, будет удобнее работать в текстовом режиме.Eyeplorer.com - поиск в онлайновой энциклопедии
Создавая этот необычный поисковый движок, создатели стремились сделать его как можно более "умным", способным точно настраиваться на поисковый вопрос. Решив, что нет более универсальной базы, чем та, которая содержится в энциклопедических статьях, создатели сервиса пришли к выводу, что новый поисковик следует создавать на основе Википедии - популярной онлайновой энциклопедии. Созданный немецкими программистами, eyeplorer.com визуализирует результаты поиска и дает возможность конкретизировать поиск. Eyeplorer.com - очень удобный инструмент, для того, чтобы быстро найти краткие сведения в определенной области. Поисковая система выглядит как круговая диаграмма. В центре этой диаграммы находится окно поиска. После того, как запрос выполнен, на этой диаграмме начинают отмечаться точками результаты поиска, причем эти результаты выглядят как тэги-ссылки, помогающие пользователю раскрыть суть вопроса. Ссылки в этой диаграмме ведут на страницы онлайновой энциклопедии. Для большего удобства масштаб диаграммы можно менять, используя для этого специальный ползунок. Любой тэг, перемещенный в поле запроса, автоматически запускает новый поиск, и диаграмма перестраивает карту результатов. Поисковый запрос можно уточнять, добавляя дополнительные слова, уточняющие суть вопроса. Справа от этой диаграммы имеется блокнот, на который можно перетаскивать комментарии-ссылки к тэгам диаграммы, своего рода закладки онлайн.Picollator.ru - поиск по содержимому картинок
Когда вы вводите запрос на большинстве популярных поисковых систем, предлагающих поиск графических файлов, вы получаете результаты, основанные на том, какой текст встречается на странице, а также на названиях файлов. А вот менее известный поисковик Picollator работает совершенно по-другому. Эта система идентифицирует то, что изображено на картинках. Естественно, что при таком подходе и поисковый запрос должен формулироваться не в виде слова или словосочетания, а быть картинкой. Именно так и есть: загрузите на сервер фотографию или укажите ссылку на сайт, куда она уже загружена, и спустя несколько секунд вы увидите эскизы изображений, похожих на загруженное фото. Сервис имеет некоторые ограничения: он работает только с фотографиями людей. К тому же, чтобы получить приемлемый результат, исходное фото должно быть хорошего качества - лицо человека на нем должно быть хорошо видно, также желательно, чтобы он не было повернуто.Kwmap.net - предложит направления поиска
Слоган этого сайта под поисковой формой "Keymap of whole Internet" полностью соответствует сути этой поисковой машины. Сервис kwmap.net визуализирует найденные результаты самым простым и наглядным образом, какой только можно придумать - в виде карты дорог, чем-то напоминающей карту метрополитена. Узловые точки этой карты - это ключевые слова, найденные поисковой системой. Точка на пересечении путей - это центральное слово, то самое, которое было введено в поле запроса поисковой машины. Поисковая машина отчасти выполняет работу пользователя - в случае неудовлетворительного результата, можно не ломать голову над тем, какой вопрос задать более точно - достаточно взглянуть на визуальное представление результатов поиска и выбрать одно из ключевых слов. Иными словами, используя эти ключевые выражения, можно управлять направлением поиска.Заключение
На этом список "странных" поисковых сервисов, конечно же, не заканчивается. Лучшие умы стараются разработать все более совершенный алгоритм отбора результатов поиска в интернете. Но, несмотря на все их усилия, до сих пор не было предложено такого решения, которое бы смогло вызвать большой интерес у пользователей. Это можно объяснить не только силой привычки, но и тем, что за годы существования Google, Yandex, Yahoo! и других поисковых систем, многие пользователи научились "фильтровать" результаты, умело оперируя синтаксисом поискового запроса, ничуть не хуже, чем это делают альтернативные поисковики. Полагаем, что ситуация может в корне измениться лишь тогда, когда на горизонте появится поисковый сервис, использующий не движок старших систем, а свой собственный, и который при этом сможет проиндексировать такое же огромное количество страниц, как Google. Спор относительно того, какой из поисковиков самый лучший, определенно обречен на бесконечный диспут. Наверняка найдется немало людей, которые будут утверждать, что ничего лучше, чем Google или Yandex человек не придумал. Найдутся и такие, кто скажет, что альтернативные поисковики ищут точнее. Правы и те, и другие. В конце концов, в закладках браузера есть место для всех поисковых систем, которые могут пригодиться.Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
3dnews.ru
Поисковые системы Интернета: Яндекс, Google, Rambler, Yahoo - информация, принципы работы
1. Введение
2. Понятие и функции поисковой системы
3. Основные характеристики поисковой системы
4. Краткая история развития поисковых систем
5. Состав и принципы работы поисковой системы
6. Заключение
1. Введение
Поисковые системы уже давно стали неотъемлемой частью российского Интернета. Поисковые системы сейчас – это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса.
Большинство пользователей поисковых систем никогда не задумывались (либо задумывались, но не нашли ответа) о принципе работы поисковых систем, о схеме обработки запросов пользователей, о том, из чего эти системы состоят и как функционируют…
Данный материал призван дать ответ на вопрос о том, как работают поисковые системы. Однако вы не найдете здесь факторов, влияющих на ранжирование документов. И тем более не стоит рассчитывать на подробное объяснение алгоритма работы Яндекса. Его, по словам Ильи Сегаловича, директора по технологиям и разработке поисковой машины «Яндекс», можно узнать лишь «под пыткой» самого Ильи Сегаловича.
2. Понятие и функции поисковой системы
Поисковая система – это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google», «Yahoo», «MSN». В русском Интернете это – «Яндекс», «Рамблер», «Апорт».
Рассмотрим подробнее понятие поискового запроса на примере поисковой системы «Яндекс». Поисковый запрос должен быть сформулирован пользователем в соответствии с тем, что он хочет найти, максимально кратко и просто. Допустим, мы хотим найти информацию в «Яндексе» о том, как выбрать автомобиль. Для этого, открываем главную страницу «Яндекса», и вводим текст поискового запроса «как выбрать автомобиль». Далее, наша задача сводится к тому, чтобы открыть предоставленные по нашему запросу ссылки на источники информации в Интернет. Однако, вполне можно и не найти нужную нам информацию. Если таковое произошло, то либо нужно перефразировать свой запрос, либо в базе поисковой системе действительно нет никакой актуальной информации по нашему запросу (такое может быть при задании очень «узких» запросов, как, например «как выбрать автомобиль в Архангельске»).
Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут. А научить пользователей делать «правильные» запросы к системе, т.е. запросы, соответствующие принципам работы поисковых систем, невозможно. Поэтому разработчики создают такие алгоритмы и принципы работы поисковых систем, которые бы позволяли находить пользователям искомую ими информацию.

Для того, чтобы удовлетворить ответами все эти вопросы, разработчики поисковых машин постоянно совершенствуют алгоритмы и принципы поиска, добавляют новые функции и возможности, всячески пытаются ускорить работу системы.
3. Основные характеристики поисковой системы
Опишем основные характеристики поисковых систем:
- Полнота
Полнота – одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.
- Точность
Точность – еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.
- Актуальность
Актуальность – не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.
- Скорость поиска
Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.
- Наглядность
Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска. Подробные пояснения по странице результатов поиска, например у «Яндекса» можно посмотреть по ссылке http://help.yandex.ru/search/?id=481937.
4. Краткая история развития поисковых систем
В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.
Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.
Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.
Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.
В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.
В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google –самая популярная поисковая система в мире!
В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.
В настоящее время существуют три основные поисковые системы (международные) – Google, Yahoo и MSN, имеющие собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.
5. Состав и принципы работы поисковой системы
В России основной поисковой системой является «Яндекс», далее – Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».
Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.
Модуль индексирования
Модуль индексирования состоит из трех вспомогательных программ (роботов):
Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.
Ссылки извлекаются из тэгов a, area, base, frame, frameset, и др. Наряду со ссылками, многими роботами обрабатываются редиректы (перенаправления). Каждая скачанная страница сохраняется в следующем формате:
- URL страницы
- дата, когда страница была скачана
- http-заголовок ответа сервера
- тело страницы (html-код)
Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.
Indexer (робот- индексатор) – программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.
Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.
База данных
База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.
Поисковый сервер
Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.
Поисковый сервер работает следующим образом:
- Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).
- Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.
- В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).
- Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.
- Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.
Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.
По информации ООО «Рамблер Интернет Холдинг» обработка поискового запроса в системе «Рамблер» происходит, так, как это изображено на рисунке.

Запрос поступает в поисковую систему через маршрутизатор Cisco 6000 series. Cisco передает его наименее загруженной машине первого уровня - frontend (1.1 - 1.3, на рис. машине 1.3). Frontend, в свою очередь, отправляет запрос дальше, на один из восьми proxy-серверов, также выбирая наиболее свободный сервер (2.1 - 2.8, на рис. машине 2.2). Одновременно frontend отправляет запрос на машины, осуществляющие поиск по товарам (3.1 - 3.2, на рис. машине 3.1) и по базе Тор 100 (4.1 - 4.2, на рис. машине 4.1). На proxy проводится поиск по ссылочному индексу, и его результаты вместе с поисковым запросом передаются на машины, которые содержат основную индексную базу, - backends (5.1.х - 5.7.х, на рис. машинам 5.1.2, 5.2.11, 5.3.1 и т.д.) Та же информация отправляется на машины с "быстрой базой" (6.1 - 6.2).
На текущий момент в поиск включено 77 backend'ов. Они сгруппированы по 11 машин, и каждая группа содержит копию одной из частей поискового индекса. Таким образом, информация о сайтах, условно входящих в красный сектор Интернета, находится на backend'ах первой группы (5.1.1 - 5.1.11 на рис), оранжевый сектор - на backend'ах второй группы (5.2.1 - 5.2.11) и т.д. Proxy-сервер выбирает наименее загруженный backend в каждой группе машин и отправляет на него поисковый запрос с результатами ссылочного поиска. На backend'ах осуществляется поиск по частям индексной базы и ранжирование с учетом результатов поиска по ссылочному индексу. При ранжировании для всех найденных документов высчитываются веса по конкретному запросу.
После того, как запрос обработан на backend'ах, информация о результатах и ранжировании отдается обратно на proxy-сервер. Туда же поступают отсортированные результаты с машин "быстрой базы". Proxy интегрирует данные, полученные с восьми машин: клеит дубли, объединяет зеркала сайтов, переранжирует документы в общий список по весам, рассчитанным на backend'ах. Так, первым в списке найденного может быть документ с машины 5.3.1, вторым и третьим – с 6.1, четвертым - с 5.5.2 и т.д. На proxy-сервере также реализуется построение цитат к документам и подсветка слов запроса в тексте. Полученные результаты отдаются на frontend.
Помимо информации с proxy-сервера, frontend получает результаты из поиска по товарам и из базы Тор 100, отсортированные, с цитатами и подсветкой слов запроса. Frontend осуществляет окончательное объединение результатов, генерирует html со списком найденного, вставляет баннеры и перевязки (ссылки на различные разделы Рамблера) и отдает html Cisco, который маршрутизирует информацию пользователю.
При написании мастер-класса были использованы материалы и данные ООО «Рамблер Интернет Холдинг», RuSeo.info
6. Заключение
Теперь подытожим все вышесказанное.
- Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.
- Основные характеристики поисковых систем:
- Полнота
- Точность
- Актуальность
- Скорость поиска
- Наглядность
- Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.
- В состав поисковой системы входят компоненты:
- Модуль индексирования
- База данных
- Поисковый сервер
Надеемся, наш материал позволит вам поближе познакомиться с понятием ПС, лучше узнать основные функции, характеристики и принцип работы поисковых систем.
www.seonews.ru
Какие есть поисковые системы в интернет сети, какими пользуются в России: список с подробным описанием
Мы увеличиваем посещаемость и позиции в выдаче. Вы получаете продажи и платите только за реальный результат, только за целевые переходы из поисковых систем

Если уж разбираться в чем-то, то основательно. И если вы подписаны на наш блог, значит наверняка хотите стать крутым специалистом или желаете знать больше о поиске в сети. Чтобы достичь желаемого — фишечек и лайфхаков недостаточно. Нужно расширять кругозор.
Поисковая система - это большая и сложная программа предназначенная для поиска информации в интернете.
Вы вообще задумывались как появилось то, чем мы пользуемся каждый день, какие поисковые системы в интернете существуют и почему все студии работают только с Яндексом и Гуглом? Не стоит откладывать такие вопросы в долгий ящик. Всего 10 минут и вот еще одна тема для разговора, которые вы с легкостью сможете поддержать.
Как появились поисковики
Давным-давно, когда интернет был молод и зелен...
...пользователям, которых, надо сказать, было очень немного, хватало собственных закладок. Но это продолжалось недолго: вскоре человеку стало сложно ориентироваться в том многообразии, которое появилось в сети за короткий срок.
И чтобы как-то упорядочить хаос были придуманы каталоги Yahoo, DMOZ и прочие (некоторые существуют и по сей день), в которые авторы добавляли и сортировали по категориям появляющиеся сайты. На какое-то время жить стало проще.
Но интернет продолжал расширяться и вскоре размеры каталогов превратились в нечто умопомрачительно гигантское. Тогда разработчики впервые задумались о поиске внутри каталогов, а уже потом и о создании автоматизированной системы индексации всего, что находится в интернете, чтобы упростить работу всем пользователям.
Так и появились первые поисковые роботы.
Какая поисковая система была первой
Первой поисковой системой считается Wandex (ну путать с Yandex!). Этот и другие первые сервисы, конечно же, были далеки от совершенства. На поисковой запрос они выдавали совсем не то, что мы привыкли видеть сейчас, т.е. не наиболее релевантные страницы, а все подряд, игнорируя ранжирование. Первого января 2012 года Wandex был возобновлен.
Так свою работу начала первая ПС. Какие есть поисковые системы в современном интернете? Прилагаю список.
Какие бывают поисковые системы: короли танцпола
Удивительно, но есть те, кто спорят, как поисковая система лучше. Я бы этого делать не стала, просто по той причине, что они разные и вообще все зависит от цели и от того, какой вы пользователь.
Яндекс
Это самый популярный поисковик в нашей стране. LiveInternet утверждает, что Яндексом пользуются 50,9 %, в то время, как на Google приходится 40,6 % (данные от июня 2015).
Есть такой миф, мол, коммерческих запросов в Яндексе в разы больше, чем у ближайшего конкурента. Натыкалась пару раз на мысли о том, что благодаря отточенной годами региональности, тип аудитории или ее количество может различаться — в этом и заключается причина первенства Яндекса по коммерческим запросам. Так вот не верьте в это. Врут.
Поисковая система Google — самая популярная везде, кроме России:) Имеет кучу возможностей разной направленности. В общем, бесспорный мировой лидер среди поисковых роботов.
Сам Google появился примерно вместе с Яндексом, а к нам в Россию пришел лишь в 2004, когда компания Yandex укрепила свои позиции.
Процесс поиска в Google стал для многих землян уже нарицательным. Но когда я говорю своей маме “Загугли”, она все равно идет искать нужную ей информацию в Яндексе:) Она вообще не в курсе какие поисковые системы существуют в интернете.
Какие есть поисковые системы: список малоизвестных ПС
Большинство интернет-пользователей даже не в курсе, какие есть поисковые системы кроме Яндекса и Гугла. Так вот они есть;) Знакомьтесь!
Поисковая система Майл.ру
Поисковую долю этого поисковика сложно назвать крупной, но показатели потихонечку растут. Хотя не стоит упускать тот факт, что цифры эти напрямую зависят от “Одноклассников”, почты Майл.ру и других штук от Mail корпорации.

Рамблер
Это настоящий олдскул. Только представьте: когда появилась эта поисковая система, некоторые сеошники еще только учились ходить. Вообще, у Рамблера был шанс править балом в рунете, но этого не произошло по целому ряду причин. В настоящее время это уже не совсем поисковик, а своего рода набор сервисов, на которых в качестве поиска используется движок Yandex - например, есть свой каталог. Посещаемость, кстати, довольно приличная: за день главную страницу Rambler посещают чуть больше миллиона пользователей.
Также у Рамблера есть версия Rambler Lite (все то же самое, только без погоды, новостей, рекламы и прочего) и XRambler, на котором объединены сразу 15 поисковых систем.
Бинг
Сколько имен сменил это поисковик! За 8 лет он успел поносить имя MSN Search, затем Windows Live Search, потом сократил предыдущее название до Live Search и вот сейчас пришел к названию Bing. Многие утверждают, что качество поиска близко к заложенному стандарту Google.
Yahoo
Теперь сложно назвать Яху поисковой системой, так как по договору на всех площадках, принадлежащих Яху, используется поисковый движок Бинга. Последнюю новость про договор можно узнать на Searchengines.
Webalta
Наверняка этот, так называемый, поисковик вам знаком. Приходилось выковыривать его, словно клеща, из вашего браузера? Уже давно всем известно о темных делишках этого поисковика. Увы, никого эта ПС не интересует. Пользователи ищут лишь статьи о том, как удалить эту дрянь со своего компьютера.
Нигма
Это поисковая система значительно отличается от остальных. И если фильтрами поиска и индексной базой других поисковиков никого не удивишь, то вот способность решать задачи по химии и математике отличает Нигму от прочих ПС. Также Nigma предлагает поиск по музыке, книгам, играм и торрентам.
Спутник
Поисковик, созданный по заказу правительства России, считается первым в мире государственным поисковиком. Предлагает отдельный медицинский поиск (поиск аптек, лекарств и статей о заболеваниях). Весьма удобная тема с “Удобной страной”, где в одном месте собраны все рекомендации, помогающие гражданину. Вот, например, раздел “Документы”.
DuckDuckGo
Эта ПС значительно отличается от того, какие бывают поисковые системы в интернете. DuckDuckGo — поисковая система с открытым исходным кодом и интересной политикой, которая заключается в отказе от использования “пузыря фильтров”. Для тех, кто не знает: “пузырь фильтров” — это когда поисковик показывает в выдаче только те результаты поиска, которые она же (эта ПС) посчитает необходимыми конкретному пользователю. При этом мнение самого пользователя никого не интересует. DuckDuckGo уверяет, что использование их поисковика гарантирует то, что вы получите всю информацию, которая есть у поисковой системы.
“УткаУткаИди” набирает обороты. Уже этим летом (2015 г.) создатель ПС сообщил о трех млрд запросов в годовом выражении.
Во время написания статьи у меня возникло несколько вопросов. В таких случаях на выдачу я не полагаюсь, да, и зачем, если рядом со мной сидит человек, который знает все об интернете? Мини-интервью с Игорем Ивановым.

Игорь Иванов
Руководитель студии SEMANTICA
Если мой сайт в ТОПе Google и Yandex, то будет ли мой сайт на вершине выдачи в других, менее крупных поисковиках?
Есть очень большая вероятность, что так и будет. Яндекс и Google развивают свои алгоритмы в правильном направлении и другие поисковые системы берут с них пример. Был случай, когда специалисты Google заметили, что поисковая система Bing не только копирует их алгоритмы, но результаты поиска.
Почему вероятность, а не полная уверенность? Потому, что другие поисковые системы не успеют подогнать свои алгоритмы ранжирования под эталон, которые задали их более успешные конкуренты.
Стоит ли вообще продвигаться в Спутнике, Майл и других “наших” поисковиках? Какая поисковая система лучше?
В Маил.ру, бесспорно, стоит. Там есть немного трафика, точнее его очень мало, но он есть — а это клиенты. Спутник и другие поисковики — это миф, как и социальная сеть “Мой мир”, все знают, что они существуют, но никто их не видел:)
Создавать новые поисковики — довольно утопичная идея. Как ты думаешь, почему периодически появляется что-то новенькое?
Я не склонен считать, что это утопичная идея, скорее глобальное потепление и челмедведосвин — вот это утопичные идеи.
Кто владеет информацией, тот владеет миром. Посмотри, сколько компаний зависят от поисковых систем, а сколько людей не знают никаких альтернатив? Кто откажется от такого? Любые инвестиции будут оправданы, если добиться результата.
И как следствие этого — бабло, огромное бабло, нескончаемые поступления бабла из воздуха, из ничего… Не нужны ни ресурсы, ни люди (имею в виду, что тебе не нужен миллион триллионов индусов, которые на каждый запрос пользователя роются в энциклопедии).
В настоящий момент качество поиска не влияет на количество пользователей. Возьмем, например, Google: в России он имел примерно 30-35% аудитории, но создал революционный браузер Хром и с помощью него увеличил свою аудиторию в разы.
Я уверен, что поисковая система даже со скромными технологиями , но с каким-то революционным подходом к маркетингу может получить аудиторию и отжать часть рынка.
semantica.in