Структура и принципы Всемирной паутины

Всемирная паутина вокруг Википедии

Всемирную паутину образуют миллионы веб-серверов сети Интернет , расположенных по всему миру. Веб-сервер является программой , запускаемой на подключённом к сети компьютере и использующей протокол HTTP для передачи данных. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные веб-серверы способны динамически распределять ресурсы в ответ на HTTP-запрос. Для идентификации ресурсов (зачастую файлов или их частей) во Всемирной паутине используются единообразные идентификаторы ресурсов URI (англ. Uniform Resource Identifier ). Для определения местонахождения ресурсов в сети используются единообразные локаторы ресурсов URL (англ. Uniform Resource Locator ). Такие URL-локаторы сочетают в себе технологию идентификации URI и систему доменных имён DNS (англ. Domain Name System ) - доменное имя (или непосредственно -адрес в числовой записи) входит в состав URL для обозначения компьютера (точнее - одного из его сетевых интерфейсов), который исполняет код нужного веб-сервера.

Для обзора информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа - веб-браузер . Основная функция веб-браузера - отображение гипертекста. Всемирная паутина неразрывно связана с понятиями гипертекста и гиперссы́лки . Большая часть информации в Вебе представляет собой именно гипертекст. Для облегчения создания, хранения и отображения гипертекста во Всемирной паутине традиционно используется язык HTML (англ. HyperText Markup Language ), язык разметки гипертекста. Работа по разметке гипертекста называется вёрсткой, ма́стера по разметке называют веб-мастером или вебмастером (без дефиса). После HTML-разметки получившийся гипертекст помещается в файл , такой HTML-файл является основным ресурсом Всемирной паутины. После того, как HTML-файл становится доступен веб-серверу, его начинают называть «веб-страницей». Набор веб-страниц образует веб-сайт . В гипертекст веб-страниц добавляются гиперссылки. Гиперссылки помогают пользователям Всемирной паутины легко перемещаться между ресурсами (файлами) вне зависимости от того, находятся ресурсы на локальном компьютере или на удалённом сервере. Гиперссылки веба основаны на технологии URL.

Технологии Всемирной паутины

Для улучшения визуального восприятия веба стала широко применяться технология CSS , которая позволяет задавать единые стили оформления для множества веб-страниц. Ещё одно нововведение, на которое стоит обратить внимание, - система обозначения ресурсов URN (англ. Uniform Resource Name ).

Популярная концепция развития Всемирной паутины - создание семантической паутины . Семантическая паутина - это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в сети информацию более понятной для компьютеров. Семантическая паутина - это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру. Семантическая паутина открывает доступ к чётко структурированной информации для любых приложений, независимо от платформы и независимо от языков программирования . Программы смогут сами находить нужные ресурсы, обрабатывать информацию, классифицировать данные, выявлять логические связи, делать выводы и даже принимать решения на основе этих выводов. При широком распространении и грамотном внедрении семантическая паутина может вызвать революцию в Интернете. Для создания понятного компьютеру описания ресурса, в семантической паутине используется формат RDF (англ. Resource Description Framework ), который основан на синтаксисе XML и использует идентификаторы URI для обозначения ресурсов. Новинки в этой области - это RDFS (англ.) русск. (англ. RDF Schema ) и SPARQL (англ. Protocol And RDF Query Language ) (произносится как «спа́ркл»), новый язык запросов для быстрого доступа к данным RDF.

История Всемирной паутины

Изобретателями всемирной паутины считаются Тим Бернерс-Ли и в меньшей степени, Роберт Кайо . Тим Бернерс-Ли является автором технологий HTTP, URI/URL и HTML. В 1980 году он работал в Европейском совете по ядерным исследованиям (фр. Conseil Européen pour la Recherche Nucléaire, CERN ) консультантом по программному обеспечению. Именно там, в Женеве (Швейцария), он для собственных нужд написал программу «Энквайр» (англ. Enquire , можно вольно перевести как «Дознаватель»), которая использовала случайные ассоциации для хранения данных и заложила концептуальную основу для Всемирной паутины.

Первый в мире веб-сайт был размещён Бернерсом-Ли 6 августа 1991 года на первом веб-сервере доступном по адресу http://info.cern.ch/, (). Ресурс определял понятие Всемирной паутины , содержал инструкции по установке веб-сервера, использования браузера и т. п. Этот сайт также являлся первым в мире интернет-каталогом, потому что позже Тим Бернерс-Ли разместил и поддерживал там список ссылок на другие сайты.

На первой фотографии во Всемирной паутине была изображена пародийная филк -группа Les Horribles Cernettes . Тим Бернес-Ли попросил их отсканированные снимки у лидера группы после CERN Hardronic Festival.

И всё же теоретические основы веба были заложены гораздо раньше Бернерса-Ли. Ещё в 1945 году Ванна́вер Буш разработал концепцию Memex (англ.) русск. - вспомогательных механических средств «расширения человеческой памяти ». Memex - это устройство, в котором человек хранит все свои книги и записи (а в идеале - и все свои знания, поддающиеся формальному описанию) и которое выдаёт нужную информацию с достаточной скоростью и гибкостью. Оно является расширением и дополнением памяти человека. Бушем было также предсказано всеобъемлющее индексирование текстов и мультимедийных ресурсов с возможностью быстрого поиска необходимой информации. Следующим значительным шагом на пути ко Всемирной паутине было создание гипертекста (термин введён Тедом Нельсоном в 1965 году).

Семантическая паутина предполагает улучшение связности и релевантности информации во Всемирной паутине через введение новых форматов метаданных .
Социальная паутина полагается на работу по упорядочиванию имеющейся в Паутине информации, выполняемую самими пользователями Паутины. В рамках второго направления наработки, являющиеся частью семантической паутины, активно используются в качестве инструментов (RSS и другие форматы веб-каналов , OPML , микроформаты XHTML). Частично семантизированные участки Дерева категорий «Википедии» помогают пользователям осознанно перемещаться в информационном пространстве, однако, очень мягкие требования к подкатегориям не дают основания надеяться на расширение таких участков. В связи с этим интерес могут представлять попытки составления атласов Знания.

Существует также популярное понятие Web 2.0 , обобщающее сразу несколько направлений развития Всемирной паутины.

Способы активного отображения информации во Всемирной паутине

Информация в вебе может отображаться как пассивно (то есть пользователь может только считывать её), так и активно - тогда пользователь может добавлять информацию и редактировать её. К способам активного отображения информации во Всемирной паутине относятся:

Следует отметить, что это деление весьма условно. Так, скажем, блог или гостевую книгу можно рассматривать как частный случай форума, который, в свою очередь, является частным случаем системы управления контентом. Обычно разница проявляется в назначении, подходе и позиционировании того или иного продукта.

Отчасти информация с сайтов может также быть доступна через речь. В Индии уже началось тестирование системы, делающей текстовое содержимое страниц доступным даже для людей, не умеющих читать и писать.

World Wide Web иногда иронично называют Wild Wild Web (дикий, дикий Web) - по аналогии с названием одноименного фильма Wild Wild West (Дикий, дикий Запад) .

См. также

Примечания

Литература

Филдинг, Р.; Геттис, Дж.; Могул, Дж.; Фристик, Г.; Мазинтер, Л.; Лич, П.; Бернерс-Ли, Т. (Июнь 1999). «Hypertext Transfer Protocol - http://1.1 » (Information Sciences Institute).
Бернерс-Ли, Тим; Брэй, Тим; Конноли, Дэн; Коттон, Пол; Филдинг, Рой; Джекл, Марио; Лилли, Крис; Мендельсон, Ной; Оркард, Дэвид; Уолш, Норман; Уиллиамс, Стюарт (Декабрь 15, 2004). «Architecture of the World Wide Web, Volume One » (W3C).
Поло, Лучано World Wide Web Technology Architecture: A Conceptual Analysis . New Devices (2003). Архивировано из первоисточника 24 августа 2011. Проверено Июль 31 2005.

Ссылки

Официальный сайт Консорциума Всемирной паутины (World Wide Web Consortium (W3C)) (англ.)
Tim Berners-Lee, Mark Fischetti. Плетя паутину: истоки и будущее Всемирной паутины = Weaving the Web: The Original Design and Ultimate Destiny of the World Wide Web. - New York: HarperCollins Publishers (англ.) русск. . - 256 p. - ISBN 0-06-251587-X , ISBN 978-0-06-251587-2 (англ.)

Другие организации, занимающиеся развитием Всемирной паутины и Интернета в целом

Веб и веб-сайты
Глобально
Локально
Виды сайтов и сервисов
Создание и обслуживание
Типы макетов, страниц, сайтов
Техническое
Маркетинг
Социум и культура

Семантическая паутина
Основы	Всемирная паутина · Интернет · Гипертекст · Базы данных · Семантические сети · Онтологии · Дескрипционная логика
Подразделы	Linked Data · Data Web · Hyperdata · Dereferenceable URIs · Rule bases · Data Spaces
Приложения	Семантическая вики · Semantic publishing · Semantic search · Semantic computing · Semantic advertising · Semantic reasoner · Semantic matching · Semantic mapper · Semantic broker · Semantic analytics · Semantic service oriented architecture
Связанные темы	Фолксономия · Библиотека 2.0 · Веб 2.0 Ссылки · Информационная архитектура · Управление знаниями · Коллективный интеллект · Тематические карты · Mindmapping · Метаданные · Geotagging · Web science
Стандарты	Синтаксис : RDF (RDF/XML · Нотация 3 · Turtle · N-Triples) · SPARQL · URI · HTTP · XML Схемы, онтологии : RDFS · OWL · Rule Interchange Format · Semantic Web Rule Language · Common Logic ·

Для любого современного жителя планеты компьютер без доступа к интернету – вещь бесполезная. Глобальная паутина служит быстрым, удобным и лучшим способом взаимодействия с внешним миром, однако так было не всегда. Еще в середине 20 века это слово совершенно ничего не значило.

Вспомним былое

Так когда же был создан интернет, кем и для чего? Основоположниками идеи, как ни странно, являются американские специалисты. Всё началось в октябре 1957 года, когда Советским Союзом был выпущен искусственный спутник Земли, что и подвигло американцев на решительные действия.

Министерство обороны США, ощутив явное превосходство русской нации, решило создать надежную и оперативную систему обмена информацией. Такая система должна была помочь стране в случае внезапной войны. Столь нелегкую ответственность возложили на ведущие университеты Америки.

Благодаря хорошему финансированию исследовательский центр Стенфорда и университеты Лос-Анджелеса, Санта-Барбары, а также Юты сумели воплотить задумку в жизнь к 1969 году. Четыре учебных заведения были объединены в общую сеть под названием “Advanced Research Projects Agency Network” (сокр. ARPANET).

Дата «Рождения» всемирной паутины

Уже в первые месяцы невозможно было не оценить эффективность электронного новшества. Система начала активно развиваться, получив множество одобрений со стороны многих ученых и исследователей прошлого века. В конце октября 1969 года был проведен первый благополучный сеанс связи между двумя университетами.

Именно 29 октября 1969 – дата появления интернета. Сотрудник Калифорнийского института Чарли Клайн установил удаленное соединение, которое посредством телефонного разговора подтверждал работник Стенфорда Билл Дюваль. Конечно, не всё проходило гладко, но связь всё-таки удалось наладить.

Процесс развития

Как говорится, хорошее на полке на залеживается. Это выражение не стало исключением и для сети. Спустя два года после установления удаленной связи была изобретена любимая нами электронная почта. Это случилось 2 октября 1971 года благодаря трудам Рэя Томлинсона, ведущего инженера научной корпорации BBN TECHNOLOGIES.

Идея исследователя – создание разделительного знака между пользовательским логином и доменом. Не задумываясь, мы и сейчас активно применяем этот символ, называя его простым человеческим словом «собака». Рэй помог сделать сеть массовой, приобщив сотни тысяч заинтересованных людей.

Но даже тогда понятия и концепции Всемирной паутины не существовало. Было лишь облачное пространство для обмена данными на значительном расстоянии, куда входила и пересылка электронных писем и разного рода рассылка, новостные группы, доски частных объявлений.

Автор истинной мировой паутины

С 1971 до 1989 года была проделана колоссальная работа над расширением возможностей интернет-сети. Активно развиваются протоколы передачи данных, над которыми усердно трудился Джонатан Постел. Была разработана система доменного имени. Был успешно внедрен протокол, позволяющий реальное общение.

И только в 1989 году сотрудник IMAGE COMPUTER SYSTEMS LTD, занимающийся коммуникативным ПО и архитектурой систем в режиме онлайн, предлагает руководству компании доктрину “World Wide Web” (Всемирная паутина). Имя основоположника замысла Тимоти Джон Бернес-Ли.

Бернес-Ли выпускник-отличник Оксфордского университета со степенью бакалавра-физика. Название концепции “World Wide Web” он придумал самостоятельно, опираясь на свою работу и основываясь на названии всем известного протокола. Все мы привыкли называть его «тройное дабл-ю» или «ввв» (www).

К концу 1989 года в США и Европе востребован не только имейл, но и общение в реальном времени, разнообразные новостные ленты, развивается коммерческая деятельность. Тим Бернес-Ли не останавливается на достигнутом, а продолжает модернизировать новомодную систему.

Новое лицо

Талантливый физик-программист разрабатывает веб-сервер и первый в истории веб-обозреватель. Именно его усилиями были созданы: редактор страниц, традиционный способ записи адреса сайта, язык гипертекстовой разметки (HTML), протоколы передачи данных. В 1990 году к нему присоединяется бельгиец Роберт Кайо.

Роберт состоял на службе в Европейском центре ядерных исследований(CERN). Он возглавлял отдел, который на тот момент занимался вычислительными системами в отделении обработки данных. Старания Кайо были направлены на получение основного финансирования для проекта Тима Бернеса.

Кроме финансовой части и организационных вопросов, Роберт Кайо принимал активное участие в разработке и продвижении интернета. Однако он не оставил за собой права соавтора, вследствие чего был практически забыт. В истории все чаще звучит только лишь имя исследователя Тима Бернеса-Ли.

Заключение

Интересно, думали ли все упомянутые люди о том, что в 2016 году мир буквально погрузится в просторы интернета. Будет установлена спутниковая связь, видеообщение и другое. В каждой стране появится свой термин глобального интернета, отображающий языковую принадлежность (РУНЕТ) и демонстрирующий национальные домены.

К слову, первый домен Российской Федерации (RU) был зарегистрирован весной 1994 года. Теперь каждый из читателей знает когда, как и кем был придуман и внедрен интернет. Сегодня – это передовое достижение науки и технологий, являющееся органичной частью современного общества.

Всемирная паутина (сокращенно World Wide Web или WWW) - это единство информационных ресурсов, которые связаны между собой средствами телекоммуникаций и основаны на гипертекстовом представлении данных, разбросанных по всему миру.

Годом рождения Всемирной паутины считается 1989 год. Именно в этом году Тим Бернерс-Ли предложил общий гипертекстовый проект, который получил впоследствии название Всемирной паутины.

Создатель «паутины» Тим Бернес-Ли, работая в лаборатории физики элементарных частиц европейского центра ядерных исследований «CERN» В Женеве (Швейцария), совместно с партнером Робертом Кайо занимались проблемами применения идей гипертекста для построения информационной среды, которая упростила бы обмен информацией между физиками.

Итогом данной работы явился документ, в котором рассматривались понятия, имеющие принципиальное значение для «паутины» в ее современном виде, и были предложены идентификаторы URI, протокол HTTR и язык HTML. Без данных технологий уже нельзя представить современный Интернет.

Бернерс-Ли создал первый в мире веб-сервер и первый в мире гипертекстовый веб-браузер. На первом в мире веб-сайте он описал, что такое Всемирная паутина и как установить веб-сервер, как использовать браузер и т.п. Этот сайт являлся и первым в мире Интернет-каталогом.

Начиная с 1994 года самые главные задачи по развитию Всемирной паутины взял на себя Консорциум Всемирной паутины (World Wide Web Consortium, WЗС ), который организовал и до сих пор возглавляет Ким Бернес-Ли. Консорциум разрабатывает и внедряет технологические стандарты для Интернета и Всемирной паутины. Миссия WЗС: «Полностью раскрыть потенциал Всемирной паутины, путем создания протоколов и принципов, гарантирующих долгосрочное развитие Сети» . WЗС разрабатывает «Рекомендации», что бы достичь совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной.

Поисковые системы: состав, функции, принципы работы.

Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google» , «Yahoo» , «MSN» . В русском Интернете это – «Яндекс» , «Рамблер» , «Апорт» .

Опишем основные характеристики поисковых систем :

Полнота

Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

Точность

Точность - еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

Актуальность

Актуальность - не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

Скорость поиска

Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

Наглядность

Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска.одробные пояснения по странице результатов поиска, например у «Яндекса» можно посмотреть по ссылке http://help.yandex.ru/search/?id=481937 .

Краткая история развития поисковых систем

В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.

Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.

Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.

Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.

В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире!

В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.

В настоящее время существуют три основные международные поисковые системы – Google, Yahoo и MSN, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.

Состав и принципы работы поисковой системы

В России основной поисковой системой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

Модуль индексирования

Модуль индексирования состоит из трех вспомогательных программ (роботов):

Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.

URL страницы

дата, когда страница была скачана

http-заголовок ответа сервера

тело страницы (html-код)

Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.

Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

База данных

База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

Поисковый сервер

Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

Поисковый сервер работает следующим образом:

Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).

Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.

В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).

Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.

Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

Ни одна поисковая система не охватывает все ресурсы Интернет.

Каждая поисковая система собирает сведения о ресурсах Интернет, применяя свои уникальные методы, и формирует собственную периодически обновляемую базу данных. Доступ к этой базе предоставляется пользователю.

Поисковые системы реализуют два способа поиска ресурса:

Поиск по тематическим каталогам - информация представляется в виде иерархической структуры. На верхнем уровне - общие категории (“Интернет”, “Бизнес”, “Искусство”, “Образование” и т.д.), на следующем уровне категории делятся на разделы и т.д. Самый нижний уровень - ссылки на конкретные веб-страницы или другие информационные ресурсы.

Поиск по ключевым словам (индексный поиск или детальный) - пользователь отправляет поисковой системе запрос , состоящий из ключевых слов. Система возвращает пользователю перечень найденных по запросу ресурсов.

Большинство поисковых систем сочетают оба способа поиска.

Поисковые системы могут быть локальными, глобальными, региональными и специализированными.

В русской части Интернет (Рунет) наиболее популярны сейчас поисковые системы общего назначения Rambler (www.rambler.ru), Яндекс (www.yandex.ru), Апорт (www.aport.ru), Гугл (www.google.ru).

Большинство поисковых систем реализовано в виде порталов.

Портал (от англ. portal - главный вход, ворота) -это веб-сайт, который интегрирует различные сервисы Интернет: средства поиска, почту, новости, словари и т.д.

Порталы могут быть специализированными (как, www . museum . ru ) и общими (например, www . km . ru ).

Поиск по ключевым словам

Набор ключевых слов, по которым ведется поиск, называют также критерием поиска или темой поиска.

Запрос может состоять как из одного слова, так и из сочетания слов, объединенных операторами - символами, по которым система определяет, какое действие ей нужно произвести. Например: запрос “Москва Питер” содержит оператор И (так воспринимается пробел), который указывает, что надо искать документы, в которых есть оба слова - и Москва, и Питер.

Для того, чтобы поиск был релевантным (от англ. relevant -уместный, относящийся к делу), следует учитывать несколько общих правил:

Независимо от того, в какой форме употреблено слово в запросе, поиск учитывает все его словоформы по правилам русского языка. Например, по запросу “билет” будут найдены и слова “билетом”, “билету” и т.д.

Заглавные буквы следует использовать только в именах собственных, чтобы не просматривать лишние ссылки. По запросу “кузнецов”, например, будут найдены документы, где говорится и о кузнецах, и о Кузнецовых.

Желательно сужать круг поиска, используя несколько ключевых слов.

Если нужного адреса нет среди первой двадцатки найденных адресов, следует изменить запрос.

Каждая поисковая система использует свой язык запросов. Для знакомства с ним, пользуйтесь встроенной справкой поисковой системы

Крупные сайты могут иметь встроенные системы поиска информации в пределах своих веб-страниц.

Запросы в подобных системах поиска, как правило, строятся по тем же правилам, что и в глобальных поисковых системах, однако знакомство со справкой и здесь не будет лишним.

Расширенный поиск

Поисковые системы могут предоставлять в распоряжение пользователя механизм, позволяющий формировать сложный запрос. Переход по ссылке Расширенный поиск дает возможность редактировать параметры поиска, указывать дополнительные параметры и выбирать наиболее удобную форму показа результатов поиска. Ниже описаны параметры, которые могут быть заданы при расширенном поиске в системах Япс1ех и Rambler.

Описание параметра	Название в Яндекс	Название в Rambler
Где искать ключевые слова (заголовок документа, основной текст и т.д.)	Словарный фильтр	Поиск по тексту...
Какие слова должны или не должны присутствовать в документе и насколько точным должно быть совпадение	Словарный фильтр	Искать слова запроса... Исключить документы, содержащие следующие слова...
На каком расстоянии друг от друга должны располагаться ключевые слова	Словарный фильтр	Расстояние между словами запроса...
Ограничение на дату документа		Дата документа...
Ограничение поиска пределами одного или нескольких сайтов	Сайт/Вершина	Искать документы только на следующих сайтах...

Ограничение поиска по языку документа		Язык документа...
Поиск документов, содержащих картинку с определенным именем или подписью	Изображение
Поиск страниц, содержащих объекты	Специальные объекты
Форма представления результатов поиска	Формат выдачи	Вывод результатов поиска

Некоторые поисковые системы (например, Яндекс) позволяют вводить запросы на естественном языке. Вы пишите, что нужно найти (например: заказ билетов на поезд из Москвы в Питер). Система анализирует запрос и выдает результат. Если он Вас не устраивает, переходите на язык запросов.

Мировая информационная паутина

Всемирная паутина -- распределённая система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету. Для обозначения Всемирной паутины также используют слово «веб» (перевод с английского web означает «паутина») и аббревиатуру WWW. Всемирную паутину образуют сотни миллионов веб-серверов. Большинство ресурсов всемирной паутины основаны на технологии гипертекста. Гипертекстовые документы, размещаемые во Всемирной паутине, называются веб-страницами. Несколько веб-страниц, объединённых общей темой, дизайном, а также связанных между собой ссылками и обычно находящихся на одном и том же веб-сервере, называются веб-сайтом. Для загрузки и просмотра веб-страниц используются специальные программы -- браузеры. Всемирная паутина вызвала настоящую революцию в информационных технологиях и взрыв в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину, однако важно понимать, что это не одно и то же.

История всемирной паутины

Изобретателями всемирной паутины считаются Тим Бернерс-Ли и, в меньшей степени, Роберт Кайо. Тим Бернерс-Ли является автором технологий HTTP, URI/URL и HTML. В 1980 году он работал в Европейском совете по ядерным исследованиям консультантом по программному обеспечению. Именно там, в Женеве (Швейцария), он для собственных нужд написал программу «Энквайр», которая использовала случайные ассоциации для хранения данных и заложила концептуальную основу для Всемирной паутины. В 1989 году, работая в CERN над внутренней сетью организации, Тим Бернерс-Ли предложил глобальный гипертекстовый проект, теперь известный как Всемирная паутина.

Проект подразумевал публикацию гипертекстовых документов, связанных между собой гиперссылками, что облегчило бы поиск и консолидацию информации для учёных CERN. Для осуществления проекта Тимом Бернерсом-Ли были изобретены идентификаторы URI, протокол HTTP и язык HTML. Это технологии, без которых уже нельзя себе представить современный Интернет. В период с 1991 по 1993 год Бернерс-Ли усовершенствовал, технические спецификации этих стандартов и опубликовал их. Но, всё же, официально годом рождения Всемирной паутины нужно считать 1989 год. В рамках проекта Бернерс-Ли написал первый в мире веб-сервер httpd и первый в мире гипертекстовый веб-браузер, называвшийся WorldWideWeb. Этот браузер был одновременно и WYSIWYG-редактором, его разработка была начата в октябре 1990 года, а закончена в декабре того же года.

Все большее место в нашей жизни занимает Интернет. Еще ни одна технология, созданная человеком, не приобрела такой широкой популярности. Интернет - Всемирная паутина, которая охватывает весь земной шар, окутывая его сетью из телевышек. Свою популярность он начал приобретать еще в относительно далекие 1990-е годы. В статье мы и обсудим, откуда он взялся и по какой причине стал столь популярен.

Интернет как Всемирная паутина

Второе название подобного плана привелось неспроста. Дело в том, что Интернет объединяет множество пользователей по всему миру. Подобно сети паука, он окутывает весь земной шар своими нитками. И это не обычная метафора, так и есть на самом деле. Интернет представляет собой провода и беспроводные сети, вторые из которых нам не видны.

Но это лирическое отступление, на самом деле Интернет связан со Всемирной паутиной (www, или Word Wide Web). Она охватывает все компьютеры, подключенные к Сети. На удаленных серверах пользователи хранят нужную информацию, а также могут общаться в Сети. Нередко под этим названием понимают Всемирную или Глобальную сети.

Она базируется на нескольких особо важных протоколах, по-типу TCP/IP. Благодаря Интернету Всемирная паутина, или по другому Word Wide Web (WWW) осуществляет свою деятельность, то есть передает и получает данные.

Количество пользователей

В конце 2015 года было проведено исследование, на основании которого получены следующие данные. Количество пользователей Интернета по всему миру составляет 3,3 миллиарда человек. А это почти 50 % от всего населения нашей планеты.

Столь высокие показатели были достигнуты благодаря распространению сотовых сетей 3G и высокоскоростной 4G. Немаловажную роль сыграли провайдеры, благодаря массовости внедрения интернет-технологий, уменьшились затраты на содержание серверов и изготовление оптоволоконных кабелей. В большинстве стран Европы скорость интернета выше, чем в странах Африки. Это объясняет техническим отставанием последней и неширокой востребованностью услуги.

Почему Интернет называют Всемирной паутиной?

Как это не парадоксально, но многие юзеры уверены, что вышеуказанный термин и Интернет - это одно и тоже. Это глубокое заблуждение, витающее в головах многих пользователей, вызвано схожестью понятий. Сейчас мы разберемся, что к чему.

Всемирная паутина зачастую путается с похожим словосочетанием "Всемирная сеть". Она представляет собой определенный информационный объем, базирующийся на основе технологии интернета.

История World Wide Web

К концу 90-х годов в мире окончательно утверждается доминация NSFNet над технологией ARPANET. Как ни странно, но их разработкой занимался один научный центр. По заказу военного министерства США была разработана ARPNET. Да-да, первыми, кто воспользовался Интернетом, были военные. А технология NSFNet разрабатывалась независимо от государственных служб, практически на чистом энтузиазме.

Именно конкуренция между двумя разработками стала почвой для их дальнейшего развития и массового внедрения в мир. Всемирная паутина сети Интернет стала доступна широким массам в 1991 году. Она должна была как-то работать, и разработкой системы для Интернета занялся Бернерс Ли. За два года успешной работы он создал гипертекст, или HTTP, знаменитый электронный язык HTML и URL. Нам не надо вдаваться в подробности, ведь сейчас мы их видим как обычные ссылки для адресов сайтов.

Информационное пространство

В первую очередь, это информационное пространство, доступ к которому осуществляется за счет Интернета. Она позволяет пользователю иметь доступ к данным, которые находятся на серверах. Если использовать наглядно-образный способ, то Интернет - это объемный цилиндр, а Всемирная паутина - это то, что его заполняет.

Посредством программы, называемой "браузер", пользователь получает доступ в Интернет для серфа по Паутине. Она состоит из неисчисляемого множества сайтов, которые базируются на серверах. Они подключены к компьютерам и отвечают за сохранность, загрузку, просмотр данных.

Паучьи сети и современный человек

В настоящее время Homo sapiens в развитых странах практически полностью интегрировались со Всемирной сетью. Речь не идет про наших дедушек с бабушками или об отдаленных селах, где и знать не знают про какой-то Интернет.

Раньше человек в поисках информации отправлялся прямиком в библиотеку. И часто случалось, что нужной ему книги не находилось, тогда приходилось ехать в другие заведения с архивами. Сейчас же надобность в подобных манипуляциях отпала.

В биологии все названия видов состоят из трех слов, так например наше полное название Homo sapiens neanderthalensis. Сейчас же можно смело прибавить четвертое слово internetiys.

Интернет захватывает умы человечества

Согласитесь, мы черпаем практически всю информацию из Интернета. В наших руках находятся тонны информации. Расскажи про такое нашему предку, он бы жадно уткнулся в экран монитора и просидел бы там все свое свободное время в поисках информации.

Именно Интернет вывел человечество на принципиально новый уровень, он способствует созданию новой культуры - смешанной или мульти. Представители разных народов мимикрируют и приспосабливаются, словно сливая свои обычаи в один котел. Откуда затем выходит итоговый продукт.

Особенно он полезен для научных деятелей, больше нет надобности собираться на консилиумах в стране, которая находится за 1000 км от вашей. Вы можете обменяться опытом и без личной встречи, например, через мессенджеры или социальные сети. А если важный вопрос надо обсудить, то можно сделать это через Skype.

Вывод

Всемирная паутина - это составляющая Интернета. Ее работа обеспечена благодаря серверам-хранилищам, которые и предоставляют информацию пользователю по его запросу. Сама Сеть была разработана благодаря ученым из США и их энтузиазму.