Какво е URL (Uniform Resource Locator)?
Когато въведете адрес в уеб браузъра си, много неща се случват зад кулисите. Повечето от тях се определят от различните части на URL адреса, който сте въвели. Нека погледнем отблизо.
URL адресът може да се състои от куп различни части. Има име на хост, което препраща към IP адрес на определен ресурс в интернет и куп допълнителна информация, която казва на браузъра и сървъра как да се справят с нещата. Можете да мислите за IP адрес като за телефонен номер. Името на хоста е като името на човек, чийто телефонен номер искате да търсите. Стандартът, наречен DNS, работи във фонов режим като телефонен указател, като превежда по-удобните за човека имена на хостове в IP адресите, които мрежите използват за насочване на трафика.
Като имаме предвид тази аналогия, нека да разгледаме структурата на URL и как работи, за да стигнете до мястото, където искате да отидете.
Как е структуриран URL адресът
Структурата на URL адреса е определена за първи път от сър Тим Бърнърс-Лий - човекът, който е създал Мрежата и първия уеб браузър през 1994 година. URL-ите съчетават идеята за имена на домейни с идеята да се използва път на файл за идентифициране на конкретен структура на папки и файлове. Така че, това е подобно на използването на път като C: Документи Лични myfile.txt в Windows, но с някои допълнителни неща в началото, за да намерите правилния сървър в интернет, където този път съществува и протокола, използван за достъп до информация.
URL адресът се състои от няколко различни части. Вземете например основен URL адрес като този, показан на изображението по-долу.
Този прост URL е разделен на два основни компонента: схемата и органът.
схема
Много хора мислят за URL адрес като за уеб адрес, но не е толкова просто. Уеб адресът е URL адрес, но всички URL адреси не са уеб адреси. Други услуги, които имате достъп до интернет като FTP или дори локално подобни MAILTO, също са URL адреси. Частта от URL адреса на схемата (тези букви, последвани от двоеточие) означават протокола, с който приложение (като уеб браузъра) и сървърът трябва да комуникират.
Уеб адресите са най-често срещаният URL адрес, но има и други. Така че може да видите схеми като:
- Протокол за пренос на хипертекст (HTTP): Това е основният протокол на мрежата и определя какви действия трябва да предприемат уеб сървърите и браузърите в отговор на определени команди.
- HTTP Secure (HTTPS): Това е форма на HTTP, която работи върху защитен, криптиран слой за по-безопасно транспортиране на информация.
- File Transfer Protocol (FTP): Този протокол често се използва за прехвърляне на файлове по интернет.
В съвременните браузъри схемата не е технически необходима като част от URL адреса. Ако въведете уебсайт като “www.howtogeek.com”, браузърът автоматично ще определи правилния протокол, който да използва. Все пак някои други приложения (и протоколи) изискват използването на схема.
Власт
Органът на URL адрес (който се предшества от две наклонени черти) се разделя на няколко части. Нека започнем с много прост URL-вид, който ще ви отведе до началната страница на уебсайт.
В този прост пример цялата част "www.example.com" се нарича име на хост и се решава с IP адрес. Можете също така да въведете IP адрес в адресната лента на браузъра вместо името на хоста, ако случайно го знаете.
Но когато се анализира името на хоста, помага да го прочетете назад, за да разберете какво се случва, така че тук са тези компоненти:
- Домейн от първо ниво: В примера тук „com“ е домейн от най-високо ниво. Това са най-високото ниво в йерархията на DNS (DNS), използвана за превеждане на IP адреси в прости езикови адреси, които са по-лесни за запомняне от хората. Тези домейни от най-високо ниво се създават и управляват от Интернет корпорацията за присвоени имена и номера (ICANN). Трите най-често срещани домейна от най-високо ниво са .com, .net и .gov. Повечето страни имат свой собствен двубуквен домейн от най-високо ниво, така че ще видите домейни като .us (САЩ), .uk (Обединеното кралство), .ca (Канада) и много други. Има и някои допълнителни домейни от първо ниво (като .museum), които се спонсорират и управляват от частни организации. В допълнение към тях има и някои общи домейни от първо ниво (като .club, .life и .news).
- Под-домейн: Тъй като DNS е йерархична система, частите „www“ и „example“ от нашия примерен URL се считат за поддомейни. Частта "www" е поддомейн на домейна от най-високо ниво "com", а частта "www" е поддомейн на домейна "example". Ето защо често ще виждате компания с регистрирано име като „google.com“, разделена на отделни поддомейни като „www.google.com“, „news.google.com“, „mail.google.com“ и скоро.
Това е най-основният пример за раздела за права на URL адрес, но нещата могат да станат по-сложни. Има два други компонента, които разделът с права може да съдържа:
- Информация за потребителя: Разделът за пълномощни може също да съдържа потребителско име и парола за сайта, до който имате достъп. Не е обичайно тази структура да се вижда в URL адресите днес, но може да се случи. Ако е налична, частта за информация за потребителя е преди името на хоста и е последвана от знак @. Така че може да видите нещо като "//username:[email protected]", ако включва информация за потребителя.
- Номер на пристанище: Мрежовите устройства използват IP адреси, за да получават информация към правилния компютър в мрежата. Когато този трафик пристигне, номер на порт указва на компютъра приложението, за което е предназначен този трафик. Номерът на порта е друг елемент, който често няма да виждате при сърфирането в мрежата, но може да го видите в мрежови приложения (като игри), които изискват да въведете URL адрес. Ако URL адресът включва номер на порт, той идва след името на хоста и се предшества от двоеточие. Ще изглежда по следния начин: „//www.example.com:8080.“
Така че, това е схемата и частите от права за URL адрес, но както може би сте предположили, след като разгледахте много URL адреси, докато сърфирате в мрежата, те могат да включват още повече неща.
Пътища, заявки и фрагменти
Има три допълнителни части на URL адрес, които можете да видите след частта за управление: пътеки, заявки и фрагменти. Ето как работят.
път
Разделът за пълномощни на даден URL адрес изпраща вашия браузър (или каквото и да е приложение) на десния сървър в мрежа. Пътят, който следва - който работи точно като път в Windows, MacOS или Linux - ще ви отведе до правилната папка или файл на този сървър. Пътят се предшества от наклонена черта, а между всяка директория и поддиректория има наклонена черта:
www.example.com/folder/subfolder/filename.html
Последното парче е името на файла, който се отваря, когато влезете в уебсайта. Въпреки че може да не го виждате в адресната лента, това не означава, че не е там. Някои езици, използвани за създаване на уеб страници, скриват името на файла и разширенията, които разглеждате. Това прави URL адреса по-лесен за запомняне и въвеждане и му придава по-чист вид.
Запитване
Частта от URL адреса на заявката се използва за идентифициране на неща, които не са част от строга структура на пътя. Най-често ще ги виждате, когато извършвате търсене или когато уеб страница доставя данни чрез формуляр. Частта от заявката се предшества от въпросник и идва след пътя (или след името на хоста, ако пътят не е включен).
Например, вземете този URL адрес, когато потърсихме Amazon за ключовите думи „wi-fi extender“:
https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender
Формата за търсене предава информация на търсачката на Amazon. Следвайки въпросителен знак, можете да видите две части на заявката: URL за търсенето (това е частта „url = search-alias% 3Daps & field“) и ключовите думи, които въведохме (това е „ключови думи = wi-fi + част).
Това е доста прост пример и често ще виждате URL адреси с допълнителни (и по-сложни) променливи. Ето например URL адреса, когато потърсихме Google за ключовата дума „howtogeek“:
https://www.google.com/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrome… 69i57j69i60l4j0.1839j1j4 & sourceid = chrome & ie = UTF-8
Както виждате, там има различна информация. В този случай можете да видите, че има допълнителна информация, указваща езика за търсене, използвания от нас браузър (Chrome) и дори номера на версията на браузъра..
фрагмент
Крайният компонент на URL адрес, който може да видите, се нарича фрагмент. Фрагментът се предшества от хеш марка (#) и се използва за обозначаване на конкретно местоположение на уеб страница. Когато кодирате уеб страница, дизайнерите могат да създават котви за конкретни текстови заглавия. Когато подходящият фрагмент се използва в края на даден URL адрес, браузърът ви ще зареди страницата и ще прескочи до нея. Корените и URL адресите с фрагменти често се използват за създаване на таблици със съдържание на уеб страници, за да направят навигацията по-лесна.
Ето един пример. Страницата на "Уикипедия" за Възраждането е доста дълъг документ и е разделена на около 11 секции, всяка от които има няколко подсекции. Но всяко заглавие на страницата има включена котва, а съдържанието в горната част на статията включва връзки, които ви позволяват да преминете към различните раздели. Тези връзки работят чрез включване на фрагменти.
Можете също да използвате тези фрагменти директно в адресната лента или като споделени връзки. Например, искахте да покажете на някого секцията от тази страница, която обхваща Русия. Можете просто да им изпратите тази връзка:
https://en.wikipedia.org/wiki/Renaissance#Russia
Тази "Русия" част в края на URL-то ги прехвърля направо към този раздел след зареждането на страницата.
Така че там имате това - повече, отколкото вероятно някога сте искали да знаете за това как работят URL адресите.
Кредит за снимката: Pawel Horazy / Shutterstock