Зміст:
Визначення - Що означає канонізація?
Канонізація - це процес перетворення даних, який передбачає більш ніж одне представлення у стандартно затверджений формат. Таке перетворення забезпечує відповідність даних канонічним правилам. Це порівнює різні подання для забезпечення еквівалентності, підраховує кількість різних структур даних, нав'язує змістовний порядок сортування та покращує ефективність алгоритму, тим самим усуваючи повторні обчислення.
Канонікалізація використовується у численних Інтернет-та комп’ютерних додатках для генерування канонічних даних з неканонічної інформації. Канонічне представлення даних широко використовується в Росії
оптимізація пошукових систем (SEO), веб-сервери, Unicode та XML.
Цей термін також відомий як C14N, стандартизація або нормалізація.
Техопедія пояснює канонізацію
У SEO оптимізація URL-адрес стосується веб-вмісту з більш ніж однією можливою URL-адресою. Це може створити розбіжності в пошуку, оскільки пошукова система може не знати, яка URL-адреса повинна відображатися. Канонікалізація вибирає найкращу URL-адресу з декількох варіантів, зазвичай посилаючись на домашні сторінки. Хоча певні URL-адреси здаються однаковими, веб-сервери повертають різні результати для URL-адрес. Пошукові системи розглядають лише одну URL-адресу в канонічній формі.
Комп'ютерна безпека базується на кананізації імені файлів. Деякі веб-сервери можуть мати правило безпеки для виконання файлів лише під певним каталогом. Потім файл виконується лише в тому випадку, якщо шлях має в своєму імені вказаний каталог. Слід особливо обережно перевірити, чи ім'я файлу є унікальним поданням. Така вразливість називається обхід каталогів.
Більшість символів у стандарті Unicode мають кодування змінної довжини. Це вимагає врахування кожного символу рядка і робить перевірку рядків більш складною. Якщо всі кодування символів не враховуються при впровадженні програмного забезпечення, виникає можливість помилок. Цю проблему можна усунути, використовуючи єдине кодування для кожного символу. Найкраща альтернатива, яку може взяти будь-яке програмне забезпечення - це перевірити, чи струна є каналізованою. Рядки, які не є кананізованими, можна відхилити.
Канонічний XML-документ - це XML-документ у канонічній формі XML. Він визначається канонічною специфікацією XML. Канонікалізація в XML виключає пробіл у тегах, сортує посилання на простір імен та усуває зайві, а також використовує особливі кодування символів. Він також видаляє декларації XML та DOCTYPE, на додаток до перетворення відносних URL-адрес в абсолютні URL-адреси.