Какво е „диференциална неприкосновеност на личния живот” и как поддържа данните ми анонимни?
Apple залага репутацията си, като гарантира, че данните, които събира от вас, остават частни. Как? Използвайки нещо, наречено „Диференциална поверителност“.
Какво е диференциална поверителност?
Apple обяснява това като такова:
Apple използва технологията за диференциална неприкосновеност, за да открие моделите на употреба на голям брой потребители, без да се нарушава неприкосновеността на личния живот. За да скриете самоличността на индивида, Differential Privacy добавя математически шум към малка извадка от модела на използване на индивида. Тъй като все повече хора споделят един и същ модел, започват да се появяват общи модели, които могат да информират и подобрят потребителския опит.
Философията зад Диференциалното поверителност е следният: всеки потребител, чието устройство, независимо дали е iPhone, iPad или Mac, добавя изчисления към по-голям набор от обобщени данни (голяма картина, образувана от различни по-малки снимки), не трябва да се разкрива като източникът, да не говорим какви данни са допринесли.
Apple не е единствената компания, която прави това - Google или Microsoft го използват още по-рано. Но Apple я популяризира, като го обсъди подробно в своята основна беседа на WWDC за 2016 година.
Как се различава това от други анонимни данни? Анонимните данни все още могат да се използват за извличане на лична информация, ако знаете достатъчно за дадено лице.
Да кажем, че хакерът може да има достъп до анонимна база данни, която разкрива ведомостта на компанията. Да кажем, че те също знаят, че Служител Х премества в друга област. След това хакерът може просто да потърси базата данни преди и след като служителят Х се движи и лесно да изведе дохода си.
С цел да се защити чувствителната информация на служителя X, диференциалната поверителност променя данните с математически „шум“ и други техники, така че ако потърсите базата данни, ще получите само приближение на колко (или някой друг) служител X е платено.
Следователно неговата неприкосновеност на личния живот се запазва поради „разликата“ между предоставените данни и шума, добавен към него, така че тогава е достатъчно неясно, че е почти невъзможно да се знае дали данните, които разглеждате, са всъщност конкретен индивид.
Как действа диференцираната конфиденциалност на Apple?
Диференцираната конфиденциалност е сравнително нова концепция, но идеята е, че тя може да даде на компанията си ясна представа, базирана на данни от своите потребители, без да знае какво точно тези данни казват или от кого произхождат.
Apple, например, разчита на три компонента, за да се заеме с диференцираната работа за поверителност на вашия Mac или iOS устройство: хеширане, поддискретизация и инжектиране на шум.
Хеширането взема низ от текст и го превръща в по-къса стойност с фиксирана дължина и смесва тези ключове в необратими случайни низове с уникални символи или „хеш“. Това скрива данните ви, така че устройството да не съхранява никое от тях в първоначалния си вид.
Подбирането на проби означава, че вместо да събира всяка дума за човек, Apple ще използва само по-малка извадка от тях. Например, да кажем, че имате дълъг текстов разговор с приятел, който свободно използва емотикони. Вместо да събира цялата тази беседа, подвземането може да използва само частите, в които се интересува Apple, като емотиконите.
И накрая, вашето устройство инжектира шум, като добавя случайни данни към оригиналния набор от данни, за да стане по-неясен. Това означава, че Apple получава резултат, който е маскиран някога толкова леко и следователно не е съвсем точен.
Всичко това се случва на вашето устройство, така че вече е било съкратено, смесено, семплирано и замъглено, преди дори да бъде изпратено в облака, за да може Apple да анализира.
Къде се използва диференциалната конфиденциалност на Apple?
Има различни случаи, при които Apple биха могли, може искате да събирате данни, за да подобрите своите приложения и услуги. Точно сега обаче, Apple използва само диференциална поверителност в четири специфични области.
- Когато достатъчно хора заместят дадена дума с конкретен емотикон, тя ще се превърне в предложение за всички.
- Когато се добавят нови думи към достатъчно местни речници, които ще се считат за обичайни, Apple ще го добави и в речника на всички останали.
- Можете да използвате термин за търсене в Spotlight и той ще ви предложи предложения за приложения и ще отвори тази връзка в споменатото приложение или ще ви позволи да го инсталирате от App Store. Например, кажете, че търсите „Стар Трек“, което предполага приложението IMDB. Колкото повече хора отварят или инсталират приложението IMDB, толкова повече той ще се показва в резултатите от търсенето на всички.
- Тя ще предостави по-точни резултати за подсказките за търсене в бележките. Например, кажете, че имате бележка с думата „ябълка“ в нея. Вие правите търсене на търсене и ви дава резултати не само за дефиницията на речника, но също така и за уебсайта на Apple, местоположенията на Apple Stores и така нататък. Вероятно, колкото повече хора докосват определени резултати, толкова по-високи и по-често те ще се появяват в търсенето за всички останали.
Да използваме emojis като пример. В iOS 10, Apple представи нова функция за замяна на емотикони в iMessage. Напишете думата „любов“ и можете да я замените със сърцевина емотикони. напишете думата „куче“ и - предполагате, че можете да я замените с емотикони за кучета.
По подобен начин е възможно вашият iPhone да предвиди какви емотикони искате, така че ако въвеждате съобщение „Ще ходя на кучето“, вашият iPhone ще ви помогне да предложат емотиконите на кучетата..
Така че, Apple взема всички тези малки части от iMessage данните, които събира, разглежда ги като цяло и може да изведе модели от това, което хората пишат и в какъв контекст. Това означава, че вашият iPhone може да ви даде по-интелигентен избор, тъй като ползва всички тези текстови разговори, които другите създават, и си мисли, че "това вероятно е емотиконите, които искате."
Това отнема село (на емотикони)
Недостатъкът на диференциалната конфиденциалност е, че той не дава точни резултати в малки проби. Неговата сила се състои в това, че специфичните данни са неясни, така че тя не може да бъде приписана на нито един потребител. За да работи и работи добре, трябва да участват много потребители.
Това е нещо като гледане на растерна снимка, която е изключително близо. Няма да можете да видите какво е това, ако погледнете само няколко бита, но като отстъпите назад и погледнете цялото нещо, картината става по-ясна и по-дефинирана, дори и да не е много висока резолюция.
Така, за да подобрим подмяната на емотикони и предвиждането (наред с другите неща), Apple трябва да събере данни от iPhone и Mac от цял свят, за да му даде все по-ясна картина на това какво правят хората и по този начин да подобри своите приложения и услуги. Тя се превръща в цялата тази рандомизирана, шумна, пренесена от тълпата информация и го изсипва за модели - например колко потребители използват емотиката на праскова на мястото на „задника“.
Така че, силата на Диференциалната поверителност се основава на това, че Apple ще може да изследва големи количества агрегирани данни, като същевременно гарантира, че не е по-разумно кой да им изпраща тези данни.
Как да се откажете от диференциалната поверителност в iOS и macOS
Ако все още не сте убедени, че Диференциалното Поверителност е точно за Вас, все пак имате късмет. Можете да се откажете направо от настройките на устройството си.
В устройството си с iOS докоснете „Настройки“ и след това „Поверителност“.
В екрана „Поверителност“ докоснете „Диагностика и използване“.
И накрая, на екрана Диагностика и използване докоснете „Не изпращай“.
В MacOS отворете Системните предпочитания и кликнете върху „Сигурност и поверителност“.
В предпочитанията за сигурност и поверителност щракнете върху раздела „Поверителност“ и се уверете, че „Изпращане на данни за диагностика и използване на Apple“ не е отметнато. Имайте предвид, че ще трябва да кликнете върху иконата за заключване в долния ляв ъгъл и да въведете системната си парола, преди да можете да направите тази промяна.
Очевидно е, че има много повече от Диференциалната поверителност, както на теория, така и на приложение, отколкото на това опростено обяснение. Месото и картофите му зависят в голяма степен от някаква сериозна математика и като такава може да стане доста тежка и сложна..
Надяваме се обаче това да ви даде представа как работи и че се чувствате по-уверени в компаниите, които събират определени данни, без да се страхуват да бъдат идентифицирани.