„Wyszukiwarka, którą kontrolujesz” - niejasności w You.com

19.04.2023 10:00 | 8 min

Tagi: NarzędziaPrywatnośćAI

Jakiś czas temu natknąłem się na usługę You.com. Reklamuje się ona jako innowacyjna wyszukiwarka wspierana przez AI. Udziela odpowiedzi na pytania, opierając się na danych ze stron internetowych. Posiada także inne narzędzia wspomagane AI, służące między innymi do tworzenia tekstów czy programowania. A to wszystko, jak twierdzą, z zachowaniem pełnej prywatności. I właśnie tej kwestii chciałbym się dziś przyjrzeć.

[Wstaw tutaj tabelę z porównaniem funkcji prywatności]

Taki napis można znaleźć w zakładce FAQ You.com pod pytaniem o ochronę prywatności użytkownika.

Zrzut ekranu zakładki FAQ - Pytanie: "How does You.com protect my privacy?" Odpowiedź: "You.com never sells your data to advertisers or follows you around the internet. You.com gives you the option to choose between a customized search experience through personal mode or an entirely private one through our private mode. Our private mode offers the most private search experience of any search engine. In private mode, You.com never stores your queries, preferences, or locations. That also means that localized queries (such as “best restaurants near me”) won’t work. In private mode, we only save whether the service is used at all, in order to prevent attacks and misuse of our servers. In private mode, while we do have to send anonymized query data to Microsoft, Yelp, weather services, and other apps, these queries come from the You.com IP address, so these partners won’t know who the query originated from. Even in personal mode, we strive to only store the minimal data necessary to make your experience better. Read our extended post on privacy here. (insert Privacy Features Comparison chart here)"

To nie jedyna taka niespodzianka w innym pytaniu również wspomnianej tabeli zabrakło.

Zrzut ekranu zakładki FAQ - Pytanie: "How does You.com compare to other search engines?" Odpowiedź: "Our aim is to make your life easier by summarizing the web for you, eliminating the need to open multiple tabs. We’ll also allow you to define your preferred sources, and whenever possible, show you results from the sources you prefer first— saving you time. Each of the rows represents one search app. These apps form an interface to your digital life. (need to insert Privacy Features Comparison here)"

Jakie wnioski można z tego wysnuć? Chociażby to, że odpowiedzi na pytania o prywatność zostały przygotowane „po macoszemu”. Tezę tą potwierdzają również literówki w odpowiedziach na inne pytania. Co ciekawe, wspomniana (a przynajmniej spełniająca założenia nazwy) tabela istnieje i pojawia się w innym miejscu. Jest w niej jednak trochę nieścisłości

DuckDuckGo gromadzi adresy IP, a my nie!

W dedykowanym artykule dotyczącym prywatności tabela porównująca funkcje innych wyszukiwarek faktycznie się znajduje.

Tabela porównująca You.com z Google i DuckDuckGo; istotne stwierdzenia wypunktowane poniżej

Żeby dalsza analiza była bardziej zrozumiała, wytłumaczę zawczasu, o co chodzi z adresami IP. Są to (w uproszczeniu) numery przypisywane do urządzeń (tu: komputerów/smartfonów) w sieci. Gdy otwieramy stronę internetową (wykonujemy żądanie GET do serwera HTTP), serwer „widzi” nasz adres IP. Nie kontrolujemy oprogramowania, które działa na serwerze, więc technicznie możliwe jest, że zapisze go on w jakimś pliku bez naszej wiedzy.

Co więcej, dzieje się tak domyślnie w tzw. logach dostępu (access log). Przykładowy wiersz może wyglądać tak:

127.0.0.1 - - [04/Apr/2023:15:24:42 +0200] "GET / HTTP/1.1" 200 3460 "-" "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:47.0) Gecko/20100101 Firefox/47.0"

Na początku znajdujemy informację o adresie IP (127.0.0.1) oraz dacie wykonania zapytania (04/Apr/2023:15:24:42 +0200). Resztę parametrów na razie pomijamy. W tym przykładzie chodzi tylko o to, że nie mając dostępu do serwera, nie możemy sprawdzić, czy dana strona zapisuje adresy IP odwiedzających.

You.com w swojej tabeli uparcie twierdzi, że nie udostępnia nikomu adresów IP, a w wersji prywatnej usługi w ogóle ich nie używa. Jednak przy DuckDuckGo (innej wyszukiwarce, która deklaruje dbanie o prywatność) zaznacza, że udostępnia ona adres IP podmiotom trzecim, a w rubryce wykorzystywania adresów IP pozostawia niewytłumaczony w legendzie znak zapytania. Tak jak wcześniej wspomniałem, bez dostępu do serwera nie można zweryfikować tych tez. Jedynym źródłem, na którym można polegać (ale nie gwarantuje ono prawdy), jest oświadczenie samego dostawcy danej usługi. W przypadku DuckDuckGo również pada deklaracja o niegromadzeniu adresów IP. Wygląda zatem na to, że You.com zamieściło niesprawdzone informacje w tabeli, co mogło wprowadzić użytkowników w błąd (dyskredytowanie konkurencji). Swoją drogą, wracając do braku możliwości weryfikowania tez nt. zbierania adresów IP, You.com również ma techniczną możliwość ich zbierania, niezależnie od tego, co napisano w tabeli.

Nie można jednak zaprzeczyć trafności porównania wyszukiwarek pod kątem telemetrii i wykorzystywania danych do ulepszania usługi. Na stronie DuckDuckGo można znaleźć informację o zapisywaniu anonimowych danych dotyczących wyszukiwań do usprawniania systemów wykrywania literówek. You.com deklaruje zaś, że (w trybie „Private search”) tego nie robi. Niemniej podobnie jak w przypadku adresów IP, możemy opierać się jedynie na oświadczeniach usługodawcy, bo nie istnieje techniczna możliwość zweryfikowania, co dzieje się na serwerach wyszukiwarki.

Reasumując, porównanie prezentowane przez You.com zawiera pewne niedomówienia, które mogą wprowadzić użytkownika w błąd.

Pan niezalogowany? Proszę się zarejestrować!

Drugą wątpliwą kwestią jest podejście do kont użytkowników w You.com. Aby uzyskać dostęp do ustawień wyszukiwarki, trzeba założyć konto w usłudze. Jest to jeszcze zrozumiałe w przypadku dostępu do dodatkowych narzędzi (np. YouChat), jednak przeglądarka, która tytułuje się „dbającą o prywatność”, nie powinna wymagać takich działań od użytkowników. Przykładowo, DuckDuckGo, z którym You.com się porównuje, umożliwia przechowywanie konfiguracji lokalnie na urządzeniu użytkownika, a opcja zapisu w chmurze jest fakultatywna i lepsza pod kątem prywatności użytkownik podaje jedynie hasło (You.com wymaga adresu e-mail).

Co ciekawe, You.com nie umożliwia ustawienia 128-znakowego hasła. W FAQ nie ma informacji na temat limitu znaków, a YouChat nie potrafi udzielić odpowiedzi na pytanie o takowy 🙃

Kto mnie kontroluje?

You.com reklamuje się jako „The AI Search Engine You Control” („Wyszukiwarka oparta o AI, którą kontrolujesz”). Biorąc pod uwagę fakt porównywania funkcji z DuckDuckGo, warto porównać także obszar „kontroli”. Spójrzmy zatem na opcje konfiguracji w You.com.

To opcje dostępne dla każdego użytkownika możemy zmienić podstawowe ustawienia, takie jak język, region, czy włączyć tryb „Private search”.

Ustawienia wyszukiwarki You.com: u góry przycisk "Make default", poniżej kolejno: wybór motywu, przycisk "App Store", włącznik tryby prywatnego, ustawienia regionu i okresu wyszukiwania i przyciski "All settings" i "Log Out". Na dole okna przyciski "Send feedback", "Join community", "Download the app" i "Help". W stopce odnośniki "Terms" i "We're hiring"

Dostępna jest także dedykowana strona ustawień, dostępna tylko dla zalogowanych użytkowników:

Dodatkowe ustawienia You.com: przełącznik skrótów klawiszowych i otwierania linków w nowej karcie

Z kolei w DuckDuckGo panel ustawień wygląda tak:

Ustawienia DuckDuckGo: region, język, bezpieczne wyszukiwanie, błyskawiczne odpowiedzi, nieskończone przewijanie, automatyczne ładowanie wyników, sugestie autouzupełniania, otwieranie linków w nowych kartach, reklamy, skróty klawiszowe, jednostki miary, renderowanie map, numery podziałów stron, linie oddzielające na końcach stron. Po prawej panel do zapisu konfiguracji w chmurze.

Patrząc na różnice między nimi, można uznać, że You.com kiepsko spełnia założenia „wyszukiwarki kontrolowanej przez użytkownika”.

Na stronie You.com nie znalazło się oczywiście porównanie obu wyszukiwarek pod tym kątem. Nie jest to oczywiście aspekt ściśle prywatnościowy (choć niekóre możliwości konfiguracji mogą być pomocne w zachowaniu większej prywatności). Nie wiem, co twórcy mieli na myśli, używając stwierdzenia o kontrolowaniu wyszukiwarki przez użytkownika, ale większe możliwości konfiguracji (szczególnie w zakresie gromadzenia niektórych danych) niewątpliwie takiej kontroli sprzyjają.

Te nieszczęsne ciastka

You.com na wspomnianej wcześniej dedykowanej stronie o prywatności deklaruje, że używa tylko cookies niezbędnych do działania strony (mechanizm uwierzytelniania, zapis ustawień), a w trybie prywatnym nie używa żadnych cookies.

Informacja o cookies na stronie You.com: "You.com does not use any external tracker, such as Google Analytics. Our personal mode sets cookies to enable authentication and customization of your search profile. All these cookies are first-party cookies. They are not used to track you around the web and only enable You.com‘s customization features. We use no cookies in private mode."

Jest to jednak nieprawda. Po pierwsze, You.com używa usługi Cloudflare, która zapisuje „własne” (technicznie zapisane są pod domeną you.com, ale obsługuje je Cloudflare) cookies niezależnie od trybu prywatnego w wyszukiwarce.

Zrzut ekranu otwartej strony You.com z włączonym trybem prywatnym i narzędzi deweloperskich przeglądarki Firefox, z wyświetlonym podglądem cookies. Widać, że mimo włączonego trybu prywatnego strona korzysta z cookies zapisując ustawienia wyszukiwania oraz identyfikatory (opisane w poniższym akapicie)

Przeprowadzony przeze mnie test wykazał również, że po włączeniu trybu prywatnego (informacja ta została zapisana pod kluczem incognito_guest), dalej wykorzystywane są cookies od Cloudflare (__cf_bm) oraz wewnętrzne (m.in. uuid_guest). O ile zapis wartości konfiguracyjnych nie wzbudza większych podejrzeń, o tyle przetrzymywanie sztucznie nadanego ID w trybie prywatnym jest praktyką wątpliwą pod względem prywatności. Nie wiem, do czego wykorzystywany jest identyfikator zapisany pod uuid_guest, ale technicznie umożliwia on wyodrębnienie wpisów dotyczących jednego użytkownika nawet w trybie prywatnym. Oczywiście nie musi tak się dziać, jednak aktualny stan rzeczy budzi wątpliwości w kontekście oświadczeń o nieużywaniu cookies.

Podsumowanie

Mimo porównywania możliwości You.com i DuckDuckGo, nie mogę stwierdzić, która usługa jest lepsza/gorsza. W tym artykule skupiłem się na analizie niedomówień i nieścisłości w oświadczeniach You.com, które w mojej ocenie dyskredytują ją jako usługę dbającą o prywatność. Jednak niezmiennie decyzja należy do użytkownika. Celowo zamieściłem moją opinię dopiero tutaj chcę, aby każdy mógł zapoznać się z możliwie jak najbardziej obiektywną analizą You.com i podjął własną, przemyślaną decyzję o ewentualnym korzystaniu z tej usługi.

Warto mieć na uwadze, że tego typu narzędzia często wiążą się ze zbieraniem wielu danych o użytkownikach. Nie dementuję w tym artykule użyteczności You.com, a jedynie podważam wątpliwe tezy co do prywatności wspomnianego serwisu.

Źródła

Do sprawdzenia You.com i napisania tego artykułu zainspirował mnie tekst TheLatestNow na Medium.

Udostępnij

Komentarze