Lepsze niż Adblock: jak sztuczna inteligencja wygra obsesyjną reklamę

Walka z natrętną reklamą w Internecie nabrała charakteru wyścigu zbrojeń. Reklamodawcy i portale, zaniedbując standardy umieszczania materiałów komercyjnych, opracowują skrypty i technologiczne sposoby ominięcia zamków. Z kolei zapaśnicy z reklamą łączą sztuczną inteligencję i uczenie maszynowe z algorytmami zamykającymi wyświetlanie reklam podczas procesu ładowania strony. Oleksandr Parask, twórca Eyeo i Adblock Plus, mówił o zaawansowanych metodach walki z reklamą, wykorzystywaniu sztucznej inteligencji i przyszłości tej konfrontacji

Osoba, z reguły, może oddzielić treści reklamowe od nie reklamowanych w ułamku sekundy. Wszakże powinien być oznaczony specjalnymi etykietami "Reklama" lub "Materiał sponsorski / partnerski". Wszystko, co dana osoba może zrobić w 19459008 w mniej niż sekundę sztuczna inteligencja może również opanować sztukę.

Obecnie może być używana do blokowania reklam na dwa sposoby. Po pierwsze, dla analityki. Analiza danych to coś, co AI już robi bardzo dobrze. Jest to piśmienność analityczna, która pomaga lepiej blokować treści obsesyjne. Po drugie, z pomocą sztucznej inteligencji proces blokowania może być w pełni zautomatyzowany – tak, że reklama jest blokowana bezpośrednio w przeglądarce bez użycia jakichkolwiek filtrów.

Pierwsza jest już rzeczywistością, druga to nasza przyszłość, a najbliższa

Reklama blokowa – połowa sprawy

Dziś komputerowa wizja jest jedną z najlepiej zbadanych dziedzin sztucznej inteligencji. I to zadanie jest już uważane za częściowo rozwiązane: potrafi rozróżnić zdjęcia kotów od psów. W tym obszarze istnieje wiele gotowych algorytmów używanych do rozwiązywania powiązanych problemów. Łącznie z blokowaniem reklam.

Na początku lata opublikowano wersję beta Sentinelu, pierwszego algorytmu blokowania reklam opartych na sieciach neuronowych. Wykorzystuje mechanizmy widzenia komputerowego i współpracuje z obrazami: potrafi obliczyć treść reklamy przez zrzut ekranu strony, a nie przez jej kod.

Chociaż Sentinel to głównie projekt gromadzenia danych i budowania bazy reklamowej. Poprzez bota na Facebooku użytkownicy mogą wysyłać zrzuty ekranu stron zawierających uciążliwe reklamy w sieci społecznościowej. Na ich podstawie algorytm trenuje rozróżnianie treści reklamowych od nie-reklamowych. Okazuje się, że udało się. Ta technologia będzie używana do wewnętrznych procesów. Na przykład, aby codziennie monitorować witryny, aby zobaczyć, czy zawartość ma odpowiednią etykietę "Prawa reklamowe".

Obecnie filtry reklamowe działają na tej zasadzie: niektóre elementy, które są uznawane za niechciane, są blokowane nawet na etapie ładowania strony; inne już załadowane są po prostu ukrywane przed użytkownikiem. Nie jest trudno stworzyć algorytm blokujący reklamy, ale rozwiąże on tylko połowę problemu. Wiele elementów nie może być blokowanych na poziomie sieci, muszą być ukryte przed użytkownikiem, a nauczanie sztucznej inteligencji jest znacznie trudniejsze.

Szkolenie AI

Od 2019 roku technologia była wykorzystywana do innych procesów, w tym do bezpośredniego blokowania reklam. Planuje się, że w przyszłości AI będzie analizować zrzuty ekranu z obsesyjną treścią nie tylko na Facebooku, ale także poza siecią społecznościową. Na nich algorytm może kontynuować szkolenie. Oczywiście, wcześniej użytkownicy będą zapytani, czy są gotowi udostępnić dane do nauki AI.

Splotowa sieć neuronowa (ConvNet) jest używana głównie do analizy obrazu, ale nadaje się do wielu zadań. Takie modele dobrze rozpoznają pewne wzory na obrazach. Na przykład, aby zablokować reklamę, możesz nauczyć się rozpoznawać ją na etykietach stron z napisem "Reklama" nawet na etapie ładowania strony.

Dodatkowa weryfikacja za pomocą tego algorytmu pomoże w radzeniu sobie z technologiami, które są używane dzisiaj do obejścia standardowego filtrowania blokującego intruza reklama. W przyszłości nie tylko komputerowa wizja może zostać wykorzystana do opracowania tej technologii i do pełnej automatyzacji blokowania.

Rozpoznanie ścieżki każdego elementu

Przed pojawieniem się na stronie internetowej każdy element pokonuje trudną ścieżkę: zaczynając od żądania sieciowego i kończąc na skrypcie, który dodaje element do strony. Opis tej ścieżki nazywa się wykresem – pokazuje, w jaki sposób element pojawił się na stronie. Korzystając z analizy takich informacji behawioralnych, można zrozumieć, czy elementy wykresu są reklamą, czy nie.

Jednak problem polega na tym, że wykresy są trudne do wyizolowania z przeglądarki. Możesz dowiedzieć się, jakie zapytania przeglądarka wysyła do sieci i jakie elementy pojawiają się na stronie, ale łączenie tych danych razem i tworzenie wykresu na ich podstawie jest bardzo trudne.

Jeśli w przyszłości będzie można opracować mechanizm do izolowania wykresów, ta metoda może być wykorzystana do automatycznego zablokowania obsesyjności reklama.


Modele oparte na wykresie – model prawdopodobieństwa wykresu – model probabilistyczny, w którym relacje między zmiennymi losowymi są reprezentowane jako wykres. Wierzchołki wykresu odpowiadają zmiennym losowym, a krawędzie odpowiadają bezpośrednim zależnościom probabilistycznym między zmiennymi losowymi.

Modele wykresów są używane w problemach wyszukiwania informacji, rozpoznawania mowy, widzenia komputerowego, dekodowania i diagnozowania chorób


Gra dla algorytmów

ze wzmocnieniem (uczenie wzmacniania – "high-tech") zadanie blokowania reklamy pojawia się w formie gry. Agent – sztuczna inteligencja – trzeba blokować reklamy i nie blokować niczego więcej. Jeśli udało mu się to zrobić, wygrywa, jeśli nie, próbuje ponownie.

Główną trudnością jest zrozumienie, gdzie jest reklama, a gdzie – nie. Algorytm powinien zostać przeszkolony na kilku przykładach. W tym celu wykorzystywane są już istniejące filtry napisane przez ludzi. Jeśli wyniki agenta pokrywają się z wynikami tych filtrów, to AI wygrywa z zadaniem. Aby dowiedzieć się, algorytm potrzebuje bardzo dużej bazy danych takich przykładów, a te dane mogą być generowane z przeglądarki prawie bez końca. Jednak innym problemem jest to, że po załadowaniu strony, skrypty często nad nią pracują i zachodzą pewne zmiany. Oznacza to, że konieczne jest, aby AI za każdym razem podejmowała decyzję o zablokowaniu, gdy coś zmieni się na stronie. Jest to już trudniejsze do osiągnięcia

Indywidualne podejście bez danych osobowych

Jest to metoda federacyjnego uczenia się, która jest wykorzystywana do indywidualnych porad dotyczących nauki klawiatury. Wpisz część słowa, a algorytm już pokazuje kilka opcji zakończenia i na podstawie twojego doświadczenia. Im więcej używasz tej funkcji, tym lepiej zna twoje zapytania i podaje dokładniejsze wskazówki.

Jeśli masz indywidualne filtry reklamowe, z których tylko Ty korzystasz, AI jest szkolona indywidualnie dla twoich potrzeb. Ważne jest, aby prywatne dane użytkownika nie były zaangażowane w proces. Algorytm otrzymuje tylko zestaw liczb, które nie ujawniają informacji o tym, które witryny są odwiedzane, ale oblicza, jak skutecznie blokować reklamy.

Uczenie się przez federację jest już używane w klawiaturach cyfrowych, ale w celu skonfigurowania blokowania reklam, jak efektywnie może on pracować z tym zadaniem, pozostaje do zobaczenia.


Nauka federacyjna – nauka federacyjna – innowacyjne podejście do uczenia maszynowego, zaproponowane przez naukowców z Google Research. Umożliwia wszystkim urządzeniom uczestniczącym w uczeniu maszynowym udostępnienie pojedynczego modelu do prognozowania, ale nie udostępnia danych pierwotnych do nauki modelu.


Przetłumacz na inny język

Blokowanie reklam przypomina działania polegające na tłumaczeniu z jednego języka ludzkiego na inny na przykład z rosyjskiego na niemiecki. Tylko w przypadku reklamy, w celu rozpoznania i ukrycia niepożądanych elementów na stronie, musisz przetłumaczyć kod HTML strony na CSS.

Ta metoda tłumaczenia maszynowego (Tłumaczenie maszynowe lub nauka sekwencyjno-sekwencyjna) nie próbowałem. Jednak teoretycznie pozwala to na najszybsze blokowanie reklam. W końcu na stronie pojawia się kilkaset nowych rzeczy na sekundę. Jeśli rozwiążesz zadanie blokady w inny sposób, gdy na stronie pojawi się coś nowego, musisz za każdym razem uruchamiać model, aby zdecydować, czy zablokować ten element, czy nie. Wymaga to dużych zasobów obliczeniowych i może negatywnie wpłynąć na szybkość ładowania strony. Tłumaczenie z HTML na CSS pozwala tego uniknąć.

Wyścig zbrojeń

Dziś rynek reklamy internetowej przypomina pole bitwy: reklamodawcy walczą z blokującymi. Portale, które nie chcą spełniać standardów reklamowych opracowanych przez społeczność, wdrażają skrypty, aby ominąć blokadę. Blokery stopniowo ulepszają swoje filtry, zamykając te "luki". Jednak proces ten nie wydaje się mieć ostatecznego punktu.

Wdrożenie sztucznej inteligencji dla blokerów reklam to skuteczny sposób na zwalczanie blokowania blokad. Zamiast wielokrotnie tworzyć nowe filtry, proces można zautomatyzować, uruchamiając algorytm samouczący się. Jego wdrożenie oczywiście znacznie uprości życie, ale jest mało prawdopodobne, aby położyło kres tej walce reklamodawców i blokerów. Przeciwnie, doprowadzi to do nowego poziomu. Wojna skryptów popadnie w wojnę za pomocą sztucznej inteligencji. Innymi słowy – w wojnie o zasoby, ponieważ dla pomyślnego funkcjonowania algorytmów sztucznej inteligencji potrzebna jest przede wszystkim ogromna moc obliczeniowa, a tym samym znaczne inwestycje.

Powiązane wiadomości