Sergey Gilev, Lamoda: algorytmy uczenia maszynowego nie oferują osobie futra, jeśli nigdy go nie kupił

Sergey Gilev, Lamoda: algorytmy uczenia maszynowego nie oferują osobie futra, jeśli nigdy go nie kupił

Duże dane odgrywają coraz większą rolę w e-commerce – i nie chodzi tylko o personalizację ofert dla klientów. Analizowanie dużych zbiorów danych za pomocą informacji o klientach pozwala na stworzenie dokładnego portretu każdego klienta, przewidywanie jego próśb i zakup towarów, na które będzie zapotrzebowanie. Sergey Gilev, szef działu danych i analiz firmy Lamoda, powiedział Hightekowi, jak poprawić wydajność biznesową dzięki dużym danym, w jaki sposób strona internetowa Lamody jest spersonalizowana i dlaczego informatycy potrzebują zrozumienia mody

Skalowalność, dane historyczne i duże dane

– Co robi twój wydział?

– Zostaliśmy stworzeni w tym roku. Wcześniej analityk w firmie był, ale pracował w zespołach rozproszonych w całej firmie. Bezpośrednio w podziemiach znajdowali się ich własni analitycy – faceci w IT i w produkcie.

Zajmujemy się pełnym procesem wydobywania korzyści z danych i tworzenia na ich podstawie produktów. Zwykle wszystko zaczyna się od tego, że badamy zjawisko biznesowe, proces i to, co znajduje odzwierciedlenie w danych. Zastanawiamy się, co można zrobić z danymi, aby coś ulepszyć. Może to być absolutnie wszystko – nasz magazyn, dostawa, zachowanie użytkowników na stronie, marketing itd.

– W jaki sposób zbierzesz dane przed utworzeniem swojej jednostki – czy teraz coś się zmieniło w sposobie zbierania i oznaczania? I czy jest jakiś problem, że obecnie brakuje Ci danych historycznych?

– Głównym problemem było to, że każdy zespół korzystał z technologii, które posiadał. W związku z tym istniały różne narzędzia, które nie zawsze odpowiadały najbardziej optymalnej technologii dla tego typu zadań. Ostatnio pojawiły się badania przetwarzania dużych danych. Stosowano zatem wcześniejsze tradycyjne technologie, które były droższe lub mniej wydajne. Teraz mamy jedną infrastrukturę. Nie żebyśmy wszyscy przenieśli wszystko do jakiejś jednolitej technologii. Ale my po prostu używamy każdej technologii zgodnie z celem, dla którego jest lepiej dopasowana, w zależności od wymagań konkretnego zadania. O braku niektórych danych historycznych – być może jest to mniej związane z fuzją, ale czasami tak jest. Kiedy nie myśleliśmy o problemie wcześniej, trzeba go było rozwiązać i nie gromadziliśmy żadnych danych. To się czasem zdarza

– Powiedziałeś, że tradycyjne technologie są czasami droższe niż duże dane. Dlaczego tak jest?

– Najważniejsza jest skalowalność. Klasyczne bazy danych działają na tym samym sprzęcie. Jeśli dane stają się zbyt duże, musisz kupić kawałek żelaza więcej, ale także jeden. I zwykle są drogie. Skalowanie jest poziome, dodając podobne elementy – jest po prostu znacznie tańsze, prostsze, bardziej stabilne. Jeśli jeden element zawodzi, to cała struktura jako całość nie zostanie zerwana.

Analityka jako podstawowe potwierdzenie hipotezy

– Analizujesz dane dla różnych działów. Co robisz z danymi w marketingu?

– W marketingu głównym zadaniem z punktu widzenia analityki jest określenie efektywności: gdzie efektywnie wydawaliśmy pieniądze i gdzie – nie. To jest największe wyzwanie. Dlatego musimy dokładnie wiedzieć, ile wydano i otrzymaliśmy. Wiedząc, ile wydano, zwykle jest to bardzo proste zadanie. Ile otrzymali jest o wiele trudniejsze. Ponieważ użytkownicy wchodzą w interakcje z różnymi kanałami. Oznacza to, że jedna osoba może wyświetlać reklamy w YouTube, a następnie w reklamie kontekstowej, subskrybować e-maile i tak dalej. Wyzwanie polega na zrozumieniu, jaki kanał przyczynił się – i jaki wkład – w tworzenie zamówienia.

– czy nauczyłeś się robić to dobrze w domu?

– Mamy również wewnętrzny marketing w firmie – firma ma wystarczająco duży zespół, dużo wiedzy. I prawdopodobnie na naszych tomach usprawiedliwia się. To wyraźnie ma znaczenie. Jesteśmy bardziej elastyczni w tym, co robimy. A ponieważ kontrolujemy, co się dzieje, możemy również sprawdzić naszych partnerów. W szczególności w marketingu jest to ważne w przypadku sieci CPA, w których czasami dochodzi do oszustw w przypadku kradzieży ostatniego kliknięcia.


Sieci CPA (Cost Per Action, "pay per action") to programy partnerskie, sieci płatne za działanie – pośredniczące systemy reklamowe, które umożliwiają reklamodawcom płacenie tylko za ukierunkowane działania użytkowników: zakupy, rejestracje, kwestionariusze

Frod to rodzaj oszustw informatycznych, w szczególności nieautoryzowanych działań i nieuprawnionego korzystania z zasobów i usług w sieciach komunikacja.


– Są Czy są jakieś dane na temat skuteczności kampanii reklamowych po rozpoczęciu nauki?

– Prawdopodobnie nie mieliśmy żadnego "step-changja", w pewnym momencie zrobiliśmy to, otworzyły się nasze oczy i zdaliśmy sobie sprawę, że robimy coś zasadniczo nie tak.

Zdjęcie: Vlad Shatilo / "High-tech"

– Czy to po prostu ułatwiło pracę?

– Raczej tak. Powiedziałbym tak: pod wieloma względami jest to bardziej fundamentalne potwierdzenie niektórych hipotez. Jeśli mówimy o marketingu, bardzo często istnieją kanały medialne, które zapewniają zasięg, przyciągają ruch, ale bardzo rzadko klient dokonuje zakupu po pierwszej wizycie z reklamy multimedialnej. Odpowiednio, klasyczna metoda atrybucji ostatniego kliknięcia zawsze daje bardzo niewiele takim kanałom. Nie musisz być analitykiem, aby to zrozumieć. To normalne, że możesz wydawać więcej na reklamę w mediach, i to w porządku, że nie przynosi zamówień. Ile więcej? Aby odpowiedzieć na to pytanie, analityk jest już potrzebny. Prawie na wszystkie pytania można odpowiedzieć za pomocą zdrowego rozsądku, jeśli ludzie mają głowę na ramionach. Ale zwykle jest to bez jakiegoś potwierdzenia. Używając analizy, możesz dokonać subtelniejszej optymalizacji.


Ostatnie kliknięcie ostatnie kliknięcie to reguła podziału wartości konwersji na poszczególne punkty interakcji w procesie uzyskiwania tej konwersji, gdy kanał marketingowy, który to kliknięcie zostało wprowadzone, został uznany za najbardziej skuteczny. [19659025] Jeśli pominiemy kilka czynników, taki model można przedstawić w następujący sposób: wysłano list z kuponem rabatowym, a zakup produktu już znanego użytkownikowi został wykonany bezpośrednio z listu. Bliżej rzeczywistości – aktywacja kuponu, ale w przypadku, gdy jest to cel makro, tzn. Są sytuacje, kiedy jest to uzasadnione. Jednak ostatnie kliknięcie nie odzwierciedla całej ścieżki użytkownika.

Model ostatniego kliknięcia pozwala zidentyfikować źródła, które bezpośrednio doprowadziły (doprowadziły) klienta do przeprowadzenia konwersji.


Zrozumienie poziomu klienta

– Jeśli mówimy o obsłudze klienta i próbach ulepszenia wrażenia użytkownika podczas interakcji z usługą, jak zmienia duże zbiory danych?

– Mamy w większym stopniu historię o zrozumieniu klientów poprzez lepsze rzeczy i ankiety. Cóż, sondaże jako szczególny przypadek badań socjologicznych. Oznacza to, że chodzi o budowanie portretu klienta, zrozumienie pewnych motywów, pragnień, punktów bólu itd.

– I zacząłeś używać danych badania socjologiczne z wykorzystaniem dużych danych?

– Są to raczej procesy równoległe. Metody socjologiczne pozwalają uzyskać ogólny obraz. Dają możliwość zrozumienia, kim są nasi klienci, czego chcą – średnio lub na poziomie niektórych segmentów. Wiemy, że widzowie mają różne segmenty. Aby to osiągnąć, dobrze nadają się metody socjologiczne – aby poznać doświadczenia klientów. W jaki sposób technologia danych może tutaj pomóc? Zrozumienie czegoś nowego na poziomie konkretnego klienta.

– Socjologia działa z segmentami, ponieważ nie może pracować z każdym użytkownikiem osobno: będzie to zbyt trudne. Duże dane mogą współpracować ze wszystkimi. Co dzieje się z personalizacją strony, doświadczeniem zakupu, kiedy masz informacje dla każdego klienta?

– Personalizacja jest sama w sobie dość szerokim pojęciem. On sam nie implikuje osobistej personalizacji. Jest to prawdopodobnie dla nas idealne, coś, do czego dążymy: aby uzyskać pełny portret każdego klienta, a każdy element interakcji dostosowuje się do osoby tak bardzo, jak to możliwe. Nie da się tego zrobić absolutnie wszędzie, w niektórych miejscach idziemy do prostszych modeli, gdy mamy do czynienia z segmentami klientów.

Trite, jeśli rozumiemy, kto wszedł na stronę: mężczyzna lub kobieta, użytkownik zobaczy stronę męską strona lub kobieta. To także personalizacja, ale bardzo prosta. W rzeczywistości konieczne jest zrobienie obu, ponieważ niemożliwe jest absolutne wykonanie wszystkiego w sposób super adekwatny przez odpowiedni czas.

– Jakie są perspektywy poprawy i poprawy? Czy biorąc pod uwagę dane, może pojawić się coś zupełnie nowego?

– Rozumiemy bardzo dobrze, co musimy zrobić. Nie mogę powiedzieć, że nasza strona jest bardzo spersonalizowana, ale ogólnie interakcja z klientem jest na poziomie jeden do jednego. I to jest zdecydowanie jedno z najważniejszych strategicznych kierunków dla firmy, ponieważ jesteśmy bardzo wszechstronnym graczem.

Baza klientów jest duża i różnorodna. Nie gramy na wąskim rynku – hipsterzy, tylko rynek masowy lub tylko premium. Mamy Selę, "Twoją", i jest Armani – i tak dalej. Wszystko żyje na tej samej platformie, z tymi samymi ludźmi. Dla naszego specyficznego modelu biznesowego jest oczywiste, że jeśli nie spersonalizujesz, nic nie będzie działać. Ponieważ osoby, które kupią "Twoje", powiedzą, że jest to dla nas zbyt drogie, jeśli zobaczą jakieś towary w tym wydaniu. A ludzie, którzy kupią premię, powiedzą, że to pchli targ

– Jeśli pojawi się nowy użytkownik, skąd wiesz, co pokazać na stronie głównej: ten, w którym będzie rynek masowy, czy ten, gdzie będzie premia?

– Zasada jest wszędzie taka sama. Zawsze definiujemy pewien rodzaj metryki jakości. Jest proces biznesowy, coś się dzieje, musimy zrozumieć: zakończyło się pomyślnie, lub nie. Lub stopień sukcesu. To niekoniecznie jest czymś binarnym. Załóżmy, że jeśli pokazaliśmy baner klientowi, kliknął na niego lub nie. Czy on dokonał zakupu, czy kiedykolwiek wrócił do nas. To nie ma znaczenia. Najważniejsze jest to, że zawsze mamy pewien sposób oceny, czy robimy dobrze, czy nie, pewien etap został zakończony sukcesem.

Następnie mamy pewien zestaw atrybutów klienta, które są również w różnych kontekstach. Przechodząc z różnych urządzeń, o różnych porach dnia i pory roku, ludzie chcą zupełnie innych rzeczy. I mamy produkty, które zamierzamy pokazać. Zasada jest taka: wybieramy, co pokazać temu klientowi, aby zmaksymalizować nasz cel. To pokazuje, co użytkownik najczęściej klika.

Zdjęcie: Vlad Shatilo / "High Tech"

– Na podstawie jakich danych?

– W zależności od konkretnego produktu, o którym mówimy. To konkretny element witryny. Na przykład jest informacja, że ​​gdzieś pada. Pokazujemy gumowe buty i parasole. Najprostszą rzeczą, jaką może być platforma

– Ciekawe nie jest najprostsze, ale najtrudniejsze.

– Oto opowieść o tym, jak określić preferencje klientów na podstawie danych historycznych. Mogą to być kategorie, marki, atrybuty produktu – kolory, materiały i tak dalej. Jest oczywiste, że uczenie maszynowe rozwiązuje ten problem. Ale nie zawsze tak się dzieje, zwłaszcza jeśli dana osoba określa zasady. Niekoniecznie, jeśli użytkownik kupił coś w przeszłości, będzie chciał je kupić w przyszłości. Jeśli ktoś kupił bardzo drogi futro, najprawdopodobniej przez następne wiele lat nie będzie potrzebował innego futra. Dlatego przypadki biznesowe ustalane przez ekspertów nie zawsze działają w takich przypadkach. Jeśli jest to model wytrenowany maszynowo, który optymalizuje jakiś cel, to tego typu rzeczy się nie wydarzą. Jeśli w przeszłości ludzie, którzy kupili futra, nigdy ich nie nabyli, wówczas algorytm nie zaoferuje im futra.

Ważne jest zrozumienie istoty biznesu, a nie mody

– Czy stosujesz analizy predykcyjne? Czy możesz mówić o trendach na podstawie posiadanych danych? Trendy w modzie, zakupy online, przemysł.

– Mamy komercyjny zespół, który bezpośrednio zarządza naszym asortymentem. Określa, co kupujemy. Dla niej bardzo ważne jest wprowadzenie do tego, co obecnie jest modne i istotne, ponieważ na tej podstawie planuje się zakres. Zespół ma wiele różnych niestrukturalnych źródeł, skąd bierze te informacje. Pracownicy oglądają programy, subskrybują kogoś na Instagramie, coś innego. Pomagamy im, z naszej strony, w pewnych uporządkowanych danych. To znaczy, według naszych własnych danych, kiedy coś się dzieje, możemy pokazać pewne trendy.

Najbardziej banalnym przykładem, jaki mieliśmy, kiedy "Leningrad" wypuścił piosenkę "On the Laboutenes" ("Exhibit"), ludzie zaczęli szukać "Labutenes". Wówczas nie mieliśmy odpowiedniej marki, wyszukiwanie w witrynie nie przyniosło istotnych wyników. Szybko to skorygowaliśmy, aby przy takim żądaniu użytkownicy mogli zobaczyć inne buty z czerwonymi podeszwami. Jest to przykład, w którym niektóre trendy mogą zostać przechwycone w danych. Ale na bieżąco dla naszych kolegów przygotowujemy informacje, które zyskują popularność teraz.

– A co zyskuje teraz popularność?

– Ale ja nie wiem (śmiech).

– Lamoda wprowadziła technologię rozpoznawania odzieży ze zdjęcia z szerokimi oczami. Czy stanie się ważną usługą, czy raczej zabawką?

– Interfejsy interakcji między ludźmi, usługami i sklepami zmieniają się globalnie. A firma, która chce, aby użytkownik był wygodny, musisz mieć dobre wyszukiwanie. Ludzie często formułują swoje prośby w formie spójnego tekstu lub słów, które muszą być w stanie rozpoznać, zrozumieć, co dana osoba naprawdę ma na myśli i pokazać, czego oczekuje. W rzeczywistości wyszukiwanie według zdjęcia jest jednym z rodzajów wyszukiwania, jednym ze sposobów, w jaki użytkownik może sformułować to, co chce znaleźć. Jak dotąd nie jest to główna droga na całym świecie. Ale istnieje potencjał, że w przyszłości stanie się on większy. Podobnie jak wyszukiwanie mowy. Być może pojawią się interfejsy neuronowe: na przykład wystarczy pomyśleć – a teraz Lamoda już oferuje to, co kupić.

Zdjęcie: Vlad Shatilo / Hitek

– AR i VR w sprzedaży detalicznej mody, która przepowiada przyszłość – jak obiecująca jest ta sytuacja i czy zamierzasz tam pojechać?

– Potencjał 100 – Jeden procent to. Jest to związane z tym, że ludzie wciąż mają barierę do zdalnych zakupów. Pomimo tego, że pracujemy z tym bardzo ciężko, mamy bezpłatną dostawę, mamy możliwość zamówienia wielu towarów przed zakupem, aby je wypróbować. Jednak te bariery pozostają. W związku z tym niektóre technologie, które dają człowiekowi lepsze zrozumienie tego, co naprawdę jest, mają potencjał. Próbowaliśmy czegoś, spróbujemy czegoś.

– Czy są jakieś dane na temat wzrostu zakupów po wprowadzeniu nowego systemu personalizacji?

– Nie ma sensu podawanie konkretnych liczb. Za każdym razem, gdy wprowadzamy zmianę, nową funkcję, nowy algorytm – mamy znaczny wzrost konwersji i przychodów.

– W jaki sposób wykorzystujesz duże ilości danych do wyceny?

– W rzeczywistości bardzo podobna historia. Istnieje pewien cel, do którego dążymy, gdy dokonujemy wyceny produktu. Zarabiaj pieniądze. W przypadku sprzedaży detalicznej jest dość skomplikowana historia. Jest to związane z faktem, że chcemy zarabiać więcej pieniędzy i dlatego, że mamy produkty, które sprzedają się kiepsko, zaczęły normalnie wychodzić. Oznacza to, że to wcale nie jest opowieść, jeśli na przykład, jeśli sprzedajemy gry, które można sprzedać, ile chcesz, nie mają zapasów w magazynie. Rozumiemy, jaki jest nasz cel, a następnie mamy dźwignię cenową w naszych rękach. Możemy zmienić ceny, aby osiągnąć najlepszy cel. Wszystko opiera się na elastyczności cenowej. My tylko na podstawie danych historycznych rozumiemy, jak te lub inne zmiany – albo ceny, albo wszystkie rodzaje promocji – wpływają na sprzedaż.

– Jeśli w ogóle mówimy o uczeniu maszynowym, jak trudno jest wprowadzić je w e-handlu?

– По моим ощущениям, безусловно, e-commerce изначально подразумевает какую-то технологичность компании. Поэтому компания однозначно намного более готова — культурно, ментально — к внедрению новых технологий. И нет многих барьеров, которые часто встречаются в традиционных компаниях, когда «мы сделаем эту работу лучше, чем машина». Мне кажется, что в e-commerce в среднем все понимают, что правильно обученная машина лучше справляется со стандартной задачей, чем человек.

— Насколько важно, чтобы вы сами, люди в команде понимали сферу моды и фэшн-ритейла? Или это все — просто алгоритмы, и успешные алгоритмы можно построить независимо от модели бизнеса?

— Мне кажется, что для аналитиков критично важно понимать суть бизнеса. Как он устроен, в какой момент возникает создание ценности. Потому что обычно большая часть работы в наших проектах и задачах происходит на этапе постановки задачи.

Допустим, мы хотим отранжировать товары в каталоге. Надо понять критерии качества: что такое хорошее ранжирование, плохое, по каким принципам мы должны это делать. Для того, чтобы ответить на эти вопросы, нужно очень хорошо понимать, как работает ритейл и e-commerce. Понимать, что у нас есть закупка, у нас есть сезоны — Spring-Summer, Fall-Winter. Есть склад, товары со склада уезжают, они там могут сколько-то ездить, потом когда-то возвращаются. Все эти вещи аналитик точно должен понимать: иначе точно получится что-то не очень полезное для бизнеса. Я бы сказал, что это в меньшей степени про фэшн и тренды, но в большей — про суть бизнес-модели. Когда люди пытались построить сложные системы, не пытаясь разобраться в сути процесса, обычно получалось очень плохо.

Powiązane wiadomości