Metody i narzędzia segmentacji konsumentów. Przegląd metod analizy skupień i ocena ich przydatności do rozwiązania problemu segmentacji rynku konsumenckiego Wyniki segmentacji metodą skalowania wielowymiarowego

Metody segmentacji

Można wyróżnić niektóre „podstawowe” metody segmentacji. Najważniejszą z nich jest analiza skupień konsumentów (taksonomia). Klastry konsumentów powstają poprzez zgrupowanie tych, którzy udzielają podobnych odpowiedzi na zadawane pytania. Nabywców można łączyć w grupy, jeśli są w podobnym wieku, dochodach, nawykach itp. Podobieństwo między kupującymi opiera się na różnych miarach, ale jako miarę podobieństwa często stosuje się ważoną sumę kwadratów różnic między odpowiedziami kupujących na pytanie. Wynikiem algorytmów klastrowania mogą być drzewa hierarchiczne lub połączenie konsumentów w grupy. Istnieje dość duża liczba algorytmów klastrowych.

Na przykład w Stanach Zjednoczonych szeroko stosowana jest analiza skupień systemów o nazwie PRIZM. , która rozpoczyna tworzenie klastrów poprzez redukcję zestawu 1000 możliwych wskaźników społeczno-demograficznych. System ten tworzy segmenty społeczno-demograficzne dla całego terytorium USA. Tym samym wyodrębniono skupienie 28 – rodziny, które znalazły się w tym skupieniu, to osoby z najbardziej udaną karierą zawodową lub menedżerską. Klaster ten odzwierciedla również wysokie dochody, wykształcenie, majątek i w przybliżeniu średni wiek. Chociaż klaster ten reprezentuje tylko 7% populacji USA, ma kluczowe znaczenie dla przedsiębiorców sprzedających produkty z wyższej półki.


Istnieją inne przykłady segmentacji konsumentów na podstawie analizy skupień. Na przykład wśród sektorów „psychologicznych” bardzo ważne miejsce zajmuje „stosunek konsumenta do nowości produktu” (ryc. 3)

Rysunek 3

Jak widać z powyższych danych, największa liczba konsumentów dotyczy liczby zwykłych kupujących.

Segmentacja konsumentów oparta na analizie skupień jest metodą „klasyczną”. Jednocześnie istnieją techniki segmentacji rynku oparte na tzw. „segmentacji produktowej” lub segmentacji rynku według parametrów produktu. Jest to szczególnie ważne w produkcji i marketingu nowych produktów. Szczególne znaczenie ma segmentacja produktowa, oparta na badaniu długoterminowych trendów rynkowych. Proces rozwoju i produkcji nowego produktu, realizacja dużych programów inwestycyjnych wymaga dość długiego czasu, a poprawność wyników analizy rynku i oceny jego możliwości jest tutaj szczególnie ważna. W warunkach pracy na tradycyjnym rynku produktów standardowych kalkulację jego pojemności można przeprowadzić metodą sumowania rynków. W nowoczesnych warunkach, aby zwiększyć swoją konkurencyjność i poprawnie określić pojemność rynku, nie wystarczy już, aby przedsiębiorstwo segmentowało rynek tylko w jednym kierunku - definiowaniu grup konsumentów według pewnych kryteriów. W ramach marketingu zintegrowanego konieczne jest również dokonanie segmentacji samego produktu według najważniejszych parametrów jego promocji na rynku. W tym celu metoda kompilacji karty funkcjonalne- przeprowadzenie swoistej podwójnej segmentacji według produktu i konsumenta.

Mapy funkcjonalne” mogą być jednoczynnikowe (segmentacja odbywa się według jednego czynnika i dla jednorodnej grupy produktów) oraz wieloczynnikowe (analiza, dla jakich grup konsumentów przeznaczony jest dany model produktu i jakie parametry są najważniejsze dla promocji produktów na rynku) Kompilując karty funkcjonalne możesz określić, dla jakiego segmentu rynku przeznaczony jest dany produkt, które z jego parametrów funkcjonalnych odpowiadają określonym potrzebom konsumentów.

Przy opracowywaniu nowego produktu technika ta zakłada uwzględnienie wszystkich czynników odzwierciedlających system preferencji konsumentów, a jednocześnie parametrów technicznych nowego produktu, którymi można zaspokoić potrzeby konsumenta; zdefiniowane są grupy konsumentów, z których każda ma własny zestaw próśb i preferencji; wszystkie wybrane czynniki uszeregowano według stopnia istotności dla każdej z grup konsumentów.

Takie podejście pozwala zobaczyć na etapie rozwoju, jakie parametry produktu wymagają poprawy konstrukcyjnej, lub określić, czy istnieje wystarczająco pojemny rynek dla tego modelu.

Podajmy przykład takiej analizy rynku w odniesieniu do projektu komputerów w fazie rozwoju „Apple” (tabela 1) (patrz następna strona)

Tabela 1." Segmentacja rynku komputerów osobistych i czynniki brane pod uwagę przy opracowywaniu produktów dla niego (1982) "

Czynniki Segmenty rynku według grup konsumentów Model
Domy W szkole Na Uniwersytecie Do domu. gabinet W małych firmach W korporacji A V
Specyfikacja techniczna * * *** ** ** ** *** **
Cena £ *** *** ** *** *** ** 0 **
Specjalne umiejętności * * ** * * * ** *
Niezawodność ** * * ** ** * 0 **
Łatwość użycia ** ** * ** * 0 *** ***
Zgodność 0 0 0 0 0 *** 0 0
Urządzenia peryferyjne 0 0 0 0 0 *** 0 0
Oprogramowanie * * ** ** ** *** * **

*** to bardzo ważny czynnik

** - ważny czynnik

* - czynnik nieistotny

0 - znikomy współczynnik

Ta prosta analiza pokazuje, że model A to komputer bez rynku, a model B to najbardziej odpowiedni produkt dla uczelni i małych firm.

Firma kiedyś postawiła na komputer A i przegrała.

Ogólnie w praktyce światowej stosuje się 2 podstawowe podejścia do segmentacji marketingowej - (patrz: ogólny schemat analizy segmentowej (rys. 4)) (następna strona)



W ramach pierwszej metody. określane jako „a priori”, znamiona segmentacji, liczba odcinków, ich liczba, charakterystyka, mapa zainteresowań są już znane. Oznacza to, że zakłada się, że grupy segmentów w tej metodzie zostały już utworzone. Metodę „a priori” stosuje się w przypadkach, gdy segmentacja nie jest częścią obecnego badania, ale służy jako pomocnicza podstawa do rozwiązywania innych problemów marketingowych. Czasami ta metoda jest stosowana, gdy segmenty rynku są bardzo wyraźnie określone, gdy wariancja segmentów rynku nie jest duża. „Aprior” jest również dopuszczalny przy tworzeniu nowego produktu skoncentrowanego na znanym segmencie rynku.

W ramach drugiej metody, zwanej „post hoc (cluster based)” implikuje się niepewność oznak segmentacji i istoty samych segmentów. Badacz wstępnie wybiera szereg zmiennych, które są interaktywne w odniesieniu do respondenta (metoda polega na przeprowadzeniu ankiety), a następnie, w zależności od deklarowanego stosunku do określonej grupy zmiennych, Respondenci należą do odpowiedniego segmentu, natomiast zidentyfikowana w dalszej analizie mapa zainteresowań traktowana jest jako drugorzędna. segmentacja rynków konsumenckich, których struktura segmentowa nie jest określona w odniesieniu do sprzedawanego produktu.

Segmentacja według metody” apriorycznie "

Wybierając liczbę segmentów, na które należy podzielić rynek, kierują się zazwyczaj funkcją celu – wyznaczania najbardziej perspektywicznego segmentu. Oczywiście przy tworzeniu próby zbędne jest uwzględnianie w niej segmentów, których potencjał nabywczy jest raczej niewielki w stosunku do badanego produktu. Liczba segmentów, jak pokazują badania, nie powinna przekraczać 10, nadmiar zwykle wiąże się z nadmiernym uszczegółowieniem cech segmentacyjnych i prowadzi do niepotrzebnego „rozmycia” cech.

Na przykład przy segmentacji według poziomu dochodów zaleca się rozbicie wszystkich potencjalnych nabywców na segmenty o równym wolumenie, biorąc pod uwagę, że wolumen każdego z segmentów jest co najmniej nie mniejszy niż szacowany wolumen sprzedaży usług na podstawie znajomość zdolności produkcyjnych przedsiębiorstwa. Najbardziej udanym przykładem wyjaśniającym powyższe i pokazującym możliwość podziału potencjalnych konsumentów na stabilne grupy segmentowe może być segmentacja populacji na podstawie dochodu, gdy cała populacja jest podzielona na pięć grup 20%. Przedstawiony rozkład dochodów dla pięciu 20% grup ludności podawany jest regularnie w zbiorach statystycznych i raportach, podobnie jak w tabeli. 2

Tabela 2 ."Podział dochodów według grup ludności. %"

Wygoda pracy z takimi grupami segmentów jest oczywista, zwłaszcza jeśli chodzi o śledzenie ich zdolności.

10 marca 2015 r.

Wchodząc na dowolny rynek z produktem – konsumenckim, przemysłowym – producent musi zrozumieć, że nie może obsłużyć wszystkich swoich klientów, nawet przy wystarczających zdolnościach produkcyjnych. W końcu kupujący używają tego produktu na różne sposoby, a co najważniejsze, kupują go, kierując się różnymi motywami. Dlatego zwykle rozbijamy nabywców (segmentacja) według tych motywów i innych cech, a dopiero potem – ofertę towarów wyprodukowanych z maksymalnym uwzględnieniem tych cech. Nie będzie przesadą stwierdzenie, że idealne podejście do planowania działań marketingowych z punktu widzenia zaspokojenia potrzeb konsumentów można uznać za dostosowanie produktów i usług do wymagań każdego indywidualnego konsumenta.

Do 1960 roku w teorii i praktyce biznesu dominowała orientacja na zagregowany, masowy rynek. Tłumaczono to tym, że skupiając się na wspólnym, niepodzielonym rynku, firma produkcyjna była w stanie wyprodukować dużą liczbę towarów i uzyskać korzyści skali. Ale od lat 60. Nasilać się zaczął trend w kierunku konieczności rozróżniania specyfiki popytu konsumenckiego, co znajduje odzwierciedlenie w segmentacji rynku sprzedaży.

W nowoczesnych warunkach wzmożonej konkurencji na rynkach zbytu aktualizuje się problem konieczności zwiększenia konkurencyjności krajowych wyrobów przemysłowych na rynku krajowym i zagranicznym. W tych warunkach kluczową kwestią jest poszukiwanie rezerw w celu obniżenia kosztów na ekonomicznej podstawie ceny i zysku. W efekcie znaczna liczba przedsiębiorstw przemysłowych realizuje strategię niskokosztową, skupiając się na różnych sposobach jej realizacji: rezygnacja z kosztownych usług powiązanych; oszczędność kosztów poprzez tworzenie modeli produktów, które są tańsze w produkcji i tym podobne. Jednak koszty bezpośrednie są w dużej mierze determinowane przez technologię produkcji, poziom obciążenia pracą przedsiębiorstwa-producenta towarów oraz możliwości obniżenia kosztów zarządzania poprzez poprawę efektywności zarządzania obszarami funkcjonalnymi przedsiębiorstw pozostają niewystarczająco wykorzystane.

Jednym z nowoczesnych narzędzi jest obniżenie kosztów zarządzania i zapewnienie wzrostu jakości zarządzania, co można interpretować jako trafność prognozowania zysków, rentowności dla każdego klastra (grupy przedsiębiorstw przemysłowych tego samego rodzaju działalności) w porównaniu do stanu wyjściowego, czyli trafności prognozowania opłacalności obszarów funkcjonalnych tych działań przedsiębiorstwa to analiza skupień.

Znaczenie segmentacji jako skutecznego narzędzia marketingowego wyjaśniają następujące cechy:

ü segmentacja jest wysoce skutecznym środkiem konkurencji, ponieważ koncentruje się na identyfikacji i zaspokajaniu specyficznych potrzeb konsumentów;
ü koncentruje działalność firmy na określonej niszy rynkowej, dotyczy to zwłaszcza firm rozpoczynających działalność rynkową;
ü segmentacja rynku pomaga w bardziej racjonalny sposób określać kierunki marketingowe firmy;
ü za pomocą segmentacji możliwe staje się wyznaczenie realistycznych celów marketingowych;
ü skuteczna segmentacja rynku wpływa na efektywność marketingu jako całości, od badań rynkowych i konsumenckich po stworzenie odpowiedniego systemu sprzedaży i promocji.

W teorii marketingu pojęcie S TP -marketing . Powstaje ze skrótu pierwszych liter angielskich słówsegmentacja(segmentacja),celowanie(wybór rynku docelowego) ipozycjonowanie(pozycjonowanie). S TP -marketing jest rdzeniem nowoczesnego marketingu strategicznego.

Segmentacja rynku - jest to podział konsumentów na grupy w oparciu o różnice w potrzebach, cechach czy zachowaniach oraz rozwój dla każdej z grup odrębnego marketingu mix.

Segment rynku składa się z konsumentów reagujących w ten sam sposób na ten sam zestaw zachęt marketingowych.

1. Segmentacja rynku- etap alokacji poszczególnych grup konsumentów w ramach wspólnego rynku.
2. Wybór rynków docelowych- spośród wybranych segmentów rynku wybierane są segmenty docelowe, czyli te, na których firma koncentruje swoją działalność.
3. Pozycjonowanie- identyfikacja produktu firmy wśród produktów analogowych.

Ostatecznym celem segmentacji rynku docelowego jest wybór segmentu (lub segmentów) konsumentów, których zaspokojenie potrzeb będzie ukierunkowana na działalność firmy.
Marketerzy uważają, że prawidłowa alokacja segmentu rynku to połowa sukcesu komercyjnego i stale przypominają sobie modyfikację znanego Prawo Pareto (prawo 80:20).

Metody segmentacji rynku:

metoda a priori;

· Metoda klastrowa;

· Metoda elastycznej segmentacji;

· Metoda segmentacji komponentów.

Na metody a priori hipoteza segmentacji rynku jest najpierw przedstawiana, a następnie testowana w trakcie badań marketingowych. Dlatego ta metoda nazywa się a priori, tj. niedoświadczony. Ta metoda segmentacji rynku jest obecnie najczęściej stosowana ze względu na jej względną prostotę, dostępność metod doprowadzonych do praktycznego wdrożenia oraz niski koszt wdrożenia.

Metody klastrowe sugerować, że struktura rynku jest nieznana. Nie definiują zmiennej zależnej, ale poszukują naturalnych skupień znalezionych w bazie konsumentów uzyskanej w wyniku badań rynkowych. W tym przypadku respondenci są najpierw grupowani spośród potencjalnych konsumentów za pomocą specjalnej procedury analitycznej na naturalne klastry – segmenty rynku. Następnie definiowane są zmienne, za pomocą których możliwe byłoby formalne zdefiniowanie segmentu rynku.

W porównaniu z segmentacją a priori, gdy segmenty są wyznaczane przez oszacowane zmienne na początku badania, oraz z segmentacją skupień, gdy wybrane segmenty powstają z wyników analizy skupień, modele elastyczna segmentacja oferują dynamiczne podejście do problemu. Stosując takie podejście, można opracować i przetestować wiele różnych segmentów, z których każdy obejmuje konsumentów lub organizacje o podobnym postrzeganiu nowych produktów „próbnych” (identyfikowanych na podstawie konfiguracji określonych cech produktu). Elastyczna segmentacja łączy wyniki połączonej analizy i komputerowego modelowania zachowań konsumentów przy wyborze produktu.

Segmentacja komponentów przenosi punkt ciężkości segmentacji rynku na cechy osobowości (opisane przez zestaw cech demograficznych i psychograficznych), które byłyby lepiej dopasowane do cech produktu. W segmentacji składnik po składniku badacza interesuje porównanie parametrów wartości produktu i różnych cech respondenta. Po zdefiniowaniu tych dwóch zestawów parametrów, badacz może zasugerować rozwój dowolnych możliwych właściwości produktu dla każdego typu konsumenta.

Proces segmentacji rynku

Proces segmentacji przebiega w ośmiu krokach.

Strategia pokrycia rynku
Pierwszym krokiem jest wybór metody segmentacji.

Drugim etapem jest sprawdzenie jednorodności segmentu, tj. sprawdzamy, czy reakcja konsumenta na produkt z tego segmentu jest taka sama.

Trzeci etap to sprawdzenie stopnia zróżnicowania segmentu, czyli sprawdzamy, na ile segmentów wyliczany jest produkt i jaki asortyment towarów oferuje organizacja.

Czwarty etap to ocena poziomu dostępności segmentu, tj. należy ocenić, czy przedsiębiorstwo posiada wystarczającą liczbę kanałów sprzedaży swoich produktów, jaka jest przepustowość tych kanałów, czy przedsiębiorstwo może zapewnić sprzedaż całego wolumenu produktów, czy system dostarczania produktów do konsumenci są wystarczająco wiarygodni.

Piąty etap to sprawdzenie poziomu rentowności segmentu, tj. możliwa cena produktu przy pracy w tym segmencie oraz jego koszt są ustalane z uwzględnieniem dostosowania produktu do tego segmentu. (Rentowność ≈ Rentowność)

Szósty etap to ocena stabilności segmentu.

Siódmy etap to wybór segmentu docelowego.

Ósmy etap to strategia pokrycia rynku.

Ocena atrakcyjności segmentów i koncepcji rynku docelowego

Atrakcyjność segmentu rynku określana jest według kryteriów, które każda firma określa samodzielnie.

Nie wszystkie kryteria mają jednakowe znaczenie i dlatego każde z nich należy rozpatrywać osobno. Celem analizy atrakcyjności jest obliczenie ważonej istotności kryterium charakteryzującego „atrakcyjność” danego produktu.

Rynek docelowy to najbardziej odpowiednia i dochodowa grupa segmentów rynku (lub jeden segment) dla przedsiębiorstwa, do którego skierowana jest jego działalność.

Firma powinna promować te różnice w swoim produkcie, które są najbardziej atrakcyjne dla rynku docelowego.

Przy ocenie segmentów rynku brane są pod uwagę dwa czynniki: (1) ich ogólna atrakcyjność oraz (2) cele i zasoby rozwijającej go firmy.


Kryteria oceny atrakcyjności rynku docelowego

1. Wielkość (pojemność) rynku - Pod pojemnością rynku towarowego rozumie się możliwą wielkość sprzedaży towarów (konkretnych produktów przedsiębiorstwa) na danym poziomie i stosunku różnych cen. Pojemność rynku charakteryzuje się wielkością popytu ludności i wielkością podaży towarów.

2. Położenie geograficzne

3. Sprzedaż rzeczywista i potencjalna
Rzeczywista wielkość sprzedaży - ilość towarów i usług, które organizacja może realistycznie sprzedać w istniejących warunkach działania, szacunkowe koszty reklamy i poziom cen, który zamierza ustalić.

Potencjalna wielkość sprzedaży (oferta) - udział potencjalnego rynku, który organizacja ma nadzieję zająć i odpowiednio maksymalna liczba towarów, na które może liczyć na sprzedaż swoimi możliwościami.

4. Aktualny i potencjalny poziom i intensywność konkurencji

realna i potencjalna zdolność firm do projektowania, wytwarzania i wprowadzania na rynek produktów atrakcyjniejszych cenowo i pozacenowych niż produkty konkurencji.

intensywność konkurencji, a co za tym idzie, poziom konkurencyjności przedsiębiorstwa zdeterminowany jest potencjałem rynku; łatwość wejścia do niego; rodzaj towarów; jednorodność rynku; struktura branży lub pozycja konkurencyjna firm; możliwości innowacji technologicznych itp.

5. Możliwość pokrycia rynku

Liczba potencjalnych placówek i centrów, przez które produkt będzie dystrybuowany.

6. Rzeczywiste i potencjalne koszty promocji

7. Etap cyklu życia rynku – tj. rozwój produktu, etap wdrożenia, etap rozwoju (wzrostu), etap dojrzałości lub etap spadku

8. Trendy rynkowe, tj. kierunek rozwoju, perspektywy

9. Dodatkowe wymagania konsumentów dotyczące produktu

10. Realny i potencjalny poziom cen

11. Oczekiwania konsumentów i rzeczywista reakcja na działania marketingowe produktów

MŚP powinny zidentyfikować i wybrać dwa do trzech kluczowych czynników sukcesu w wyniku analizy atrakcyjności każdego segmentu rynku. Krytyczne czynniki sukcesu będą „mottem” firmy i należy o nich stale pamiętać. Są to najważniejsze okoliczności, które muszą lub nie muszą wystąpić, aby firma odniosła sukces na danym rynku produktowym.

Strategie pokrycia rynku

Po zakończeniu segmentacji firma musi określić, na który segment kierować swoją działalność. W zależności od stopnia pokrycia rynku możliwe są trzy rodzaje strategii:

1. Pojedynczy segment (marketing skoncentrowany)

firma koncentruje się na dużym udziale jednego lub większej liczby podrynków. Na przykład Volkswagen skoncentrował swoje wysiłki na rynku małych samochodów. Poprzez skoncentrowany marketing firma zapewnia sobie silną pozycję rynkową w obsługiwanych segmentach, ponieważ lepiej niż ktokolwiek inny zna potrzeby tych segmentów i cieszy się pewną renomą. Ponadto w wyniku specjalizacji produkcji, dystrybucji i działań promocyjnych firma osiąga oszczędności w wielu obszarach swojej działalności. Strategia ta wiąże się jednak ze zwiększonym poziomem ryzyka: wybrany segment może nie spełniać oczekiwań. W związku z tym wiele firm decyduje się na dywersyfikację swojej działalności, obejmując kilka różnych segmentów rynku.

Takie podejście jest czasami określane jako „strategia niszowa”, ponieważ Odbywa się to często przy ograniczonych zasobach.

2. Wiele segmentów (marketing różnicowy)

Coraz więcej firm przyjmuje tę strategię.

Oferując różnorodne produkty, firma liczy na wzrost sprzedaży i głębszą penetrację w każdym ze swoich segmentów rynku. Oczekuje, że umacniając swoją pozycję w kilku segmentach rynku, będzie w stanie zidentyfikować w świadomości konsumenta firmę z tą kategorią produktów. Co więcej, spodziewa się wzrostu powtórnych zakupów, ponieważ to produkt firmy odpowiada pragnieniom konsumentów, a nie odwrotnie.

3. Pełne pokrycie rynku (marketing niezróżnicowany)

Większość specjalistów od marketingu uważa, że ​​ta strategia ma ograniczony zakres.

W tym przypadku firma skupia się nie na tym, jak potrzeby klientów różnią się od siebie, ale na tym, co te potrzeby mają ze sobą wspólnego. Opracowuje program produktowy i marketingowy, który spodoba się jak największej liczbie klientów. Opiera się na metodach masowej dystrybucji i masowej reklamie. Stara się nadać produktowi wizerunek wyższości w ludzkich umysłach. Jako przykład niezróżnicowanego marketingu można przytoczyć działania firmy Krasny Oktyabr, która kilka lat temu oferowała markę czekolady dla każdego.

Niezróżnicowany marketing jest ekonomiczny. Koszty wytworzenia produktu, utrzymania jego zapasów i transportu są niskie. Koszty reklamy z niezróżnicowanym marketingiem są również utrzymywane na niskim poziomie. Brak konieczności prowadzenia badań marketingowych segmentów rynku i planowania w podziale na te segmenty pozwala obniżyć koszty badań marketingowych i zarządzania produktem.

Pojęcie pozycjonowania

Pozycjonowanie to proces znajdowania pozycji rynkowej dla firmy, produktu lub usługi, która korzystnie odróżni ją (jego) od pozycji konkurentów. Pozycjonowanie przeprowadzane jest z uwzględnieniem określonej grupy docelowej konsumentów, dla której tworzone i oferowane są atuty i wyjątkowość. Bez jasnego wyobrażenia o tym, do czego stanowisko jest skierowane, bardzo trudno, a nawet prawie niemożliwe jest dostosowanie decyzji marketingowych. Definicja pozycjonowania konkurencyjnego często dyktuje najskuteczniejsze kombinacje narzędzi marketingowych.
Podsumowując, możemy powiedzieć, że pozycjonowanie to strategia marketingowa stworzyć silne powiązanie Twojej marki (produktu lub firmy) z określonymi skojarzeniami, a najlepiej z korzyściami.

Tak więc pozycjonowanie obejmuje:
- stworzenie w głowie konsumenta trwałego skojarzenia produktu lub firmy z określonym miejscem na rynku,
- utrzymanie stowarzyszenia (wybranej pozycji) w długim okresie.

Pozycja produktu na rynku miejsce, jakie dany produkt zajmuje w świadomości konsumentów w porównaniu z podobnymi produktami konkurencyjnymi z punktu widzenia konsumenta.
Strategia pozycjonowania to zestaw działań mających na celu przekazanie konsumentom koncepcji pozycjonowania. Pozycjonowanie istnieje tylko w umyśle konsumenta.
- Strategia oferowania towarów (usług)
- Polityka cenowa
- Strategia dystrybucji produktów
- Strategia promocji towarów (usług)
Ograniczenie pozycjonowania
- Rynek docelowy
- Prawdziwi i potencjalni konkurenci
- Strategia firmy

Repozycjonowanie- zmiany pozycji produktu lub usługi w marketingu i reklamie, gdy otrzymują nowy wizerunek, wyznaczana jest kolejna grupa docelowa, zmieniają się argumenty za informacją sprzedażową i reklamową, opakowanie itp.
Powody zmiany pozycji:
- Wątpliwe pozycjonowanie
- Zaniżone pozycjonowanie
- Niewyraźne pozycjonowanie
- Bezużyteczne pozycjonowanie
- Przepozycjonowanie

Miejsce zamieszkania itp. Z tego powinno być jasne, że segment rynku jest

Istnieje grupa konsumentów, którzy pod pewnymi względami zachowują się na rynku w ten sam sposób.

Z kolei segmentacja rynku dzieli się na kilka etapów.

  • 2. Wybór segmentu rynku polega na tym, że każdy z segmentów jest oceniany pod kątem jego atrakcyjności (zdolność do wniesienia pożądanego rezultatu do przedsiębiorstwa). Na podstawie tych szacunków wybierany jest najbardziej atrakcyjny segment (lub segmenty).
  • 3. Wreszcie trzeci etap to pozycjonowanie produktu. Po wybraniu segmentu rynku należy zastanowić się, jak produkt, który firma oferuje na rynku, będzie prezentował się na rynku. Ponadto należy również opracować szczegółowy miks marketingowy. To właśnie te zadania są rozwiązywane na tym etapie.

W marketingu zidentyfikowano kilka cech, które mogą poprawić skuteczność segmentacji. Znaki te nie dotyczą konsumentów, ale samych segmentów.

  • 1. Segment musi być znaczący. Oznacza to, że atrybut leżący u podstaw segmentacji musi przynajmniej w pewnym stopniu dostosowywać się do zachowań konsumentów. Tak więc nadwaga ma znaczenie, jeśli chodzi o to, ile chleba konsumuje dana osoba lub czy ma problem z zakupem ubrań. Jednak ten znak raczej nie będzie miał znaczenia w związku z używanymi przez niego kosmetykami.
  • 2. Segment rynku musi być wystarczająco duży, aby móc generować zysk niezbędny dla sukcesu firmy. Jeśli segment jest z tego punktu widzenia zbyt mały, to tworzenie i wdrażanie programu marketingowego na nim skoncentrowanego po prostu nie ma sensu.
  • 3. Segment musi być mierzalny. Oznacza to, że cecha leżąca u podstaw segmentacji musi zapewniać możliwość wyraźnego i jednoznacznego oddzielenia grupy konsumentów od ich innych grup. Wiek jest przykładem mierzalnej cechy. Zawsze możemy łatwo podzielić wszystkich konsumentów na grupy w zależności od wartości, jaką przyjmuje ta zmienna.

Przykładem cechy, która nie jest w pełni mierzalna, może być również, co dziwne, częstotliwość konsumpcji produktu, preferencje konsumentów w niektórych przypadkach mogą być bardzo zmienne. O wiele bardziej wiarygodnym znakiem z tego punktu widzenia jest lojalność wobec marki: nawet jeśli konsument kupuje produkt rzadko, to zawsze wybierze tylko jedną markę, odrzucając wszystkie inne.

W tym miejscu należy również zastanowić się, czy rozmówca będzie szczery, odpowiadając na pytanie badacza. Z tego punktu widzenia oznaki typu orientacji seksualnej są słabo mierzalne. Choć stopień tolerancji naszego społeczeństwa wobec mniejszości seksualnych stale rośnie (a jest to oznaką każdego dostatecznie rozwiniętego społeczeństwa), nie każdy przedstawiciel tych mniejszości odważy się otwarcie zadeklarować swoją orientację seksualną.

3. Segment musi być dostępny. Ta jakość oznacza nie tylko dostępność badań, ale także dostępność dodatkowych informacji. Jeżeli można oczekiwać, że przedsiębiorstwo będzie w stanie wpłynąć na segment szarpnięcia za pomocą dostępnych mu środków, a następnie ocenić jego wpływ poprzez porównanie stanu początkowego ze stanem po wpływie, segment można uznać za dostępny. Oczywiste jest, że jest to możliwe tylko wtedy, gdy istnieje dostęp do informacji.

W praktyce marketingowej najczęściej stosuje się trzy metody segmentacji: grupowanie, wielowymiarową segmentację sekwencyjną ze zmienną zależną oraz analizę skupień. Ta lista nie wyczerpuje wszystkich możliwych metod segmentacji, ale wystarczy, aby uzyskać ogólne pojęcie o tej procedurze i związanych z nią złożonościach.

1. Najłatwiejszym sposobem segmentacji jest podział rynku na grupy tradycyjnie identyfikowane w marketingu i socjologii w oparciu o wymienione wyżej cechy. W tym przypadku zakłada się po prostu, że grupy konsumentów, wyodrębnione na podstawie takich cech jak płeć, wiek czy zawód, charakteryzują się dość standardowym zestawem potrzeb i zachowań.

Ta metoda jest najbardziej odpowiednia w przypadku wyboru nowej dziedziny działalności, na przykład w przypadku, gdy firma dopiero zaczyna działać na rynku lub decyduje się na wejście na nowy rynek.

Wadą tej metody segmentacji jest to, że opiera się ona na założeniach, hipotezach. Podział konsumentów ze względu na wiek, płeć, zawód, poziom dochodów czy status społeczny jest tradycyjny dla badań marketingowych, ale wcale nie jest oczywiste, że zmienne te są związane z procesem „dokończenia” konsumentów. Innymi słowy, nie zawsze można twierdzić, że aktywność konsumentów zależy bezpośrednio na przykład od ich wieku. Dlatego też, powołując się na taką segmentację, marketer wybiera arbitralne i niewystarczająco istotne powody wyboru segmentów.

Przy segmentacji rynku należy mieć na uwadze, że cechy leżące u podstaw alokacji niektórych grup mają różne znaczenie. Z jednej strony możemy mówić o znakach, które są bezpośrednio związane z celami przedsiębiorstwa. Takim znakiem byłaby np. chęć zakupu nowego produktu, który posiada zestaw pewnych cech: na tej podstawie możemy wyróżnić grupę konsumentów, którzy są na to gotowi, oraz grupę konsumentów, którzy nie są gotowi. gotowy na to.

Ponieważ przedsiębiorstwo jest zainteresowane sprzedażą towarów, parametr ten jest bezpośrednio związany z jego celami. Z drugiej strony istnieją mniej istotne parametry, które nie są w tak ścisłym związku z celami przedsiębiorstwa. Przykładem takiej cechy byłby wiek. Tak więc ten lub inny produkt może być przeznaczony dla kategorii wiekowej osób po 30 latach. Nie oznacza to jednak, że każda osoba powyżej trzydziestki kupi ten produkt. W konsekwencji wiek jako parametr segmentacyjny jest w mniejszym stopniu powiązany z bezpośrednimi celami przedsiębiorstwa.

Jeśli liczba naprawdę istotnych czynników jest bardzo duża, można je zmniejszyć stosując tzw. analizę czynnikową. Polega na wyborze grup powiązanych cech (parametrów), które są łączone w jedną cechę. Na przykład poziom dochodów jest ściśle związany z wielkością domu, obecnością samochodu, liczbą wycieczek turystycznych, wizyt w miejscach takich jak restauracje i kluby, a zatem znaki te można łączyć w jeden.

Wskazane jest, aby nadać tej funkcji nazwę. W naszym przypadku moglibyśmy nazwać nową cechę „wysokość dochodu”, ale interpretować ją szeroko, nie tylko jako kwotę, jaką dana osoba otrzymuje w ciągu miesiąca czy roku. Podobnie można powiązać poziom dochodów, zawód i wykształcenie, poziom dochodów i preferencje polityczne itp.

2. Wielowymiarowa segmentacja sekwencyjna ze zmienną zależną jest najbardziej odpowiednia, gdy firma ma już doświadczenie na rynku. W tym przypadku segmentacja ma na celu zidentyfikowanie najbardziej preferowanego segmentu rynku pod względem już dostępnych wyników.

Ponieważ głównym rezultatem, do którego firma dąży, jest uzyskanie maksymalnego zysku, w tym przypadku np. jako zmienną zależną można wybrać dochód firmy. Na ten aspekt ma na celu wstępna segmentacja: konieczne jest zidentyfikowanie grup konsumentów, które z punktu widzenia przedsiębiorstwa przynoszą mu największe dochody.

Widać wyraźnie, że dolna granica dochodów jest na ogół określana subiektywnie i stanowi kompromis między sytuacją rzeczywistą a pożądaną. Warunkowo można wyróżnić np. trzy grupy: konsumenci przynoszący duże dochody, konsumenci przynoszący średni (zadowalający) dochód oraz konsumenci przynoszący dochody zbyt małe.

Drugim etapem segmentacji jest identyfikacja drugiej zmiennej, która jest najściślej związana ze zmienną pierwszą. Ta zmienna to zwykle:

  • a) częstotliwość korzystania z produktu lub usługi sprzedawanej przez firmę;
  • b) poziom dochodów wnoszonych przez konsumenta do firmy;
  • c) lojalność konsumentów wobec marki. Na przykład w badaniach marketingowych okazuje się, że największe dochody przynoszą firmie osoby w wieku od 25 do 33 lat. Dlatego wszystkich konsumentów należy podzielić na co najmniej trzy grupy: 1) do 25 lat; 2) od 25 do 33 lat oraz 3) powyżej 33 lat.

Przy stosowaniu tej metody dalszej segmentacji poddawany jest tylko najbardziej dochodowy segment rynku. W naszym przypadku jest to kategoria konsumentów w wieku od 25 do 33 lat. Na kolejnych etapach odnajdujemy ponownie podstawy do segmentacji, które są najbardziej związane z poziomem rentowności.

Granicą podziału w tym przypadku jest segment, który musi mieć następujące cechy:

  • 1) należący do niej konsumenci przynoszą firmie największe dochody (przykładowo dochód uzyskiwany przez firmę z tego segmentu, który stanowi zaledwie 20% rynku, stanowi 70% całkowitych dochodów);
  • 2) segment nie może być w pełni opanowany;
  • 3) musi być na tyle duży, aby warto było zainwestować w jego dodatkowy rozwój;
  • 4) dalszy podział segmentu powinien być niemożliwy (jest to cecha preferowana).

Zaletą tej metody segmentacji jest to, że opiera się ona na najważniejszych zmiennych. Ta metoda ma również wady. Przede wszystkim nie uwzględnia interakcji między różnymi zmiennymi. Ponadto segmenty, które są szybko przydzielane za jego pomocą, okazują się zbyt małe. Jednocześnie na ogół ta metoda jest dość wydajna.

Korzystając z niego, możesz zobaczyć, które segmenty są naprawdę najbardziej preferowane, które mogą być, a które należy całkowicie porzucić. W szczególności zastosowanie tej metody pozwala na formułowanie bardzo realistycznych zadań, na przykład zwiększenie dochodów uzyskiwanych od takiej czy innej grupy konsumentów. Wreszcie pozwala zidentyfikować słabości w działaniach firmy.

3. W przeciwieństwie do dwóch poprzednich metod segmentacyjnych, w których marketer rozpoczyna analizę rynku od całej populacji konsumentów i stopniowo dzieli je na grupy, przy analizie skupień kierunek jest odwrotny: analizę rozpoczyna się od indywidualnych konsumentów. Z tego powodu analiza skupień wymaga, aby marketer dysponował danymi o odpowiednio dużej liczbie realnych konsumentów, z reguły ich liczba powinna wynosić co najmniej 200 osób.

Analiza skupień obejmuje kilka kroków.

  • 1) Najpierw marketer losowo wybiera jednego konsumenta i zaczyna szukać innego, który będzie do niego jak najbardziej podobny pod względem znanych parametrów. Po znalezieniu dwóch takich konsumentów łączy się ich w klaster. W podobny sposób identyfikowane są inne klastry.
  • 2) Kolejnym krokiem jest zjednoczenie indywidualnych konsumentów i ich grup w szersze społeczności. Należy pamiętać, że zarówno konsumenci indywidualni, jak i już przydzielone klastry, a także konsument i klaster można łączyć w klastry. Połączenie odbywa się do momentu uzyskania mniej lub bardziej zadowalającej liczby klastrów, czyli segmentów, które pod względem wielkości odpowiadają interesom przedsiębiorstwa.
  • 3) Kontrola poprawności doboru klastrów polega na tym, że marketer po raz drugi przeprowadza segmentację i sprawdza, czy taką samą segmentację można uzyskać za pomocą innych miar podobieństwa. Porównuje się wyniki segmentacji głównej i kontrolnej na podstawie analizy skupień, po czym dokonuje się korekty segmentacji głównej.

Niewątpliwą zaletą tej metody jest to, że pozwala ona zacząć od konkretnych danych o konsumentach. Marketer stosujący tę metodę jest mniej skłonny do wybrania parametru segmentacji, który w rzeczywistości ma niewielką wartość.

Wadą tej metody jest to, że podczas jej używania można wybrać klastry, które w rzeczywistości nie istnieją. Oznacza to, że powstałe grupy konsumentów w rzeczywistości nie będą charakteryzować się tym samym zachowaniem. Dlatego różne procedury kontrolne powinny być obowiązkową częścią analizy skupień.

Pozycjonowanie produktu na rynku to kierunek działań marketingowych na rzecz wyboru rynków docelowych, który polega na analizie elementów marketingu mix i pozycji produktów w wybranych segmentach rynku w celu zidentyfikowania tych parametrów, które przyczyniają się do uzyskania przewagi konkurencyjnej.

Jeżeli wszystkie przedsiębiorstwa wytwarzają te same produkty o tych samych cechach, stosują te same metody promocji i dostarczania produktu oraz świadczą podobne usługi, to dla konsumentów wszystkie będą takie same.

Jednocześnie ważne jest, aby wziąć pod uwagę pozycję, jaką produkt zajmuje w chwili obecnej na rynku. Pozycja produktu to opinia konsumentów na temat najważniejszych parametrów produktu. Charakteryzuje miejsce, jakie dany produkt zajmuje w świadomości konsumentów w stosunku do produktów konkurencji. W przeciwieństwie do obrazu produktu, który ma charakter bardziej emocjonalny, pozycja produktu kształtowana jest z reguły na podstawie mierzonych ilościowo parametrów (udział w rynku, cechy produktu, cena itp.).

  • Wybór segmentu rynku wiąże się z pewną procedurą, składającą się z trzech etapów.
  • Segmentacja rynku we własnym, wąskim znaczeniu tego słowa – przydział grup konsumentów różniących się potrzebami, możliwościami finansowymi, przyzwyczajeniami,

Pracuję w branży e-mail marketingu dla witryny o nazwie MailChimp.com. Pomagamy klientom tworzyć newslettery dla ich odbiorców reklamowych. Za każdym razem, gdy ktoś nazywa naszą pracę „wypychaniem poczty”, czuję w sercu nieprzyjemny chłód.

Czemu? Tak, ponieważ adresy e-mail nie są już czarnymi skrzynkami, które bombardujesz wiadomościami takimi jak granaty. Nie, w e-mail marketingu (podobnie jak w przypadku innych form kontaktu online, w tym tweetów, postów na Facebooku i kampanii na Pintereście) firmy uzyskują wgląd w to, jak odbiorcy nawiązują kontakt na poziomie indywidualnym poprzez śledzenie kliknięć, zamówienia online, dystrybucję statusów w mediach społecznościowych sieci itp. Te dane to nie tylko zakłócenia. Charakteryzują odbiorców. Ale dla niewtajemniczonych operacje te są zbliżone do mądrości języka greckiego. Albo esperanto.

W jaki sposób zbierasz dane transakcyjne od swoich klientów (użytkowników, subskrybentów itp.) i wykorzystujesz ich dane, aby lepiej zrozumieć swoich odbiorców? Kiedy masz do czynienia z wieloma osobami, ciężko jest przyjrzeć się każdemu klientowi z osobna, zwłaszcza jeśli wszyscy kontaktują się z Tobą w inny sposób. Nawet jeśli teoretycznie mógłbyś dotrzeć do wszystkich osobiście, w praktyce jest to mało wykonalne.

Musisz zebrać bazę klientów i znaleźć złoty środek między przypadkowym bombardowaniem a spersonalizowanym marketingiem dla każdego indywidualnego klienta. Jednym ze sposobów osiągnięcia tej równowagi jest użycie klastrów do segmentacji rynku klientów, dzięki czemu można dotrzeć do różnych segmentów bazy klientów z różnymi ukierunkowanymi treściami, ofertami itp.

Analiza skupień to zbiór różnych obiektów i ich podział na grupy własnego rodzaju. Pracując z tymi grupami — określając, co łączy ich członków i co ich wyróżnia — możesz się wiele dowiedzieć o niechlujnym zbiorze danych, który posiadasz. Ta wiedza pomoże Ci podejmować lepsze decyzje i to na bardziej szczegółowym poziomie niż dotychczas.

W tym kontekście klastrowanie nazywa się eksploracyjnym eksploracją danych, ponieważ te techniki pomagają „wyciągnąć” informacje o relacjach w ogromnych zestawach danych, których nie można wizualnie uchwycić. A odkrywanie powiązań w grupach społecznych przydaje się w każdej branży – polecać filmy w oparciu o przyzwyczajenia grupy docelowej, identyfikować przestępcze centra miasta, czy uzasadniać inwestycje finansowe.

Jednym z moich ulubionych zastosowań klastrowania jest klastrowanie obrazów: umieszczanie na komputerze plików obrazów, które „wyglądają tak samo”. Na przykład w usługach hostingu obrazów, takich jak Flickr, użytkownicy tworzą mnóstwo treści, a prosta nawigacja staje się niemożliwa ze względu na dużą liczbę zdjęć. Ale używając technik grupowania, możesz łączyć podobne obrazy, umożliwiając użytkownikowi nawigację między tymi grupami nawet przed szczegółowym sortowaniem.

Nadzorowane czy nienadzorowane uczenie maszynowe?

W eksploracyjnym eksploracji danych z definicji nie wiesz z wyprzedzeniem, jakiego rodzaju danych szukasz. Jesteś naukowcem. Możesz jasno wyjaśnić, kiedy dwóch klientów wygląda podobnie, a kiedy różni się, ale nie znasz najlepszego sposobu na segmentację bazy klientów. Tak więc proszenie komputera o segmentację bazy klientów nazywa się nienadzorowanym uczeniem maszynowym, ponieważ niczego nie kontrolujesz – nie dyktujesz komputerowi, jak ma wykonywać swoją pracę.

W przeciwieństwie do tego procesu, istnieje nadzorowane uczenie maszynowe, które zwykle pojawia się, gdy sztuczna inteligencja trafia na pierwszą stronę. Jeśli wiem, że chcę podzielić klientów na dwie grupy – powiedzmy „prawdopodobnie kupię” i „mało prawdopodobne” – i nakarmić komputer historycznymi przykładami takich kupujących, stosując wszystkie innowacje do jednej z tych grup, to jest to kontrola.

Jeśli zamiast tego powiem: „Oto, co wiem o moich klientach, a oto jak stwierdzić, czy są inni, czy tacy sami. Powiedz mi coś interesującego ”- to brak kontroli.

W tym rozdziale omówiono najprostszą metodę grupowania znaną jako k-średnie, która powstała w latach 50. XX wieku i od tego czasu stała się podstawą odkrywania wiedzy w bazach danych (KDR) w różnych branżach i rządach.

Metoda k-średnich nie jest najdokładniejszą matematycznie ze wszystkich metod. Została stworzona przede wszystkim ze względu na praktyczność i zdrowy rozsądek - jak kuchnia afroamerykańska. Nie ma tak eleganckiego rodowodu jak francuska, ale często zaspokaja nasze kulinarne zachcianki. Klastrowanie za pomocą k-średnich, jak wkrótce zobaczysz, jest częściowo matematyczne, a częściowo historyczne (o przeszłości firmy, jeśli porównanie dotyczy edukacji menedżerskiej). Jego niewątpliwą zaletą jest intuicyjna prostota.

Zobaczmy, jak działa ta metoda na prostym przykładzie.

Dziewczyny tańczą z dziewczynami, faceci drapią się po głowach

Celem grupowania k-średnich jest wybranie kilku punktów w przestrzeni i przekształcenie ich w k grup (gdzie k jest dowolną wybraną liczbą). Każda grupa jest określona kropką pośrodku, jak flaga posadzona na księżycu, sygnalizująca: „Hej, oto środek mojej grupy! Dołącz, jeśli jesteś bliżej tej flagi niż innych!” To centrum grupy (oficjalnie nazywane centroidem skupień) jest średnią nazwy k-średnich.

Weźmy na przykład tańce szkolne. Jeśli udało Ci się wymazać horror tej „rozrywki” ze swojej pamięci, bardzo przepraszam, że przywracam tak bolesne wspomnienia.

Bohaterowie naszego przykładu – uczniowie Makakne Liceum, którzy przybyli na wieczór taneczny pod romantyczną nazwą „Bal na dnie morza”, są rozrzuceni po auli, jak pokazano na ryc. 1. Malowałem nawet na parkiecie w Photoshopie, żeby łatwiej sobie wyobrazić sytuację.

Ryż. jeden. Uczniowie liceum w Makakne ustawili się w auli

A oto kilka przykładów piosenek, do których ci młodzi liderzy wolnego świata będą niezdarnie tańczyć (na wypadek, gdybyś chciał mieć akompaniament muzyczny, na przykład na Spotify):

  • Styks: Odpłyń
  • Wszystko oprócz dziewczyny: zaginięcie
  • Ace of Base: Wszystko, czego chce
  • Miękka komórka: Skażona miłość
  • Montell Jordania
  • Eiffel 65: niebieski

Teraz klastrowanie według k-średnich zależy od liczby klastrów, na które chcesz podzielić te obecne. Zacznijmy od trzech skupień (w dalszej części rozdziału rozważymy wybór k). Algorytm umieszcza trzy flagi na podłodze auli w jakiś prawidłowy sposób, jak pokazano na rys. 2, gdzie widać 3 początkowe flagi podzielone według płci i oznaczone czarnymi kółkami.

Ryż. 2. Umiejscowienie początkowych ośrodków klastrów

W grupowaniu k-średnich tancerze są przywiązani do najbliższego środka skupienia, tak że można narysować linię demarkacyjną między dowolnymi dwoma środkami na podłodze. Tak więc, jeśli tancerz jest po jednej stronie linii, należy do jednej grupy, jeśli po drugiej stronie, to do drugiej (jak na ryc. 3).

Ryż. 3. Linie wyznaczają granice klastrów

Korzystając z tych linii demarkacyjnych, dzielimy tancerzy na grupy i odpowiednio je kolorujemy, jak na ryc. 4. Ten diagram, który dzieli przestrzeń na wielokąty określone bliskością jednego lub drugiego centrum gromady, nazywa się diagramem Voronoi.

Ryż. 4. Grupowanie według klastrów oznaczonych różnymi wzorami tła na diagramie Voronoi

Spójrzmy na nasz początkowy podział. Coś jest nie tak, prawda? Przestrzeń podzielona jest w dość dziwny sposób: dolna lewa grupa pozostaje pusta, a na granicy górnej prawej grupy przeciwnie, jest wielu ludzi.

Algorytm grupowania k-średnich przesuwa centra klastrów po podłodze, aż osiągnie najlepszy wynik.

Jak określić „najlepszy wynik”? Każda obecna osoba znajduje się w pewnej odległości od centrum swojego skupiska. Im krótsza średnia odległość uczestników od centrum ich grupy, tym lepszy wynik.

Teraz wprowadzamy słowo „minimalizacja” – będzie to dla Ciebie bardzo przydatne w optymalizacji modelu pod kątem lepszej lokalizacji centrów klastrowych. W tym rozdziale sprawisz, że Solver przeniesie centra klastrów niezliczoną ilość razy. Sposobem, którego używa Solver do znalezienia najlepszej lokalizacji dla centrów skupień, jest powolne iteratywne przesuwanie ich po powierzchni, ustalanie najlepszych znalezionych wyników i łączenie ich (dosłownie kojarzące się jak konie wyścigowe) w celu znalezienia najlepszej pozycji.

Więc jeśli schemat na ryc. 4 wygląda raczej blado, „Szukaj rozwiązania” może nagle ułożyć środki jak na ryc. 5. W ten sposób średnia odległość między każdym tancerzem a jego centrum nieznacznie się zmniejszy.

Ryż. 5. Lekko przesuwając centra

Jest oczywiste, że prędzej czy później Poszukiwanie rozwiązania zda sobie sprawę, że centra powinny być umieszczone pośrodku każdej grupy tancerzy, jak pokazano na ryc. 6.

Ryż. 6. Optymalne grupowanie na szkolnych tańcach

W porządku! Tak wygląda idealne grupowanie. Centra klastrowe znajdują się w centrum każdej grupy tancerzy, minimalizując średnią odległość między tancerzem a najbliższym centrum. Teraz, gdy tworzenie klastrów jest zakończone, nadszedł czas, aby przejść do części zabawnej, która polega na próbie zrozumienia, co oznaczają te klastry.

Jeśli znasz kolor włosów tancerzy, ich preferencje polityczne lub czas, w którym przebyli sto metrów, to grupowanie się nie ma większego sensu.

Ale kiedy zdecydujesz się określić wiek i płeć obecnych, zaczniesz dostrzegać pewne ogólne trendy. Mała grupa na dole to osoby starsze, najprawdopodobniej towarzyszące. Grupa po lewej to wszyscy chłopcy, a grupa po prawej to same dziewczyny. I wszyscy bardzo boją się ze sobą tańczyć.

W ten sposób metoda k-średnich pozwoliła podzielić wielu uczestników tańca na grupy i skorelować cechy każdego uczestnika z przynależnością do konkretnego klastra, aby zrozumieć przyczynę rozdzielenia.

Teraz pewnie mówisz sobie: „Daj spokój, co za bzdury. Odpowiedź znałem już przed startem. Masz rację. W tym przykładzie tak. Celowo podałem taki "zabawkowy" przykład, mając pewność, że można go rozwiązać tylko patrząc na kropki. Akcja rozgrywa się w dwuwymiarowej przestrzeni, w której klastrowanie odbywa się elementarnie za pomocą oczu.

Ale co, jeśli prowadzisz sklep, który sprzedaje tysiące produktów? Niektórzy kupujący dokonali jednego lub dwóch zakupów w ciągu ostatnich dwóch lat. Innych są dziesiątki. I każdy kupił coś innego.

Jak zebrać je na takim „parkiecie tanecznym”? Zacznijmy od tego, że ten parkiet nie jest dwuwymiarowy, a nawet trójwymiarowy. To tysiącwymiarowa przestrzeń sprzedaży towaru, w której kupujący kupił lub nie kupił produktu w każdym wymiarze. Zobacz, jak szybko problem klastrowania zaczyna wykraczać poza możliwości „gałki ocznej pierwszej kategorii”, jak lubią mawiać moi przyjaciele wojskowi.

Prawdziwe życie: klastrowanie K-Means w e-mail marketingu

Przejdźmy do bardziej szczegółowego przypadku. Zajmuję się e-mail marketingiem, więc podam przykład z życia Mailchimp.com, gdzie pracuję. Ten sam przykład sprawdzi się w handlu detalicznym, konwersji reklam, mediach społecznościowych itp. Współdziała z niemal każdym rodzajem danych związanych z dostarczaniem materiałów promocyjnych klientom, po czym bezwarunkowo wybierają Ciebie.

Hurtownia Wine Empire Joey Bag O'Donuts

Wyobraź sobie przez chwilę, że mieszkasz w New Jersey, gdzie prowadzisz Joey Bag O'Donuts Wholesale Wine Empire.Jest to firma importowo-eksportowa, której celem jest sprowadzanie ogromnych ilości wina z zagranicy i sprzedawanie go do niektórych sklepów monopolowych w okolicy Biznes działa tak, że Joey podróżuje po całym świecie, szukając niesamowitych okazji z mnóstwem wina, wysyła mu je do Jersey, a od ciebie zależy, czy zamieścisz je w sklepach i zarobisz.

Nabywców znajduje się na wiele sposobów: strona na Facebooku, konto na Twitterze, czasem nawet bezpośrednia poczta – w końcu e-maile „promują” większość rodzajów działalności. W zeszłym roku wysyłałeś jeden list na miesiąc. Zwykle każdy list opisuje dwie lub trzy transakcje, powiedzmy jedną z szampanem, a drugą z malbekiem. Niektóre oferty są po prostu niesamowite – 80% lub więcej. W rezultacie dokonałeś około 32 transakcji w ciągu roku i wszystkie poszły mniej więcej gładko.

Ale to, że wszystko idzie dobrze, nie oznacza, że ​​nie może być lepiej. Przydałoby się nieco głębiej zrozumieć motywy swoich klientów. Oczywiście, gdy patrzysz na konkretne zamówienie, widzisz, że Adams kupił musujące w lipcu z 50% zniżką, ale nie możesz określić, co skłoniło go do zakupu. Czy podobała mu się minimalna wielkość zamówienia jednego kartonu sześciu butelek czy cena, która jeszcze nie osiągnęła maksimum?

Fajnie byłoby móc podzielić listę klientów na grupy zainteresowań. Następnie można by edytować litery do każdej grupy osobno i być może jeszcze bardziej promowałby ten biznes. Każda transakcja odpowiednia dla tej grupy może stać się tematem listu i znaleźć się w pierwszym akapicie tekstu. Ten rodzaj ukierunkowanych wysyłek może spowodować ogromną eksplozję sprzedaży!

Istnieje możliwość, aby komputer wykonał pracę za Ciebie. Korzystając z grupowania k-średnich, możesz znaleźć najlepsze grupowanie, a następnie spróbować dowiedzieć się, dlaczego jest najlepsze.

Początkowy zbiór danych

Dokument Excela, który przeanalizujemy w tym rozdziale, znajduje się na stronie internetowej książki. Zawiera wszystkie oryginalne dane na wypadek, gdybyś chciał z nimi pracować. Możesz też po prostu śledzić tekst, patrząc na pozostałe arkusze w dokumencie.

Na początek masz dwa interesujące źródła danych:

  • metadane dla każdego zamówienia są przechowywane w arkuszu kalkulacyjnym, w tym odmiana, minimalna ilość wina na zamówienie, rabat detaliczny, czy przekroczono limit cenowy i kraj pochodzenia. Dane te są umieszczone w zakładce OfferInformation, jak pokazano na rys. 7;
  • wiedząc, którzy klienci co zamawiają, możesz wytrząsnąć te informacje z MailChimp i przesłać je do arkusza kalkulacyjnego z metadanymi ofert w zakładce Transakcje. Są to zmienne dane przedstawione jak pokazano na rys. 8, bardzo proste: kupujący i jego zamówienie.

Ryż. 7. Szczegóły ostatnich 32 zamówień

Ryż. osiem. Lista zamówień według klienta

Ustalamy przedmiot pomiarów

A oto zadanie. W problemie tańców szkolnych zmierzenie odległości między obecnymi i określenie centrów skupień nie było trudne, prawda? Musisz tylko znaleźć odpowiednią ruletkę! Ale co teraz zrobić?

Wiesz, że w zeszłym roku były 32 oferty ofert i masz listę 324 zamówień w osobnej zakładce, z podziałem na kupujących. Ale aby zmierzyć odległość od każdego klienta do centrum klastra, musisz umieścić go w tej 32-transakcyjnej przestrzeni. Innymi słowy, musisz dowiedzieć się, jakich transakcji nie zawarli, i utworzyć macierz transakcji według klienta, w której każdy klient otrzymuje własną kolumnę z 32 komórkami transakcji, wypełnionymi jedynkami, jeśli transakcje zostały zawarte, i zerami, jeśli nie. T.

Innymi słowy, musisz wziąć tę zorientowaną na wiersz tabelę transakcji i przekształcić ją w macierz z klientami w pionie i ofertami w poziomie. Tabele przestawne to najlepszy sposób na jego utworzenie.

Algorytm działania: w arkuszu ze zmiennymi danymi wybierz kolumny A i B, a następnie wstaw tabelę przestawną. Korzystając z Kreatora tabel przestawnych, po prostu wybierz transakcje jako nagłówek wiersza i kupujących jako nagłówek kolumny i wypełnij tabelę. Komórka będzie miała 1, jeśli istnieje para klient-umowa, i 0, jeśli nie (w tym przypadku 0 jest wyświetlane jako pusta komórka). Wynikiem jest tabela pokazana na ryc. 9.

Ryż. 9. Tabela przestawna „klient-deal”

Teraz, gdy masz już informacje o zamówieniu w formacie matrycy, skopiuj arkusz OfferInformation i nazwij go Matryca. W tym nowym arkuszu wklej wartości z tabeli przestawnej (nie trzeba kopiować i wklejać numeru transakcji, ponieważ jest już w informacjach o zamówieniu), zaczynając od kolumny H. Powinieneś skończyć z rozszerzoną wersją macierzy , wraz z informacjami o zamówieniu, jak na ryc. 10.

Ryż. 10. Opis transakcji i dane zamówienia połączone w jedną macierz

Standaryzacja danych

W tym rozdziale każdy wymiar Twoich danych jest reprezentowany w ten sam sposób, jako binarne informacje o zamówieniach. Ale w wielu sytuacjach klastrowych nie możemy tego zrobić. Wyobraź sobie scenariusz, w którym ludzie są skupieni według wzrostu, wagi i wynagrodzenia. Wszystkie te trzy typy danych mają różne wymiary. Wysokość może wahać się od 1,5 do 2 metrów, a waga od 50 do 150 kg.

W tym kontekście mierzenie odległości między klientami (jak między tancerzami w sali balowej) staje się mylące. Dlatego często standaryzuje się każdą kolumnę danych, odejmując średnią, a następnie dzieląc ją kolejno przez miarę zmienności zwaną odchyleniem standardowym. W ten sposób wszystkie kolumny są zredukowane do jednej wartości, zmieniającej się ilościowo wokół 0.

Zacznijmy od czterech klastrów

Cóż, teraz wszystkie twoje dane są zredukowane do jednego wygodnego formatu. Aby rozpocząć klastrowanie, należy wybrać k - liczbę klastrów w algorytmie k-średnich. Często k-średnie stosuje się w ten sposób: weź zestaw różnych k i przetestuj je jeden po drugim (jak je wybrać, wyjaśnię później), ale dopiero zaczynamy - więc wybierzemy tylko jeden.

Będziesz potrzebować kilku klastrów, które są odpowiednie do tego, co chcesz zrobić. Oczywiście nie zamierzasz tworzyć 50 klastrów i wysyłać 50 ukierunkowanych e-maili promocyjnych do kilku facetów z każdej grupy. To natychmiast pozbawia nas ćwiczenia znaczenia. W naszym przypadku potrzebujemy czegoś małego. Rozpocznij ten przykład od 4 – w idealnym świecie prawdopodobnie podzieliłbyś swoją listę klientów na 4 zrozumiałe grupy po 25 osób każda (co w rzeczywistości jest mało prawdopodobne).

Jeśli więc musisz podzielić kupujących na 4 grupy, w jaki sposób najlepiej ich wybrać?

Zamiast zepsuć ładny arkusz Matrix, skopiuj dane do nowego arkusza i nazwij go 4MC. Teraz możesz wstawić 4 słupki po cenie najwyższej w słupkach od H do K, które będą centrami klastra. (Aby wstawić kolumnę, kliknij prawym przyciskiem myszy kolumnę H i wybierz opcję Wklej. Kolumna pojawi się po lewej stronie.) Nazwij te klastry od Klaster 1 do Klaster 4. Możesz także zastosować do nich formatowanie warunkowe, a za każdym razem, gdy je ustawisz, widzą, jak bardzo się różnią.

Arkusz 4MC pojawi się, jak pokazano na ryc. jedenaście.

Ryż. jedenaście. Puste centra klastrów umieszczone na arkuszu 4MC

W tym przypadku wszystkie centra klastrów są zerami. Ale technicznie mogą to być dowolne i co szczególnie przypadnie Ci do gustu - jak na szkolnych tańcach, są one rozłożone w taki sposób, aby zminimalizować odległość między każdym klientem a jego centrum klastra.

Oczywiście wtedy te centra będą miały wartości od 0 do 1 dla każdej transakcji, ponieważ wszystkie wektory klienta są binarne.

Ale co to znaczy „mierzyć odległość między centrum klastra a nabywcą”?

Odległość euklidesowa: pomiar odległości na wprost

Dla każdego klienta masz osobną kolumnę. Jak zmierzyć odległość między nimi? W geometrii nazywa się to „najkrótszą ścieżką”, a wynikowa odległość jest odległością euklidesową.

Wróćmy na chwilę do auli i spróbujmy wymyślić, jak tam rozwiązać nasz problem.

Umieśćmy osie współrzędnych na podłodze i na ryc. 12 zobaczymy, że w punkcie (8,2) mamy tancerza, aw (4,4) mamy centrum klastra. Aby obliczyć odległość euklidesową między nimi, będziesz musiał zapamiętać twierdzenie Pitagorasa, które znasz od szkoły.

Ryż. 12. Tancerz w (8,2) i centrum klastra w (4,4)

Te dwa punkty są oddalone od siebie o 8 - 4 = 4 metry w pionie i 4 - 2 = 2 metry w poziomie. Zgodnie z twierdzeniem Pitagorasa kwadrat odległości między dwoma punktami wynosi 4L2 + 2L2 = 20 metrów. Stąd obliczamy samą odległość, która będzie równa pierwiastkowi kwadratowemu z 20, czyli około 4,47 m (jak na rys. 13).

Ryż. trzynaście. Odległość euklidesowa jest równa pierwiastkowi kwadratowemu z sumy odległości w każdym kierunku

W kontekście subskrybentów newslettera masz więcej niż dwa wymiary, ale obowiązuje ta sama koncepcja. Odległość między kupującym a centrum klastra jest obliczana poprzez wzięcie różnicy między dwoma punktami dla każdej transakcji, podniesienie ich do kwadratu, dodanie ich i wyciągnięcie pierwiastka kwadratowego. Na przykład na arkuszu 4MC chcesz poznać odległość euklidesową między środkiem skupienia 1 w kolumnie H a zamówieniami Adamsa w kolumnie L.

W komórce L34, zgodnie z rozkazami Adamsa, możesz obliczyć różnicę między wektorem Adamsa a centrum skupienia, podnieść go do kwadratu, dodać, a następnie wziąć pierwiastek, używając następującej formuły tablicowej (sprawdź referencje bezwzględne, co pozwala na przeciągnięcie tego wzór w prawo lub w dół bez zmiany odniesienia do centrum klastra):


(=ROOT(SUM(L$2:L$33-$H$2:$H$33)A2)))

Formuła tablicowa (wpisz formułę i naciśnij Ctrl+Shift+Enter lub Cmd+Return w systemie MacOS, jak omówiono w rozdziale 1), musi być użyta, ponieważ część (L2:L33-H2:H33)^2 musi „wiedzieć”, gdzie do obliczania różnic i ich kwadratury, krok po kroku. Jednak ostateczny wynik to pojedyncza liczba, w naszym przypadku 1,732 (jak na rysunku 14). Ma to następujące znaczenie: Adams wykonał trzy transakcje, ale ponieważ początkowe centra skupień są zerami, odpowiedź będzie równa pierwiastkowi kwadratowemu z 3, czyli 1,732.

Ryż. 14. Odległość między centrum klastra 1 a Adams

W arkuszu kalkulacyjnym na ryc. Na rysunku 2-14 zadokowałem górny wiersz (patrz rozdział 1) między kolumnami G i H i nazwałem wiersz 34 w komórce G34 „Odległość do klastra 1”, aby zobaczyć, co się dzieje, gdy przewijam stronę w dół.

Odległości i przynależność do klastra dla każdego!

Teraz wiesz, jak obliczyć odległość między wektorem porządku a centrum klastra.

Czas dodać Adamsowi obliczenia odległości do pozostałych centrów skupień, przeciągając komórkę L34 w dół do L37, a następnie ręcznie zmieniając odniesienie do środka skupienia z kolumny H na kolumnę I, J i K w poniższych komórkach. Wynikiem powinny być następujące 4 formuły w L34:L37:

(=PIERWIASTEK(SUMA((L$2:L$33-$H$2:$H$33)A2)))
(=PIERWIASTEK(SUMA((L$2:L$33-$I$2:$I$33)A2)))
(=PIERWIASTEK(SUMA((L$2:L$33-$J$2:$J$33)A2)))
(=PIERWIASTEK(SUMA((L$2:L$33-$K$2:$K$33)A2)))
(=ROOT(SUMA((L$2:L$33-$H$2:$H$33)A2)))
(=ROOT(SUMA((L$2:L$33-$I$2:$I$33)A2)))
(=ROOT(SUMA((L$2:L$33-$J$2:$J33)A2)))
(=ROOT(SUMA((L$2:L$33-$K$2:$K$33)A2)))

Ponieważ użyłeś łączy bezwzględnych dla centrów skupień (co oznacza znak $ w formułach, jak omówiono w rozdziale 1), możesz przeciągnąć L34:L37 do DG34:DG37, aby obliczyć odległość od każdego klienta do wszystkich czterech skupień centra. Oznacz wiersze w kolumnie G w komórkach od 35 do 37 „Odległość do skupienia 2” itd. Nowo obliczone odległości pokazano na rysunku 2. 15.

Ryż. 15. Obliczanie odległości od każdego klienta do wszystkich centrów klastrowych

Teraz znasz odległość każdego klienta do wszystkich czterech centrów klastra. Ich rozkład pomiędzy skupienia został dokonany według najkrótszej odległości w dwóch następujących krokach.

Najpierw wróćmy do Adamsa w kolumnie L i obliczmy minimalną odległość do środka skupienia w komórce L38. To proste:

Min(L34:L37)
=min(L34:L37)

Do obliczeń używamy formuły match/searchpos (więcej szczegółów znajdziesz w rozdziale 1). Wstawiając ją do L39, widać numer komórki z przedziału L34:L37 (licząc każdą w kolejności od 1), czyli w odległości minimalnej:

Dopasuj(L38,L34:L37,0) =szukajpoz(L38,L34:L37,0)

W tym przypadku odległość jest taka sama dla wszystkich czterech skupień, więc formuła wybiera pierwszy (L34) i zwraca 1 (Rysunek 16).

Ryż. szesnaście. Dodawanie powiązań klastra do arkusza

Możesz także przeciągnąć te dwie formuły na DG38: DG39. Aby uzyskać lepszą organizację, dodaj nazwy wierszy 38 i 39 w komórkach 38 i 39 kolumny G „Minimalna odległość klastra” i „Przypisany klaster”.

Poszukiwanie rozwiązań dla centrów klastrowych

Twój arkusz kalkulacyjny został zaktualizowany o obliczanie odległości i powiązanie klastrów. Teraz, aby określić najlepszą lokalizację centrów klastrów, należy znaleźć w kolumnach od H do K te wartości, które minimalizują łączną odległość między klientami a centrami klastrów, z którymi są powiązani, wskazane w wierszu 39 dla każdego klient.

Gdy usłyszysz słowo „minimalizuj”: rozpoczyna się faza optymalizacji, a optymalizacja odbywa się za pomocą funkcji „Szukaj rozwiązania”.

Aby skorzystać z Search for a Solution, będziesz potrzebować komórki na wyniki, więc w A36 zsumujemy wszystkie odległości między kupującymi a ich centrami klastrów:

SUMA(L38:DG38)
=CMMA(L3 8:DG3 8)

Ta suma odległości między klientami a ich najbliższymi centrami klastrowymi jest dokładnie tą funkcją, z którą spotkaliśmy się wcześniej podczas klastrowania audytorium McAcne High School. Ale odległość euklidesowa z jej potęgami i pierwiastkami kwadratowymi jest potwornie nieliniową funkcją, więc zamiast metody simpleks musisz użyć ewolucyjnego algorytmu rozwiązania.

Używałeś już tej metody w rozdziale 1. Algorytm simpleks, jeśli można go zastosować, działa szybciej niż inne, ale nie można go używać do obliczania pierwiastków, kwadratów i innych funkcji nieliniowych. Tak samo bezużyteczny jest OpenSolver, który wykorzystuje algorytm simpleks, nawet jeśli wydaje się, że przyjmował sterydy.

W naszym przypadku algorytm ewolucyjny wbudowany w Search for a Solution wykorzystuje kombinację wyszukiwania losowego i doskonałego rozwiązania „skrzyżowanego”, aby, podobnie jak ewolucja w kontekście biologicznym, znaleźć wydajne rozwiązania.

Masz wszystko, czego potrzebujesz, aby ustawić zadanie przed „Szukaj rozwiązania”:

  • cel: zminimalizowanie całkowitych odległości od nabywców do ich centrów klastrowych (A36);
  • zmienne: wektor każdej transakcji względem centrum skupienia (Н2:К33);
  • warunki: centra klastrów muszą mieć wartości z przedziału od 0 do 1.

Zalecana jest obecność „Szukaj rozwiązania” i młotka. Postawiliśmy sobie zadanie „Szukanie rozwiązania”: zminimalizowanie A36 poprzez zmianę wartości H2:K33 na warunek H2:K33<=1, как и все векторы сделок. Убедитесь, что переменные отмечены как положительные и выбран эволюционный алгоритм (рис. 17).

Ryż. 17. Ustawienia dodatku Solver dla 4-ośrodkowego klastrowania

Ale wyznaczenie celu to nie wszystko. Będziesz musiał trochę się pocić, wybierając niezbędne opcje algorytmu ewolucyjnego, klikając przycisk „Parametry” w oknie „Wyszukaj rozwiązanie” i przechodząc do okna ustawień. Radzę ustawić maksymalny czas na 30 sekund więcej, w zależności od tego, jak długo chcesz czekać, aż "Szukaj rozwiązań" poradzi sobie ze swoim zadaniem. Na ryc. 18 Ustawiłem mój na 600 sekund (10 minut). W ten sposób mogę uruchomić „Szukaj rozwiązania” i iść na lunch. A jeśli masz ochotę przerwać to wcześniej, po prostu naciśnij Escape i wyjdź z najlepszym rozwiązaniem, jakie może znaleźć.

Ryż. osiemnaście. Parametry algorytmu ewolucyjnego

Kliknij Uruchom i obserwuj, jak Excel robi swoje, dopóki algorytm ewolucyjny nie zbiegnie się.

Znaczenie wyników

Zabawa zaczyna się, gdy tylko „Szukaj rozwiązania” poda Ci optymalne centra klastrowe. Przejdźmy do grup! Na ryc. Na rysunku 19 widzimy, że Solver znalazł optymalną całkowitą odległość 140,7, a wszystkie cztery centra skupień - dzięki formatowaniu warunkowemu! - wyglądają zupełnie inaczej.

Ryż. dziewiętnaście. Cztery optymalne centra klastrowe

Należy pamiętać, że centra skupień mogą różnić się od przedstawionych w książce, ponieważ algorytm ewolucyjny wykorzystuje liczby losowe i odpowiedź jest za każdym razem inna. Klastry mogą być zupełnie inne lub, co bardziej prawdopodobne, w innej kolejności (na przykład mój klaster 1 może znajdować się bardzo blisko twojego klastra 4 itd.).

Ponieważ podczas tworzenia arkusza umieściłeś opisy handlowe w kolumnach od B do G, możesz teraz przeczytać szczegóły na ryc. 19, co jest ważne dla zrozumienia idei centrów klastrowych.

W przypadku skupienia 1 w kolumnie H formatowanie warunkowe wybiera transakcje 24, 26, 17 i w mniejszym stopniu 2. Czytając opisy tych transakcji, można zobaczyć, co mają ze sobą wspólnego: wszystkie zostały wykonane na Pinot Czarny.

Patrząc na kolumnę I, widać, że wszystkie zielone komórki mają niską minimalną liczbę. Są to kupujący, którzy nie chcą kupować dużych partii podczas transakcji.

Ale pozostałe dwa centra klastrowe, szczerze mówiąc, są trudne do zinterpretowania. A co powiesz na to, by zamiast interpretować centra klastrowe, przyjrzeć się samym nabywcom w klastrze i określić, jakie oferty im się podobają? To może wyjaśnić sprawę.

Ocena ofert metodą klastrową

Zamiast dowiadywać się, które odległości do których centrum klastra są bliższe 1, sprawdźmy, kto jest powiązany z którym klastrem i jakie oferty preferują.

W tym celu zacznijmy od skopiowania arkusza OfferInformation. Nazwijmy kopię 4MS - TopDealsByCluster. Ponumeruj kolumny od H do K na tym nowym arkuszu od 1 do 4 (jak na Rysunku 20).

Ryż. dwadzieścia. Stworzenie tabeli do obliczania popularności ofert z wykorzystaniem klastrów

W arkuszu 4MC miałeś kotwice klastrów od 1 do 4 w wierszu 39. Wszystko, co musisz zrobić, aby policzyć transakcje według klastrów, to spojrzeć na nazwy kolumn od H do K w arkuszu 4MC - TopDealsByCluster, zobacz, który arkusz 4MS był powiązane z tym klastrem w wierszu 39, a następnie zsumowały liczbę swoich transakcji w każdym wierszu. W ten sposób otrzymamy całkowitą liczbę kupujących w tym klastrze, którzy dokonali transakcji.

Zacznijmy od komórki H2, która zawiera liczbę nabywców klastra 1, którzy przyjęli ofertę nr 1, czyli styczniowe malbec. Trzeba dodać wartości komórek z zakresu L2:DG2 na arkuszu 4MC, ale tylko klientów z 1 klastra, co jest klasycznym przykładem użycia formuły sumif/sumif. To wygląda tak:

SUMA.JEŻELI("4MC"!$L 39$:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)
=CyMMEOra("4MC"!$L$39:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)

Ta formuła działa w następujący sposób: podajesz jej pewne wartości warunkowe, które sprawdza w pierwszej części "4MC"!$L$39:$DG$39,"4MC, a następnie porównuje z 1 w nagłówku kolumny ("4MC - TopDealsByCluster "! H$1 ), a następnie dla każdego dopasowania dodaje tę wartość do wiersza 2 w trzeciej części formuły "4MC"!$L2:$DG2.

Zauważ, że użyłeś odwołań bezwzględnych ($ w formule) przed wszystkim, co dotyczy powiązania klastra, numerem wiersza w nagłówkach kolumn i literą kolumny dla zakończonych transakcji. Ustawiając te powiązania jako bezwzględne, możesz przeciągnąć formułę w dowolne miejsce z H2:K33, aby obliczyć liczbę transakcji dla innych centrów skupień i kombinacji transakcji, jak na rysunku 2. 21. Aby uczynić te kolumny bardziej czytelnymi, możesz również zastosować do nich formatowanie warunkowe.

Ryż. 21. Całkowita liczba ofert na ofertę w podziale na klastry

Wybierając kolumny od A do K i stosując autofiltrowanie, możesz sortować te dane. Sortując kolumnę H od najmniejszej do największej, zobaczysz, które transakcje są najpopularniejsze w klastrze 1 (rys. 22).

Ryż. 22. Sortowanie klastrów 1. Pinot, Pinot, Pinot!

Jak wspomniałem wcześniej, cztery największe branże dla tego klastra to pinos. Ci faceci wyraźnie nadużywają filmu Sideways. Jeśli posortujesz klaster 2, stanie się jasne, że są to mali nabywcy hurtowi (rys. 23).

Ale kiedy sortujesz klaster 3, nie jest łatwo cokolwiek zrozumieć. Duże transakcje można policzyć na palcach, a różnica między nimi a resztą nie jest tak oczywista. Jednak najpopularniejsze oferty nadal mają coś wspólnego – całkiem niezłe rabaty, 5 z 6 największych ofert dotyczy wina musującego, a 3 z 4 z nich jest producentem we Francji. Jednak te założenia są niejednoznaczne.

Jeśli chodzi o klaster 4, to z jakiegoś powodu chłopakom najwyraźniej spodobała się oferta sierpniowa na szampana. Ponadto 5 z 6 największych transakcji dotyczy wina francuskiego, a 9 z 10 największych transakcji dotyczy dużej ilości towarów. Może to duża hurtownia skłaniająca się ku winom francuskim? Niepokojące jest również przecięcie się klastrów 3 i 4.