Metode și instrumente de segmentare a consumatorilor. Revizuirea metodelor de analiză a clusterelor și evaluarea aplicabilității acestora pentru rezolvarea problemei de segmentare a pieței de consum. Rezultatele segmentării folosind metoda de scalare multidimensională

Metode de segmentare

Se pot distinge unele metode de segmentare „de bază”. Cea mai importantă dintre ele este analiza de cluster a consumatorilor (taxonomie). Clusterele de consumatori se formează prin gruparea celor care dau răspunsuri similare la întrebările puse. Cumpărătorii pot fi grupați dacă au vârsta, veniturile, obiceiurile etc. similare. Similitudinea dintre cumpărători se bazează pe diferite măsuri, dar o sumă ponderată a diferențelor pătrate dintre răspunsurile cumpărătorilor la o întrebare este adesea folosită ca măsură a asemănării. Rezultatele algoritmilor de grupare pot fi arbori ierarhici sau unirea consumatorilor în grupuri. Există un număr destul de mare de algoritmi de cluster.

De exemplu, în Statele Unite, o analiză de cluster a sistemelor numită PRIZM este utilizată pe scară largă. , care începe gruparea prin reducerea setului de 1000 de indicatori socio-demografici posibili. Acest sistem formează segmente socio-demografice pentru întreg teritoriul SUA. Astfel, a fost evidențiat clusterul 28 - familiile care au intrat în acest cluster includ persoane cu cea mai de succes carieră profesională sau managerială. Acest grup reflectă, de asemenea, venituri mari, educație, proprietate și aproximativ vârsta medie. Deși acest cluster reprezintă doar 7% din populația SUA, este esențial pentru antreprenorii care vând produse de ultimă generație.


Există și alte exemple de segmentare a consumatorilor bazate pe analiza clusterului. De exemplu, printre sectoarele „psihologice”, un loc foarte important îl ocupă „atitudinea consumatorului față de noutatea produsului” (Fig. 3)

Figura 3

După cum se poate observa din datele de mai sus, cel mai mare număr de consumatori se referă la numărul de cumpărători obișnuiți.

Segmentarea consumatorilor bazată pe analiza clusterului este o metodă „clasică”. Totodată, există tehnici de segmentare a pieței pe baza așa-numitei „segmentări de produs” sau segmentare a pieței pe parametri de produs. Este deosebit de important în producția și comercializarea de produse noi. O importanță deosebită este segmentarea pe produse, bazată pe studiul tendințelor pieței pe termen lung. Procesul de dezvoltare și producere a unui nou produs, finalizarea unor programe mari de investiții necesită o perioadă destul de lungă, iar corectitudinea rezultatelor analizei pieței și evaluarea capacității acestuia este deosebit de importantă aici. În condițiile de lucru pe piața tradițională a produselor standard, calculul capacității acestuia poate fi efectuat prin utilizarea metodei însumării piețelor. In conditii moderne, pentru a-si creste competitivitatea si a determina corect capacitatea pietei, nu mai este suficient ca o intreprindere sa segmenteze piata doar intr-o singura directie – definirea grupurilor de consumatori dupa niste criterii. În cadrul marketingului integrat este necesară și segmentarea produsului în sine în funcție de cei mai importanți parametri pentru promovarea acestuia pe piață. În acest scop, metoda de compilare carduri funcționale- realizarea unui fel de dubla segmentare, pe produs si consumator.

Hărțile funcționale” pot fi unifactoriale (segmentarea se realizează în funcție de un factor și pentru un grup omogen de produse) și multifactoriale (analiza căror grupuri de consumatori este destinat un anumit model de produs și care parametri sunt cei mai importanți pentru promovare). produse de pe piață) Prin compilarea cardurilor funcționale, puteți determina pentru ce segment de piață este proiectat un anumit produs, care dintre parametrii săi funcționali corespund anumitor nevoi ale consumatorilor.

La dezvoltarea unui produs nou, această tehnică presupune că trebuie luați în considerare toți factorii care reflectă sistemul de preferințe ale consumatorului și, în același timp, parametrii tehnici ai noului produs, cu care puteți satisface nevoile consumatorului; sunt definite grupuri de consumatori, fiecare cu propriul set de cereri și preferințe; toți factorii selectați sunt clasificați în funcție de gradul de semnificație pentru fiecare dintre grupurile de consumatori.

Această abordare vă permite să vedeți în stadiul de dezvoltare ce parametri ai produsului necesită îmbunătățiri de design sau să determinați dacă există o piață suficient de încăpătoare pentru acest model.

Să dăm un exemplu de astfel de analiză de piață în raport cu proiectul de calculatoare în dezvoltare „Apple” (Tabelul 1) (vezi pagina următoare)

Tabelul 1." Segmentarea pieței calculatoarelor personale și factorii luați în considerare la dezvoltarea produselor pentru aceasta (1982) "

Factori Segmente de piață pe grupuri de consumatori Model
Case La scoala La Universitate Către casă. birou În afacerile mici În corporație DAR LA
Specificatii tehnice * * *** ** ** ** *** **
Preț *** *** ** *** *** ** 0 **
Calități deosebite * * ** * * * ** *
Fiabilitate ** * * ** ** * 0 **
Ușurință în utilizare ** ** * ** * 0 *** ***
Compatibilitate 0 0 0 0 0 *** 0 0
Echipament periferic 0 0 0 0 0 *** 0 0
Software * * ** ** ** *** * **

*** este un factor foarte important

** - factor important

* - factor neimportant

0 - factor neglijabil

Această analiză simplă arată că modelul A este un computer fără piață, iar modelul B este cel mai potrivit produs pentru universități și întreprinderi mici.

Compania a pariat odată pe computerul A și a pierdut.

În general, în practica mondială, sunt utilizate 2 abordări fundamentale ale segmentării marketingului - (vezi: schema generală a analizei segmentelor (Fig. 4)) (pagina următoare)



În cadrul primei metode. denumite „a priori”, sunt cunoscute anterior semnele de segmentare, numărul de segmente, numărul acestora, caracteristicile, harta intereselor. Adică, se presupune că grupurile de segmente din această metodă au fost deja formate. Metoda „a priori” este folosită în cazurile în care segmentarea nu face parte din studiul curent, dar servește ca bază auxiliară pentru rezolvarea altor probleme de marketing. Uneori, această metodă este folosită atunci când segmentele de piață sunt foarte clar definite, când varianța segmentelor de piață nu este mare. „A priory” este, de asemenea, acceptabil în formarea unui nou produs concentrat pe un segment de piață cunoscut.

În cadrul celei de-a doua metode, numită „post hoc (bazat pe cluster),” este implicată incertitudinea semnelor de segmentare și esența segmentelor în sine. Cercetatorul selectează în mod preliminar un număr de variabile care sunt interactive în raport cu respondent (metoda presupune realizarea unui sondaj) și apoi, în funcție de atitudinea declarată față de un anumit grup de variabile, Respondenții aparțin segmentului relevant, în timp ce harta intereselor identificată în analiza ulterioară este considerată secundară. Această metodă este utilizată atunci când segmentarea piețelor de consum, a căror structură segmentară nu este definită în raport cu produsul vândut.

Segmentarea dupa metoda " a priori "

La alegerea numărului de segmente în care ar trebui împărțită piața, acestea sunt de obicei ghidate de funcția obiectiv - determinarea segmentului cel mai promițător. Evident, la formarea unui eșantion, este de prisos să includă în acesta segmente, al căror potențial de cumpărare este destul de mic în raport cu produsul studiat. Numărul de segmente, după cum arată studiile, nu trebuie să depășească 10, excesul este de obicei asociat cu detalierea excesivă a caracteristicilor de segmentare și duce la „neclararea” inutilă a caracteristicilor.

De exemplu, la segmentarea după nivelul veniturilor, se recomandă defalcarea tuturor potențialilor cumpărători în segmente de volum egal, ținând cont de faptul că volumul fiecăruia dintre segmente este cel puțin nu mai mic decât volumul așteptat al vânzărilor de servicii pe baza cunoasterea capacitatii de productie a intreprinderii. Cel mai de succes exemplu care explică cele de mai sus și demonstrează posibilitatea împărțirii potențialilor consumatori în grupuri de segmente stabile poate fi segmentarea populației pe baza veniturilor, atunci când întreaga populație este împărțită în cinci grupuri de 20%. Distribuția prezentată a venitului pentru cinci grupuri de 20% din populație este prezentată în mod regulat în culegeri și rapoarte statistice, similar cu cea prezentată în Tabel. 2

masa 2 ."Distribuția veniturilor pe grupuri de populație. %"

Comoditatea lucrului cu astfel de grupuri de segment este evidentă, mai ales în ceea ce privește urmărirea capacității acestora.

10 martie 2015

Intrând în orice piață cu un produs – consumator, industrial – producătorul trebuie să înțeleagă că nu își poate servi toți clienții, chiar și cu o capacitate de producție suficientă. La urma urmei, cumpărătorii folosesc acest produs în moduri diferite și, cel mai important, îl cumpără, ghidați de diverse motive. Prin urmare, lucrul obișnuit este de a defalca cumpărătorii (segmentarea) în funcție de aceste motive și alte caracteristici și abia apoi - oferta de bunuri produse cu luarea în considerare la maximum a acestor caracteristici. Nu este exagerat să spunem că abordarea ideală a planificării activităților de marketing din punctul de vedere al satisfacerii nevoilor consumatorilor poate fi considerată adaptarea produselor și serviciilor la cerințele fiecărui consumator individual.

Până în 1960, teoria și practica afacerilor a fost dominată de o orientare către o piață de masă agregată. Acest lucru s-a explicat prin faptul că, concentrându-se pe o piață comună, nedistribuită, producătorul a fost capabil să producă un număr mare de mărfuri și să obțină economii de scară. Dar din anii 60. Tendința spre necesitatea de a distinge specificul cererii consumatorilor, care se reflectă în segmentarea pieței de vânzare, a început să capete putere.

În condițiile moderne de creștere a concurenței pe piețele de desfacere, se actualizează problema necesității creșterii competitivității produselor industriale autohtone pe piețele interne și externe. În aceste condiții, problema cheie este căutarea rezervelor pentru a reduce costurile este baza economică a prețului și a profitului. Drept urmare, un număr semnificativ de întreprinderi industriale urmărește o strategie low-cost, concentrându-se pe diverse modalități de implementare a acesteia: respingerea serviciilor conexe costisitoare; economii de costuri prin crearea de modele de produse care sunt mai ieftine de fabricat și altele asemenea. Dar costurile directe sunt determinate în mare măsură de tehnologia de producție, nivelul de încărcare al întreprinderii-producător de mărfuri, iar posibilitățile de reducere a costurilor de management prin îmbunătățirea eficienței gestionării ariilor funcționale ale întreprinderilor rămân subutilizate.

Unul dintre instrumentele moderne este reducerea costurilor de management și asigurarea unei creșteri a calității managementului, ceea ce poate fi interpretat ca acuratețea prognozării profiturilor, rentabilitatea pentru fiecare cluster (un grup de întreprinderi industriale de același tip de activitate economică) comparativ cu la situația inițială, sau acuratețea prognozării profitabilității ariilor funcționale ale acestor activități.întreprinderile este o analiză de cluster.

Importanța segmentării ca instrument eficient de marketing este explicată prin următoarele caracteristici:

ü segmentarea este un mijloc de concurență extrem de eficient, deoarece se concentrează pe identificarea și satisfacerea nevoilor specifice ale consumatorilor;
ü concentrează activitățile companiei pe o anumită nișă de piață, acest lucru este valabil mai ales pentru firmele care își încep activitățile de piață;
ü segmentarea pieței ajută la determinarea mai rezonabilă a direcțiilor de marketing ale companiei;
ü cu ajutorul segmentării devine posibilă stabilirea unor obiective de marketing realiste;
ü Segmentarea de succes a pieței afectează eficacitatea marketingului în ansamblu, de la cercetarea pieței și a consumatorilor până la formarea unui sistem adecvat de vânzări și promovare.

În teoria marketingului, conceptul S TP -marketing . Este format din abrevierea primelor litere ale cuvintelor englezesegmentare(segmentare),țintire(selectarea pietei tinta) sipoziționare(pozitionare). S TP -marketing este nucleul marketingului strategic modern.

Segmentarea pieței - aceasta este împărțirea consumatorilor în grupuri pe baza diferențelor de nevoi, caracteristici sau comportament și dezvoltarea pentru fiecare dintre grupuri a unui mix de marketing separat.

Segment de piață constă în consumatorii care răspund în același mod la același set de stimulente de marketing.

1. Segmentarea pieței- stadiul alocării grupurilor individuale de consumatori în cadrul pieţei comune.
2. Selectarea piețelor țintă- dintre segmentele de piata selectate se selecteaza segmentele tinta, adica cele asupra carora firma isi concentreaza activitatile.
3. Poziționare- identificarea produsului firmei între produsele analoge.

Scopul final al segmentarii pietei tinta este alegerea unui segment (sau segmente) de consumatori a caror satisfacere a nevoilor vor fi orientate activitatile firmei.
Specialiștii de marketing cred că alocarea corectă a segmentului de piață reprezintă jumătate din succesul comercial și își amintesc constant de modificarea binecunoscutului Legea Pareto (legea 80:20).

Metode de segmentare a pieței:

metoda a priori;

· Metoda clusterului;

· Metoda de segmentare flexibilă;

· Metoda de segmentare a componentelor.

La metode a priori ipoteza segmentării pieței este mai întâi prezentată și apoi testată în cursul cercetării de marketing. Prin urmare, această metodă se numește a priori, adică. neexperimentat. Această metodă de segmentare a pieței este de departe cea mai frecvent utilizată, datorită simplității sale relative, disponibilității metodelor aduse implementării practice și costului redus de implementare.

Metode de cluster implică faptul că structura pieței este necunoscută. Ei nu definesc o variabilă dependentă, ci caută clustere naturale găsite într-o bază de date de consumatori obținută prin cercetări de piață. În acest caz, respondenții sunt mai întâi grupați dintre potențialii consumatori folosind o procedură analitică specială în clustere naturale - segmente de piață. După aceea, se definesc variabile, cu ajutorul cărora ar fi posibilă definirea formală a segmentului de piață.

Comparativ cu segmentarea a priori, când segmentele sunt determinate de variabilele estimate la începutul studiului, și cu segmentarea cluster, când segmentele selectate sunt formate din rezultatele analizei cluster, modelele segmentare flexibilă oferă o abordare dinamică a problemei. Folosind această abordare, un număr mare de segmente diferite pot fi dezvoltate și testate, fiecare incluzând consumatori sau organizații cu o percepție similară asupra noilor produse „de probă” (identificate printr-o configurație a caracteristicilor specifice ale produsului). Segmentarea flexibilă combină rezultatele analizei cuplate și modelării computerizate a comportamentului consumatorului la alegerea unui produs.

Segmentarea componentelor mută focalizarea segmentării pieței către caracteristicile de personalitate (descrise printr-un set de caracteristici demografice și psihografice) care ar fi potrivite mai bine de caracteristicile produsului. În segmentarea componentă cu componentă, cercetătorul este interesat să compare parametrii valorii produsului și diversele caracteristici ale respondentului. După ce au definit aceste două seturi de parametri, cercetătorul poate face sugestii pentru dezvoltarea oricăror posibile proprietăți ale produsului pentru orice tip de consumator.

Procesul de segmentare a pieței

Procesul de segmentare are loc în opt etape.

Strategia de acoperire a pieței
Primul pas este alegerea unei metode de segmentare.

A doua etapă este verificarea omogenității segmentului, adică. verificăm dacă reacția consumatorului la produsul acestui segment este aceeași.

A treia etapă este verificarea nivelului de diferențiere a segmentului, adică. verificăm câte segmente este calculat produsul și ce varietate de bunuri oferă organizația.

A patra etapă este o evaluare a nivelului de accesibilitate al segmentului, i.e. este necesar să se evalueze dacă întreprinderea are un număr suficient de canale pentru vânzarea produselor sale, care este debitul acestor canale, dacă întreprinderea poate asigura vânzarea întregului volum de produse, dacă sistemul de livrare a produselor către consumatorii este suficient de fiabil.

A cincea etapă este verificarea nivelului de rentabilitate al segmentului, adică. se determină prețul posibil al produsului atunci când se lucrează în acest segment și costul acestuia, ținând cont de adaptarea produsului pentru acest segment. (Profitabilitate ≈ Rentabilitate)

A șasea etapă este evaluarea stabilității segmentului.

A șaptea etapă este alegerea segmentului țintă.

A opta etapă este strategia de acoperire a pieței.

Evaluarea atractivității segmentelor și a conceptului de piață țintă

Atractivitatea unui segment de piață este determinată în conformitate cu criterii pe care fiecare companie le determină în mod independent.

Nu toate criteriile sunt de aceeași importanță și, prin urmare, fiecare dintre ele trebuie luat în considerare separat. Scopul analizei atractivității este de a calcula semnificația ponderată a unui criteriu care caracterizează „atractivitatea” unui anumit produs.

Piața țintă este cel mai potrivit și mai profitabil grup de segmente de piață (sau un segment) pentru întreprindere, către care sunt direcționate activitățile acesteia.

Compania ar trebui să promoveze acele diferențe ale produsului său care sunt cele mai atractive pentru piața țintă.

În evaluarea segmentelor de piață, sunt luați în considerare doi factori: (1) atractivitatea lor generală și (2) obiectivele și resursele companiei care o dezvoltă.


Criterii de evaluare a atractivității pieței țintă

1. Mărimea (capacitatea) pieței - Sub capacitatea pieței de mărfuri se înțelege volumul posibil de vânzări de mărfuri (produse specifice întreprinderii) la un nivel dat și raportul de prețuri diferite. Capacitatea pieței este caracterizată de mărimea cererii populației și de mărimea ofertei de mărfuri.

2. Localizare geografică

3. Vânzări reale și potențiale
Volumul real de vânzări - cantitatea de bunuri și servicii pe care organizația le poate vinde în mod realist în condițiile existente de funcționare, costurile estimate ale reclamei și nivelul prețurilor pe care intenționează să-l stabilească.

Volumul potențial de vânzări (oferta) - cota din piața potențială pe care organizația speră să o ocupe și, în consecință, numărul maxim de bunuri pe care se poate baza pentru vânzare cu capacitățile sale.

4. Nivelul real și potențial și intensitatea concurenței

capacitatea reală și potențială a companiilor de a proiecta, fabrica și comercializa produse care sunt mai atractive din punct de vedere al prețului și al parametrilor non-preț decât produsele concurenților.

intensitatea concurenței și, în consecință, nivelul de competitivitate al companiei sunt determinate de potențialul pieței; ușurința de a intra în el; tipul de bunuri; omogenitatea pieței; structura industriei sau pozițiile competitive ale firmelor; oportunități de inovare tehnologică etc.

5. Posibilitatea de acoperire a pieței

Numărul de puncte de desfacere și centre potențiale prin care va fi distribuit produsul.

6. Costuri reale și potențiale de promovare

7. Etapa ciclului de viață al pieței - adică dezvoltarea produsului, etapa de implementare, etapa de dezvoltare (de creștere), etapa de maturitate sau etapa de declin

8. Tendințele pieței, de ex. direcție de dezvoltare, perspective

9. Cerințe suplimentare ale consumatorilor pentru produs

10. Nivelul real și potențial al prețurilor

11. Așteptările consumatorului și răspunsul real la eforturile de marketing de produs

IMM-urile ar trebui să identifice și să selecteze doi până la trei factori cheie de succes ca rezultat al analizei atractivității fiecărui segment de piață. Factorii critici de succes vor fi „motto-ul” companiei și trebuie amintiți în permanență. Sunt cele mai importante circumstanțe care trebuie sau nu trebuie să apară pentru ca o companie să aibă succes pe o anumită piață a produsului.

Strategii de acoperire a pieței

După finalizarea segmentării, compania trebuie să stabilească ce segment își va viza activitățile. În funcție de gradul de acoperire a pieței, sunt posibile trei tipuri de strategii:

1. Segment unic (marketing concentrat)

firma se concentrează pe o pondere mare a uneia sau mai multor subpiețe. De exemplu, Volkswagen și-a concentrat eforturile pe piața de mașini mici. Prin marketing concentrat, firma își asigură o poziție puternică pe piață în segmentele pe care le deservește, deoarece cunoaște nevoile acelor segmente mai bine decât oricine altcineva și se bucură de o anumită reputație. Mai mult, ca urmare a specializării măsurilor de producție, distribuție și promovare, firma realizează economii în multe domenii de activitate. Cu toate acestea, această strategie este asociată cu un nivel crescut de risc: segmentul selectat poate să nu corespundă așteptărilor. În acest sens, multe firme aleg să-și diversifice activitățile, acoperind mai multe segmente de piață diferite.

Această abordare este uneori denumită „strategie de nișă”, deoarece Acest lucru se face adesea cu resurse limitate.

2. Segmente multiple (marketing diferențial)

Un număr tot mai mare de firme adoptă această strategie.

Oferind o varietate de produse, firma speră să obțină o creștere a vânzărilor și o penetrare mai profundă în fiecare dintre segmentele sale de piață. Ea se așteaptă ca prin consolidarea poziției sale pe mai multe segmente de piață, să poată identifica în mintea consumatorului firma cu această categorie de produse. Mai mult, ea se așteaptă la o creștere a achizițiilor repetate, deoarece produsul companiei corespunde dorințelor consumatorilor, și nu invers.

3. Acoperire completă a pieței (marketing nediferențiat)

Majoritatea profesioniștilor în marketing consideră că această strategie este limitată în domeniul de aplicare.

În acest caz, firma se concentrează nu pe modul în care nevoile clienților diferă unele de altele, ci pe ceea ce au aceste nevoi în comun. Ea dezvoltă un produs și un program de marketing care va atrage cât mai mulți clienți. Se bazează pe metode de distribuție în masă și publicitate în masă. Se străduiește să ofere produsului o imagine de superioritate în mintea oamenilor. Ca exemplu de marketing nediferențiat, putem cita acțiunile companiei Krasny Oktyabr, care în urmă cu câțiva ani oferea un brand de ciocolată pentru toată lumea.

Marketingul nediferențiat este economic. Costurile de producere a unui produs, menținerea inventarului acestuia și transportul acestuia sunt reduse. Costurile de publicitate cu marketing nediferențiat sunt, de asemenea, menținute la un nivel scăzut. Absența necesității cercetării de marketing a segmentelor de piață și a planificării defalcate pe aceste segmente ajută la reducerea costurilor cercetării de marketing și managementului produsului.

Conceptul de poziționare

Poziționare este procesul de găsire a unei poziții pe piață pentru o companie, produs sau serviciu care să-l distingă favorabil (pe el) de poziția concurenților. Poziționarea se realizează ținând cont de un anumit grup țintă de consumatori, pentru care sunt create și oferite avantaje și unicitate. Fără o idee clară despre ce vizează postul, este foarte dificil, chiar aproape imposibil, să aliniezi deciziile de marketing. Definiția poziționării competitive dictează adesea cele mai eficiente combinații de instrumente de marketing.
Rezumând, putem spune că poziționarea este o strategie de marketing pentru a crea o legătură puternică a mărcii tale (produs sau companie) cu anumite asociații, sau mai bine, cu beneficii.

Astfel, poziționarea presupune:
- crearea în fruntea consumatorului a unei asociații stabile a unui produs sau companie cu un anumit loc în piață,
- mentinerea asocierii (pozitia aleasa) pe termen lung.

Poziția produsului pe piață locul pe care un anumit produs îl ocupă în mintea consumatorilor în comparație cu produse similare concurente din punctul de vedere al consumatorului.
Strategia de poziționare este un set de măsuri care vizează transmiterea conceptului de poziționare către consumatori. Poziționarea există doar în mintea consumatorului.
- Strategie de oferire de bunuri (servicii)
- Strategia de stabilire a prețurilor
- Strategia de distributie a produselor
- Strategie de promovare a bunurilor (serviciilor)
Constrângere de poziţionare
- Piața țintă
- Concurenți reali și potențiali
- Strategia companiei

Repoziționare- schimbari in pozitia unui produs sau serviciu in marketing si publicitate, cand li se da o noua imagine, se determina un alt public tinta, se schimba argumentele pentru vanzari si informatii publicitare, ambalaje etc.
Motive pentru repoziționare:
- Poziționare discutabilă
- Subpoziţionare
- Pozitionare indistinta
- Poziționare inutilă
- Suprapoziţionare

Locul de reședință etc. Din aceasta ar trebui să fie clar că segmentul de piață este

Există un grup de consumatori care în anumite privințe se comportă la fel pe piață.

Segmentarea pieței, la rândul său, se descompune în mai multe etape.

  • 2. Alegerea unui segment de piata rezida in faptul ca fiecare dintre segmente este evaluat din punct de vedere al atractivitatii sale (capacitatea de a aduce intreprinderii rezultatul dorit). Pe baza acestor estimări, este selectat segmentul (sau segmentele) cel mai atractiv.
  • 3. În cele din urmă, a treia etapă este poziționarea produsului. După selectarea segmentului de piață, este necesar să ne gândim la modul în care va fi prezentat pe piață produsul pe care compania îl oferă pe piață. În plus, trebuie dezvoltat și un mix de marketing detaliat. Aceste sarcini sunt rezolvate în această etapă.

În marketing, au fost identificate mai multe caracteristici care pot îmbunătăți eficacitatea segmentării. Aceste semne nu privesc consumatorii, ci segmentele in sine.

  • 1. Segmentul trebuie să aibă sens. Aceasta înseamnă că atributul care stă la baza segmentării trebuie să se adapteze cel puțin într-o oarecare măsură cu comportamentul consumatorului. Astfel, a fi supraponderal contează în ceea ce privește cât de multă pâine consumă o persoană, sau dacă are probleme în cumpărarea hainelor. Cu toate acestea, este puțin probabil ca acest semn să fie semnificativ în legătură cu produsele cosmetice pe care le folosește.
  • 2. Segmentul de piata trebuie sa fie suficient de mare ca dimensiune pentru a putea genera profitul necesar succesului firmei. Dacă segmentul este prea mic din acest punct de vedere, dezvoltarea și implementarea unui program de marketing axat pe acesta pur și simplu nu are sens.
  • 3. Segmentul trebuie să fie măsurabil. Aceasta înseamnă că caracteristica care stă la baza segmentării trebuie să ofere posibilitatea unei separări clare și fără ambiguitate a unui grup de consumatori de celelalte grupuri ale acestora. Vârsta este un exemplu de trăsătură măsurabilă. Întotdeauna putem împărți cu ușurință toți consumatorii în grupuri în funcție de valoarea pe care o ia această variabilă.

Un exemplu de caracteristică care nu este pe deplin măsurabilă poate fi și, în mod ciudat, frecvența de consum a unui produs, preferințele consumatorilor în unele cazuri pot fi extrem de variabile. Un semn mult mai de încredere din acest punct de vedere este loialitatea față de brand: chiar dacă consumatorul cumpără un produs rar, el va alege întotdeauna o singură marcă, respingând toate celelalte.

Aici, ar trebui să se ia în considerare, de asemenea, dacă intervievatul va fi sincer atunci când răspunde la întrebarea cercetătorului. Din acest punct de vedere, semnele tipului de orientare sexuală sunt slab măsurabile. Deși gradul de toleranță al societății noastre față de minoritățile sexuale este în continuă creștere (și acesta este un semn al oricărei societăți suficient de dezvoltate), nu fiecare reprezentant al acestor minorități va îndrăzni să-și declare deschis orientarea sexuală.

3. Segmentul trebuie să fie accesibil. Această calitate presupune nu numai accesibilitatea pentru cercetare, ci și disponibilitatea informațiilor suplimentare. Dacă se poate aștepta ca o întreprindere să fie capabilă să influențeze segmentul jerk cu mijloacele de care dispune și apoi să-și evalueze impactul comparând starea inițială cu starea de după impact, segmentul poate fi considerat accesibil. Este clar că acest lucru este posibil doar dacă există acces la informații.

În practica de marketing, cel mai des sunt utilizate trei metode de segmentare: gruparea, segmentarea secvenţială multivariată cu o variabilă dependentă şi analiza cluster. Această listă nu epuizează toate metodele de segmentare posibile, dar este suficient pentru a vă face o idee generală despre această procedură și complexitățile asociate acesteia.

1. Cel mai simplu mod de segmentare este împărțirea pieței în grupuri identificate în mod tradițional în marketing și sociologie pe baza caracteristicilor enumerate mai sus. În acest caz, se presupune pur și simplu că grupurile de consumatori, identificate pe baza unor caracteristici precum gen, vârstă sau profesie, sunt caracterizate de un set destul de standard de nevoi și comportamente.

Aceasta metoda este cea mai potrivita in cazul alegerii unui nou domeniu de activitate, de exemplu, in cazul in care firma abia incepe sa opereze pe piata sau decide sa intre pe o noua piata.

Dezavantajul acestei metode de segmentare este că se bazează pe presupuneri, ipoteze. Împărțirea consumatorilor în funcție de vârstă, sex, profesie, nivel de venit sau statut social este tradițională pentru cercetările de marketing, dar nu este deloc evident că aceste variabile sunt asociate cu procesul de „finisare” a consumatorilor. Cu alte cuvinte, este departe de a fi întotdeauna posibil să se afirme că activitatea consumatorilor depinde direct, de exemplu, de vârsta acestora. Prin urmare, recurgând la o astfel de segmentare, marketerul selectează motive arbitrare și insuficient de ponderale pentru selectarea segmentelor.

La segmentarea pieței, trebuie avut în vedere faptul că caracteristicile care stau la baza alocării anumitor grupuri au importanță diferită. Pe de o parte, putem vorbi despre semne care au legătură directă cu obiectivele întreprinderii. Un astfel de semn ar fi, de exemplu, dorința de a cumpăra un produs nou care are un set de anumite calități: pe această bază, putem distinge un grup de consumatori care sunt gata să facă acest lucru și un grup de consumatori care nu sunt. gata pentru asta.

Întrucât întreprinderea este interesată de vânzarea de bunuri, acest parametru este direct legat de obiectivele sale. Pe de altă parte, există parametri mai puțin semnificativi care nu sunt în aceeași legătură strânsă cu obiectivele întreprinderii. Un exemplu de astfel de trăsătură ar fi vârsta. Deci, cutare sau cutare produs poate fi destinat categoriei de vârstă a persoanelor după 30 de ani. Dar asta nu înseamnă că orice persoană care are peste treizeci de ani va cumpăra acest produs. În consecință, vârsta ca parametru de segmentare este mai puțin legată de obiectivele imediate ale întreprinderii.

Dacă numărul de factori cu adevărat semnificativi este foarte mare, aceștia pot fi redusi folosind așa-numita analiză factorială. Implica selectarea unor grupuri de caracteristici (parametri) asociate, care sunt combinate într-o singură caracteristică. Deci, de exemplu, nivelul veniturilor este strâns legat de mărimea casei, prezența unei mașini, numărul de excursii turistice, vizitele la unități precum restaurante și cluburi și, prin urmare, aceste semne pot fi combinate într-una singură.

Este recomandabil să dai un nume acestei caracteristici. În cazul nostru, am putea numi noua caracteristică „suma venitului”, dar o interpretăm în sens larg, nu doar ca suma de bani pe care o primește o persoană într-o lună sau într-un an. În mod similar, se poate lega nivelul de venit, ocupația și educația, nivelul de venit și preferințele politice etc.

2. Segmentarea secvenţială multivariată cu o variabilă dependentă este cea mai potrivită atunci când compania are deja experienţă pe piaţă. În acest caz, segmentarea are ca scop identificarea celui mai preferat segment de piață în ceea ce privește rezultatele deja disponibile.

Întrucât principalul rezultat spre care se străduiește compania este extragerea unui profit maxim, în acest caz, de exemplu, venitul companiei poate fi ales ca variabilă dependentă. Segmentarea preliminară vizează acest aspect: este necesară identificarea grupurilor de consumatori care, din punctul de vedere al întreprinderii, îi aduc cel mai mare venit.

Este clar că limita inferioară a venitului este determinată în general subiectiv și reprezintă un compromis între situația reală și cea dorită. Este posibil să se distingă, de exemplu, trei grupuri: consumatori care aduc un venit mare, consumatori care aduc un venit mediu (satisfăcător) și consumatori care aduc un venit prea mic.

A doua etapă a segmentării este identificarea celei de-a doua variabile, care este cel mai strâns legată de prima variabilă. Această variabilă este de obicei:

  • a) frecvența de utilizare a produsului sau serviciului vândut de firmă;
  • b) nivelul veniturilor aduse de consumator firmei;
  • c) loialitatea consumatorului față de marcă. De exemplu, în cercetările de marketing reiese că oamenii de la 25 la 33 de ani aduc cele mai mari venituri companiei. Prin urmare, toți consumatorii ar trebui împărțiți în cel puțin trei grupuri: 1) până la 25 de ani; 2) de la 25 la 33 de ani și 3) peste 33 de ani.

Atunci când se utilizează această metodă, doar segmentul cel mai profitabil al pieței este supus unei segmentări ulterioare. În cazul nostru, aceasta este categoria consumatorilor cu vârsta cuprinsă între 25 și 33 de ani. În etapele ulterioare se regăsesc din nou bazele segmentării, care sunt cel mai mult legate de nivelul de rentabilitate.

Limita de divizare în acest caz este segmentul, care trebuie să aibă următoarele calități:

  • 1) consumatorii care îi aparțin aduc cele mai mari venituri companiei (de exemplu, veniturile primite de companie pe acest segment, care reprezintă doar 20% din piață, reprezintă 70% din venitul total);
  • 2) segmentul nu trebuie stăpânit pe deplin;
  • 3) trebuie să fie suficient de mare încât să merite să fie investit în dezvoltarea sa suplimentară;
  • 4) divizarea ulterioară a segmentului ar trebui să fie imposibilă (aceasta este caracteristica preferată).

Avantajul acestei metode de segmentare este că se bazează pe cele mai semnificative variabile. Această metodă are și dezavantaje. În primul rând, nu ține cont de interacțiunea dintre diferite variabile. În plus, segmentele care sunt alocate rapid cu ajutorul acestuia se dovedesc a fi prea mici. În același timp, în general, această metodă este destul de productivă.

Când îl utilizați, puteți vedea care segmente sunt cu adevărat cele mai preferate, care pot fi și care ar trebui abandonate cu totul. În special, utilizarea acestei metode face posibilă formularea unor sarcini foarte realiste, de exemplu, creșterea veniturilor primite de la unul sau altul grup de consumatori. În cele din urmă, vă permite să identificați punctele slabe în activitățile companiei.

3. Spre deosebire de cele două metode de segmentare anterioare, în care marketerul începe analiza de piață cu întreaga populație de consumatori și îi împarte treptat în grupuri, cu analiza cluster, direcția este inversată: analiza începe cu consumatorii individuali. Din acest motiv, analiza clusterului necesită ca marketerul să aibă date despre un număr suficient de mare de consumatori reali, de regulă, numărul acestora ar trebui să fie de cel puțin 200 de persoane.

Analiza cluster include mai mulți pași.

  • 1) În primul rând, marketerul selectează aleatoriu un consumator și începe să caute altul care să fie cât mai asemănător cu el în ceea ce privește parametrii cunoscuți. Când doi astfel de consumatori sunt găsiți, aceștia sunt combinați într-un grup. Alte grupuri sunt identificate în mod similar.
  • 2) Următorul pas este unificarea consumatorilor individuali și a grupurilor acestora în comunități mai largi. Trebuie avut în vedere faptul că atât consumatorii individuali sau clusterele deja alocate, cât și un consumator și un cluster pot fi combinați în clustere. Fuziunea se realizează până la obținerea unui număr mai mult sau mai puțin satisfăcător de clustere, adică segmente care, ca volum, corespund intereselor întreprinderii.
  • 3) Controlul asupra corectitudinii alocării clusterelor este ca marketerul să efectueze segmentarea a doua oară și să verifice dacă aceeași segmentare poate fi obținută folosind alte măsuri de similaritate. Se compară rezultatele segmentării principale și ale controlului pe baza analizei cluster, după care se fac ajustări la segmentarea principală.

Avantajul incontestabil al acestei metode este că vă permite să porniți de la date specifice despre consumatori. Un agent de marketing care folosește această metodă este mai puțin probabil să aleagă un parametru de segmentare care are de fapt o valoare mică.

Dezavantajul acestei metode este că atunci când o folosești, pot fi selectate clustere care nu există de fapt. Aceasta înseamnă că grupurile de consumatori rezultate nu vor fi de fapt caracterizate de același comportament. De aceea, diferitele proceduri de control ar trebui să fie o parte obligatorie a analizei cluster.

Pozitionarea produsului pe piata este o directie a activitatii de marketing pentru selectia pietelor tinta, care presupune analiza elementelor mixului de marketing si a pozitiilor produselor in segmente de piata selectate in vederea identificarii acelor parametri care contribuie la obtinerea de avantaje competitive.

Dacă toate întreprinderile produc aceleași produse cu aceleași caracteristici, folosesc aceleași metode de promovare și livrare a produsului și oferă servicii similare, atunci pentru consumatori vor fi toți la fel.

Totodata, este important sa se tina cont de pozitia pe care produsul o ocupa pe piata in prezent. Poziția produsului este opinia consumatorilor asupra celor mai importanți parametri ai produsului. Caracterizează locul ocupat de un anumit produs în mintea consumatorilor în raport cu produsul concurenților. Spre deosebire de imaginea unui produs, care este mai mult o caracteristică emoțională, poziția unui produs se formează, de regulă, pe baza unor parametri măsurați cantitativ (cota de piață, caracteristicile produsului, prețul etc.).

  • Alegerea unui segment de piata presupune o anumita procedura, formata din trei etape.
  • Segmentarea pieței în sensul propriu, restrâns al cuvântului - alocarea grupurilor de consumatori care diferă în ceea ce privește nevoile, capacitățile financiare, obiceiurile,

Lucrez în industria de email marketing pentru un site numit MailChimp.com. Ajutăm clienții să creeze buletine informative pentru publicul lor de publicitate. De fiecare dată când cineva numește munca noastră „umplutură de corespondență”, simt un fior neplăcut în inimă.

De ce? Da, pentru că adresele de e-mail nu mai sunt cutii negre pe care le bombardezi cu mesaje precum grenade. Nu, în marketingul prin e-mail (ca și în cazul altor forme de contact online, inclusiv tweet-uri, postări pe Facebook și campanii Pinterest), companiile obțin informații despre modul în care publicul contactează la nivel individual prin urmărirea clicurilor, comenzile online, distribuția stărilor în rețelele sociale. rețele, etc. Aceste date nu sunt doar interferențe. Ele vă caracterizează publicul. Dar pentru cei neinițiați, aceste operațiuni sunt asemănătoare cu înțelepciunea limbii grecești. Sau Esperanto.

Cum colectați datele despre tranzacții de la clienții dvs. (utilizatori, abonați etc.) și cum le folosiți pentru a înțelege mai bine publicul? Când ai de-a face cu o mulțime de oameni, este greu să studiezi fiecare client individual, mai ales dacă toți te contactează în moduri diferite. Chiar dacă teoretic ați putea ajunge personal la toată lumea, în practică acest lucru este greu de fezabil.

Trebuie să luați baza de clienți și să găsiți o cale de mijloc între bombardarea aleatorie și marketingul personalizat pentru fiecare client în parte. O modalitate de a atinge acest echilibru este să utilizați gruparea pentru a segmenta piața de clienți, astfel încât să puteți ajunge la diferite segmente ale bazei dvs. de clienți cu conținut, oferte diferite etc.

Analiza cluster este o colecție de diferite obiecte și împărțirea lor în grupuri de tipul lor. Lucrând cu aceste grupuri – determinând ce au membrii lor în comun și ce îi face diferiți – puteți afla multe despre setul de date dezordonat pe care îl aveți. Aceste cunoștințe te vor ajuta să iei decizii mai bune și la un nivel mai detaliat decât înainte.

În acest context, gruparea se numește explorare a datelor, deoarece aceste tehnici vă ajută să „trageți” informații despre relații în seturi de date uriașe pe care nu le puteți captura vizual. Iar descoperirea legăturilor în grupuri sociale este utilă în orice industrie - pentru a recomanda filme bazate pe obiceiurile publicului țintă, pentru a identifica centrele criminale ale orașului sau pentru a justifica investițiile financiare.

Una dintre utilizările mele preferate ale grupării este gruparea de imagini: adunarea fișierelor de imagine care „arata la fel” pentru un computer. De exemplu, pe serviciile de găzduire a imaginilor precum Flickr, utilizatorii produc tone de conținut și navigarea simplă devine imposibilă din cauza numărului mare de fotografii. Dar folosind tehnici de grupare, puteți combina imagini similare, permițând utilizatorului să navigheze între aceste grupuri chiar înainte de sortarea detaliată.

Învățare automată supravegheată sau nesupravegheată?

În explorarea minării de date, prin definiție, nu știți dinainte ce fel de date căutați. Ești cercetător. Puteți explica clar când doi clienți arată similar și când arată diferit, dar nu cunoașteți cel mai bun mod de a vă segmenta baza de clienți. Deci, a cere unui computer să segmenteze baza de clienți pentru dvs. se numește învățare automată nesupravegheată, deoarece nu controlați nimic - nu dictați computerului cum să-și facă treaba.

Spre deosebire de acest proces, există învățare automată supravegheată, care apare de obicei atunci când inteligența artificială ajunge pe prima pagină. Dacă știu că vreau să împart clienții în două grupuri - spuneți „probabil să cumpere” și „putin să cumpere” - și să alimentez computerul cu exemple istorice ale unor astfel de cumpărători, aplicând toate inovațiile unuia dintre aceste grupuri, atunci acesta este Control.

Dacă, în schimb, spun: „Iată ce știu despre clienții mei și iată cum să-mi dau seama dacă sunt diferiți sau la fel. Spune-mi ceva interesant, ”este lipsa de control.

Acest capitol discută cea mai simplă metodă de grupare cunoscută sub numele de k-means, care datează din anii 1950 și de atunci a devenit un element de bază în descoperirea cunoștințelor bazelor de date (KDR) în industrii și guverne.

Metoda k-means nu este cea mai precisă din punct de vedere matematic dintre toate metodele. A fost creată, în primul rând, din motive de practic și bun simț - precum bucătăria afro-americană. Ea nu are un pedigree atât de șic precum cel francez, dar deseori satisface capriciile noastre gastronomice. Agruparea cu k-means, după cum veți vedea în scurt timp, este parțial matematică și parțial istorică (despre trecutul companiei, dacă comparația este în educația managerială). Avantajul său incontestabil este simplitatea intuitivă.

Să vedem cum funcționează această metodă cu un exemplu simplu.

Fetele dansează cu fetele, băieții se scarpină în cap

Scopul grupării k-means este de a alege câteva puncte din spațiu și de a le transforma în k grupuri (unde k este orice număr pe care îl alegeți). Fiecare grup este definit de un punct în centru, ca un steag plantat pe lună, care semnalează: „Hei, iată centrul grupului meu! Alăturați-vă dacă sunteți mai aproape de acest steag decât de celelalte!” Acest centru de grup (numit oficial centroid cluster) este media numelui k-means.

Luați în considerare, de exemplu, dansurile școlare. Dacă ați reușit să ștergeți oroarea acestui „divertisment” din memorie, îmi pare foarte rău că vă readuc amintiri atât de dureroase.

Eroii exemplului nostru - elevii liceului Makakne, care au venit la seara de dans sub numele romantic „Ball at the Fund of the Sea”, sunt împrăștiați în jurul sălii de adunări, așa cum se arată în Fig. 1. Am pictat chiar și pe parchet în Photoshop pentru a ne imagina mai ușor situația.

Orez. unu. Elevii liceului Makakne s-au aliniat în sală

Și iată câteva exemple de cântece pe care acești tineri lideri ai lumii libere vor dansa stângace (în cazul în care doriți un acompaniament muzical, de exemplu, pe Spotify):

  • Styx: Vino departe
  • Totul, în afară de fata: dispărut
  • Asul de bază: Tot ce vrea ea
  • Soft Cell: Tainted Love
  • Montell Jordan
  • Eiffel 65: Albastru

Acum, gruparea prin k-means depinde de numărul de clustere în care doriți să împărțiți participanții. Să începem cu trei clustere (mai târziu în acest capitol, vom lua în considerare alegerea lui k). Algoritmul plasează trei steaguri pe podeaua sălii de adunări într-un mod valid, așa cum se arată în Fig. 2, unde vedeți 3 steaguri inițiale distribuite pe gen și marcate cu cercuri negre.

Orez. 2. Amplasarea centrelor inițiale ale clusterelor

În gruparea k-means, dansatorii sunt legați de cel mai apropiat centru de grup, astfel încât o linie de demarcație poate fi trasată între oricare doi centre de pe podea. Astfel, dacă dansatorul se află pe o parte a liniei, el aparține unui grup, dacă este de cealaltă parte, atunci celuilalt (ca în fig. 3).

Orez. 3. Liniile marchează limitele clusterelor

Folosind aceste linii de demarcație, împărțim dansatorii în grupuri și îi colorăm corespunzător, ca în fig. 4. Această diagramă, care împarte spațiul în poligoane definite prin apropierea de unul sau altul centru de cluster, se numește diagrama Voronoi.

Orez. patru. Gruparea pe grupuri marcate cu diferite modele de fundal pe diagrama Voronoi

Să ne uităm la diviziunea noastră inițială. Ceva nu e în regulă, nu-i așa? Spațiul este împărțit într-un mod destul de ciudat: grupul din stânga jos rămâne gol, iar la limita grupului din dreapta sus, dimpotrivă, sunt mulți oameni.

Algoritmul de grupare k-means mută centrii clusterului în jurul podelei până când ajunge la cel mai bun rezultat.

Cum să determinați „cel mai bun rezultat”? Fiecare persoană prezentă se află la o anumită distanță de centrul grupului său. Cu cât distanța medie de la participanți la centrul grupului lor este mai mică, cu atât rezultatul este mai bun.

Acum introducem cuvântul „minimizare” - vă va fi foarte util în optimizarea modelului pentru o locație mai bună a centrelor cluster. În acest capitol, îl vei face pe Solver să mute centrele clusterului de nenumărate ori. Modul pe care îl folosește Solver pentru a găsi cea mai bună locație pentru centrele clusterului este de a le muta încet în mod iterativ pe suprafață, reparând cele mai bune rezultate găsite și combinându-le (literal împerechere ca caii de curse) pentru a găsi cea mai bună poziție.

Deci, dacă diagrama din fig. 4 pare destul de palid, „Căutați o soluție” poate aranja brusc centrele ca în fig. 5. Astfel, distanța medie dintre fiecare dansator și centrul său va scădea ușor.

Orez. 5. Deplasarea ușoară a centrelor

Este evident că mai devreme sau mai târziu Căutarea unei soluții își va da seama că centrele ar trebui plasate în mijlocul fiecărui grup de dansatori, așa cum se arată în fig. 6.

Orez. 6. Agrupare optimă la dansurile școlare

Excelent! Așa arată gruparea ideală. Centrele de grupare sunt situate în centrul fiecărui grup de dansatori, minimizând distanța medie dintre un dansator și cel mai apropiat centru. Acum că gruparea este gata, este timpul să trecem la partea distractivă, care încearcă să ne dăm seama ce înseamnă aceste grupuri.

Dacă cunoașteți culoarea părului dansatorilor, preferințele lor politice sau timpul în care au parcurs o sută de metri, atunci gruparea nu are prea mult sens.

Dar odată ce vă decideți să determinați vârsta și sexul celor prezenți, veți începe să vedeți câteva tendințe generale. Micul grup din partea de jos sunt persoane în vârstă, cel mai probabil însoțitoare. Grupul din stânga este format în totalitate de băieți, iar grupul din dreapta este format în totalitate de fete. Și tuturor le este foarte frică să danseze unii cu alții.

Astfel, metoda k-means v-a permis să împărțiți mulți participanți la dans în grupuri și să corelați caracteristicile fiecărui participant cu apartenența la un anumit grup pentru a înțelege motivul separării.

Acum probabil că îți spui: „Hai, ce prostie. Știam deja răspunsul înainte de a începe. Ai dreptate. În acest exemplu, da. Am dat intenționat un astfel de exemplu de „jucărie”, fiind sigur că îl poți rezolva doar privind punctele. Acțiunea se desfășoară într-un spațiu bidimensional, în care gruparea se realizează elementar cu ajutorul ochilor.

Dar ce se întâmplă dacă conduceți un magazin care vinde mii de produse? Unii cumpărători au făcut una sau două achiziții în ultimii doi ani. Alții sunt zeci. Și toată lumea a cumpărat ceva diferit.

Cum le grupezi pe un astfel de „ ring de dans”? Să începem cu faptul că acest ring de dans nu este bidimensional și nici măcar tridimensional. Acesta este un spațiu mi-dimensional al vânzării mărfurilor, în care cumpărătorul a achiziționat sau nu produsul în fiecare dimensiune. Vedeți cât de repede problema grupării începe să depășească capacitatea „globului ocular din prima categorie”, așa cum le place să spună prietenii mei militari.

Viața reală: K-Means Clustering în marketing prin e-mail

Să trecem la un caz mai concret. Sunt în email marketing, așa că voi da un exemplu din viața Mailchimp.com, unde lucrez. Același exemplu va funcționa pentru datele de vânzare cu amănuntul, datele de conversie a reclamelor, rețelele sociale etc. Interacționează cu aproape orice tip de date legate de livrarea materialelor publicitare către clienți, după care aceștia te aleg necondiționat.

Vin cu ridicata Wine Empire Joey Bag O'Donuts

Imaginați-vă pentru o clipă că locuiți în New Jersey, unde conduceți Joey Bag O'Donuts Wholesale Wine Empire. Aceasta este o afacere de import-export al cărei scop este să aducă cantități uriașe de vin din străinătate și să-l vândă la anumite magazine de băuturi alcoolice din jur. Țara. Modul în care funcționează afacerea este că Joey călătorește în toată lumea în căutarea unor oferte incredibile cu o mulțime de vin, i-l trimite în Jersey și depinde de tine să-l pui în magazine și să faci profit.

Găsiți cumpărători în multe feluri: o pagină de Facebook, un cont de Twitter, uneori chiar și prin corespondență directă - până la urmă, e-mailurile „promovează” majoritatea tipurilor de afaceri. Anul trecut, ai trimis o scrisoare pe lună. De obicei, fiecare scrisoare descrie două sau trei oferte, să zicem una cu șampanie și cealaltă cu malbec. Unele oferte sunt pur și simplu uimitoare - 80% reducere sau mai mult. Drept urmare, ați făcut aproximativ 32 de oferte într-un an și toate au mers mai mult sau mai puțin bine.

Dar doar pentru că lucrurile merg bine, nu înseamnă că nu se pot îmbunătăți. Ar fi util să înțelegem puțin mai profund motivele clienților lor. Desigur, când te uiți la o anumită comandă, vezi că un Adams a cumpărat niște spumante în iulie la o reducere de 50%, dar nu poți determina ce l-a determinat să cumpere. I-a plăcut cantitatea minimă de comandă a unei cutii de șase sticle sau prețul care nu a atins încă maximul?

Ar fi frumos să poți împărți lista de clienți în grupuri de interese. Apoi ai putea edita separat scrisorile pentru fiecare grup și, poate, ai promova și mai mult afacerea. Orice afacere potrivită pentru acest grup ar putea deveni subiectul scrisorii și poate intra în primul paragraf al textului. Acest tip de corespondență direcționată poate provoca o explozie masivă a vânzărilor!

Este posibil să lăsați computerul să facă treaba pentru dvs. Folosind gruparea k-means, puteți găsi cea mai bună grupare și apoi încercați să vă dați seama de ce este cea mai bună.

Setul de date inițial

Documentul Excel pe care îl vom analiza în acest capitol se află pe site-ul cărții. Conține toate datele originale în cazul în care doriți să lucrați cu ele. Sau poți doar să urmărești textul uitându-te la restul foilor din document.

Pentru început, aveți două surse de date interesante:

  • metadatele pentru fiecare comandă sunt stocate într-o foaie de calcul, inclusiv soiul, cantitatea minimă de vin per comandă, reducerea de vânzare cu amănuntul, dacă a fost depășit un plafon de preț și țara de origine. Aceste date sunt plasate într-o filă numită OfferInformation, așa cum se arată în Fig. 7;
  • știind ce clienți comandă ce, puteți elimina acele informații din MailChimp și le puteți trimite într-o foaie de calcul cu metadate ale ofertei în fila Tranzacții. Acestea sunt date variabile prezentate așa cum se arată în Fig. 8, foarte simplu: cumpărătorul și comanda lui.

Orez. 7. Detalii despre ultimele 32 de comenzi

Orez. opt. Lista comenzilor dupa client

Determinăm subiectul măsurătorilor

Și aici este sarcina. În problema dansurilor școlare, măsurarea distanței dintre cei prezenți și determinarea centrelor cluster nu a fost dificilă, nu? Trebuie doar să găsești ruleta potrivită! Dar ce să faci acum?

Știți că anul trecut au fost 32 de oferte de oferte și aveți o listă de 324 de comenzi într-o filă separată, defalcate pe cumpărători. Dar pentru a măsura distanța de la fiecare client la centrul cluster, trebuie să-i plasați în acest spațiu de 32 de oferte. Cu alte cuvinte, trebuie să vă dați seama ce oferte nu au făcut și să creați o matrice de oferte în funcție de client, în care fiecare client primește propria sa coloană cu 32 de celule de tranzacții, completate cu unele dacă au fost făcute oferte și cu zerouri dacă nu au făcut-o. .

Cu alte cuvinte, trebuie să luați acest tabel de tranzacții orientat pe rând și să îl transformați într-o matrice cu clienții pe verticală și ofertele pe orizontală. Tabelele pivot sunt cel mai bun mod de a le crea.

Algoritm de acțiune: pe o foaie de lucru cu date variabile, selectați coloanele A și B, apoi inserați un tabel pivot. Folosind expertul PivotTable, pur și simplu selectați oferte ca titlu de rând și cumpărători ca titlu de coloană și completați tabelul. Celula va avea 1 dacă perechea client-ofertă există și 0 dacă nu există (în acest caz, 0 este afișat ca o celulă goală). Rezultatul este tabelul prezentat în Fig. 9.

Orez. 9. Tabel pivot „client-ofertă”

Acum că aveți informațiile despre comandă într-un format matrice, copiați foaia cu informații despre oferte și denumiți-o Matrix. În această nouă foaie, lipiți valorile din tabelul pivot (nu este nevoie să copiați și să lipiți numărul ofertei, deoarece este deja în informațiile despre comandă), începând cu coloana H. Ar trebui să ajungeți cu o versiune extinsă a matricei , completat cu informații despre comandă, ca în fig. zece.

Orez. zece. Descrierea ofertei și datele comenzii fuzionate într-o singură matrice

Standardizarea datelor

În acest capitol, fiecare dimensiune a datelor dumneavoastră este reprezentată în același mod, ca informații binare despre comenzi. Dar în multe situații de grupare, nu putem face acest lucru. Imaginați-vă un scenariu în care oamenii sunt grupați în funcție de înălțime, greutate și salariu. Toate aceste trei tipuri de date au dimensiuni diferite. Înălțimea poate varia de la 1,5 la 2 metri, în timp ce greutatea - de la 50 la 150 kg.

În acest context, măsurarea distanței dintre clienți (cum ar fi între dansatori într-o sală de bal) devine o afacere confuză. Prin urmare, este obișnuit să se standardizeze fiecare coloană de date prin scăderea mediei și apoi împărțirea pe rând cu o măsură a variației numită abatere standard. Astfel, toate coloanele sunt reduse la o singură valoare, variind cantitativ în jurul valorii de 0.

Să începem cu patru grupuri

Ei bine, acum toate datele tale sunt reduse la un singur format convenabil. Pentru a începe gruparea, trebuie să alegeți k - numărul de clustere din algoritmul k-means. Adesea k-means sunt aplicate astfel: luați un set de k diferite și testați-le unul câte unul (cum să le alegeți, voi explica mai târziu), dar tocmai am început - așa că vom alege doar unul.

Veți avea nevoie de un număr de clustere care este potrivit pentru ceea ce doriți să faceți. Evident, nu intenționați să creați 50 de grupuri și să trimiteți 50 de e-mailuri promoționale direcționate către câțiva bărbați din fiecare grup. Acest lucru ne lipsește imediat exercițiul de sens. În cazul nostru, avem nevoie de ceva mic. Începeți acest exemplu cu 4 - într-o lume ideală, probabil v-ați împărți lista de clienți în 4 grupuri de înțeles de câte 25 de persoane fiecare (ceea ce este puțin probabil în realitate).

Deci, dacă trebuie să împărțiți cumpărătorii în 4 grupuri, care este cel mai bun mod de a le selecta?

În loc să stricați frumoasa foaie Matrix, copiați datele într-o foaie nouă și numiți-o 4MC. Acum puteți introduce 4 bare după prețul ridicat în barele H la K, care vor fi centrele clusterului. (Pentru a insera o coloană, faceți clic dreapta pe coloana H și selectați Lipire. Coloana va apărea în partea stângă.) Denumiți aceste grupuri de la Cluster 1 la Cluster 4. De asemenea, le puteți aplica formatare condiționată și, oricând le setați, pot vedea cât de diferiți sunt.

Foaia 4MC va apărea așa cum se arată în fig. unsprezece.

Orez. unsprezece. Centrele de grup goale plasate pe o foaie 4MC

În acest caz, toate centrele clusterului sunt zerouri. Dar din punct de vedere tehnic, ele pot fi orice și, ceea ce îți va plăcea mai ales - ca la dansurile școlare, sunt distribuite în așa fel încât să minimizeze distanța dintre fiecare cumpărător și centrul său de cluster.

Evident, atunci aceste centre vor avea valori de la 0 la 1 pentru fiecare tranzacție, deoarece toți vectorii client sunt binari.

Dar ce înseamnă „măsurarea distanței dintre centrul clusterului și cumpărător”?

Distanța euclidiană: măsurarea distanțelor drept înainte

Pentru fiecare client, aveți o coloană separată. Cum se măsoară distanța dintre ele? În geometrie, aceasta se numește „cea mai scurtă cale”, iar distanța rezultată este distanța euclidiană.

Să ne întoarcem puțin la sala de adunări și să încercăm să ne dăm seama cum să ne rezolvăm problema acolo.

Să plasăm axele de coordonate pe podea și în fig. 12 vom vedea că în punctul (8,2) avem un dansator, iar la (4,4) avem un centru de cluster. Pentru a calcula distanța euclidiană dintre ele, va trebui să vă amintiți teorema lui Pitagora, pe care o cunoașteți încă de la școală.

Orez. 12. Dansator la (8,2) și centrul grupului la (4,4)

Aceste două puncte se află la 8 - 4 = 4 metri una dintre ele pe verticală și 4 - 2 = 2 metri pe orizontală. Conform teoremei lui Pitagora, pătratul distanței dintre două puncte este 4L2 + 2L2 = 20 de metri. De aici calculăm distanța în sine, care va fi egală cu rădăcina pătrată a lui 20, care este de aproximativ 4,47 m (ca în Fig. 13).

Orez. 13. Distanța euclidiană este egală cu rădăcina pătrată a sumei distanțelor în fiecare direcție

În contextul abonaților la newsletter, aveți mai mult de două dimensiuni, dar se aplică același concept. Distanța dintre cumpărător și centrul clusterului se calculează luând diferența dintre cele două puncte pentru fiecare tranzacție, punându-le la pătrat, adunând și luând rădăcina pătrată. De exemplu, pe foaia 4MC, doriți să cunoașteți distanța euclidiană dintre centrul clusterului 1 din coloana H și comenzile clientului Adams din coloana L.

În celula L34, sub ordinele Adams, puteți calcula diferența dintre vectorul Adams și centrul clusterului, o puteți pătrata, adăugați-o și apoi luați rădăcina folosind următoarea formulă matrice (verificați referințele absolute, permițându-vă să trageți această formulă la dreapta sau în jos fără a schimba referința la centrul cluster):


(=ROOT(SUMA(L$2:L$33-$H$2:$H$33)A2)))

Ar trebui utilizată o formulă matrice (tastați formula și apăsați Ctrl+Shift+Enter sau Cmd+Retur pe MacOS, așa cum este explicat în Capitolul 1), deoarece partea (L2:L33-H2:H33)^2 trebuie să știe unde se face referire la calcularea diferențelor și pătrarea lor, pas cu pas. Cu toate acestea, rezultatul final este un singur număr, în cazul nostru 1.732 (ca în Figura 14). Are următoarea semnificație: Adams a făcut trei tranzacții, dar deoarece centrele grupului inițial sunt zerouri, răspunsul va fi egal cu rădăcina pătrată a lui 3, și anume 1,732.

Orez. paisprezece. Distanța dintre centrul clusterului 1 și Adams

În foaia de calcul din fig. În Figura 2-14, am andocat rândul de sus (vezi Capitolul 1) între coloanele G și H și am numit rândul 34 din celula G34 „Distanța până la Cluster 1”, doar pentru a vedea unde este când derulez în jos în pagină.

Distanțele și apartenența la un cluster pentru toată lumea!

Acum știți cum să calculați distanța dintre vectorul de ordine și centrul clusterului.

Este timpul să adăugați lui Adams calculul distanțelor până la centrele clusterului rămase trăgând celula L34 în jos la L37 și apoi schimbând manual referința la centrul clusterului din coloana H în coloana I, J și K în celulele de mai jos. Rezultatul ar trebui să fie următoarele 4 formule în L34:L37:

(=SQRT(SUMA((L$2:L$33-$H$2:$H$33)A2)))
(=SQRT(SUMA((L$2:L$33-$I$2:$I$33)A2)))
(=SQRT(SUMA((L$2:L$33-$J$2:$J$33)A2)))
(=SQRT(SUMA((L$2:L$33-$K$2:$K$33)A2)))
(=ROOT(SUMA((L$2:L$33-$H$2:$H$33)A2)))
(=ROOT(SUMA((L$2:L$33-$I$2:$I$33)A2)))
(=ROOT(SUMA((L$2:L$33-$J$2:$J$33)A2)))
(=ROOT(SUMA((L$2:L$33-$K$2:$K$33)A2)))

Deoarece ați folosit legături absolute pentru centrele de cluster (care este ceea ce înseamnă semnul $ în formule, așa cum sa discutat în capitolul 1), puteți trage L34:L37 în DG34:DG37 pentru a calcula distanța de la fiecare client la toate cele patru clustere. centre. Etichetați rândurile din coloana G din celulele 35 până la 37 „Distanța până la Cluster 2”, etc. Noile distanțe calculate sunt prezentate în Figura 2. cincisprezece.

Orez. cincisprezece. Calculul distanțelor de la fiecare client la toate centrele cluster

Acum știți distanța fiecărui client până la toate cele patru centre de cluster. Distribuția lor între clustere a fost făcută în funcție de cea mai scurtă distanță în doi pași, după cum urmează.

Mai întâi, să revenim la Adams în coloana L și să calculăm distanța minimă până la centrul clusterului din celula L38. E simplu:

Min (L34:L37)
=min(L34:L37)

Pentru calcul, folosim formula potrivire/căutare (pentru mai multe detalii, vezi Capitolul 1). Punând-o în L39, puteți vedea numărul de celule din intervalul L34:L37 (numărând fiecare în ordine de la 1) care se află la distanța minimă:

Potrivire(L38,L34:L37,0) =pos. căutare(L38,L34:L37,0)

În acest caz, distanța este aceeași pentru toate cele patru grupuri, astfel încât formula îl selectează pe primul (L34) și returnează 1 (Figura 16).

Orez. 16. Adăugarea de legături de cluster la foaie

De asemenea, puteți trage aceste două formule pe DG38: DG39. Pentru mai multă organizare, adăugați numele rândurilor 38 și 39 în celulele 38 și 39 din coloana G „Distanța minimă a grupului” și „Clusterul atribuit”.

Găsirea de soluții pentru centrele de cluster

Foaia dvs. de calcul a fost actualizată cu calcularea distanței și legarea grupurilor. Acum, pentru a determina cea mai bună poziție a centrelor de cluster, trebuie să găsiți astfel de valori în coloanele de la H la K care să minimizeze distanța totală dintre clienți și centrele de cluster la care sunt asociate, indicate în rândul 39 pentru fiecare client.

Când auziți cuvântul „minimizați”: începe faza de optimizare, iar optimizarea se realizează folosind „Căutare soluție”.

Pentru a utiliza Căutare pentru o soluție, veți avea nevoie de o celulă pentru rezultate, așa că în A36 vom rezuma toate distanțele dintre cumpărători și centrele lor de cluster:

SUM(L38:DG38)
=CMMA(L3 8:DG3 8)

Această sumă a distanțelor de la clienți până la cele mai apropiate centre ale acestora este exact funcția obiectivă pe care am întâlnit-o mai devreme în timpul grupării auditoriului liceului McAcne. Dar distanța euclidiană cu puterile și rădăcinile pătrate ale sale este o funcție monstruos de neliniară, așa că trebuie să utilizați un algoritm de soluție evolutivă în loc de metoda simplex.

Ați folosit deja această metodă în capitolul 1. Algoritmul simplex, dacă este posibil să-l aplice, funcționează mai rapid decât alții, dar nu poate fi folosit pentru a calcula rădăcini, pătrate și alte funcții neliniare. La fel de inutil este și OpenSolver, care folosește un algoritm simplex, chiar dacă pare să fi luat steroizi.

În cazul nostru, algoritmul evolutiv încorporat în Căutarea unei soluții folosește o combinație de căutare aleatorie și o soluție excelentă „încrucișată” pentru a găsi soluții eficiente, ca și evoluția într-un context biologic.

Aveți tot ce aveți nevoie pentru a seta sarcina înainte de „Căutați o soluție”:

  • obiectiv: reducerea la minimum a distanțelor totale de la cumpărători la centrele lor de cluster (A36);
  • variabile: vectorul fiecărei tranzacții relativ la centrul clusterului (Н2:К33);
  • condiții: centrele cluster trebuie să aibă valori între 0 și 1.

Se recomandă prezența „Căutare soluție” și a unui ciocan. Am stabilit sarcina „Căutarea unei soluții”: pentru a minimiza A36 prin modificarea valorilor lui H2:K33 cu condiția H2:K33<=1, как и все векторы сделок. Убедитесь, что переменные отмечены как положительные и выбран эволюционный алгоритм (рис. 17).

Orez. 17. Setări Solver pentru clustering în 4 centre

Dar stabilirea unui obiectiv nu este totul. Va trebui să transpirați puțin, alegând opțiunile necesare pentru algoritmul evolutiv făcând clic pe butonul „Parametri” din fereastra „Căutare soluție” și accesând fereastra de setări. Vă sfătuiesc să setați timpul maxim la încă 30 de secunde, în funcție de cât timp sunteți dispus să așteptați ca „Căutare soluții” să facă față sarcinii sale. Pe fig. 18 L-am setat pe al meu la 600 de secunde (10 minute). În acest fel, pot rula „Search for a Solution” și pot merge la prânz. Și dacă ai chef să-l avorți mai devreme, apasă Escape și ieși cu cea mai bună soluție pe care a putut-o găsi.

Orez. optsprezece. Parametrii algoritmului evolutiv

Faceți clic pe Run și urmăriți cum Excel își face treaba până când algoritmul evolutiv converge.

Sensul rezultatelor

De îndată ce „Căutați o soluție” vă oferă centrele optime de cluster, începe distracția. Să trecem la grupuri! Pe fig. În Figura 19, putem vedea că Solver a găsit distanța totală optimă de 140,7 și toate cele patru centre de cluster - datorită formatării condiționate! - arata complet diferit.

Orez. 19. Patru centre optime de cluster

Rețineți că centrele dvs. de cluster pot diferi de cele prezentate în carte, deoarece algoritmul evolutiv folosește numere aleatoare și răspunsul este diferit de fiecare dată. Clusterele pot fi complet diferite sau, mai probabil, într-o ordine diferită (de exemplu, clusterul meu 1 poate fi foarte aproape de clusterul dvs. 4 etc.).

Deoarece ați inserat descrieri comerciale în coloanele B până la G când ați creat foaia, acum puteți citi detaliile din Fig. 19, care este important pentru înțelegerea ideii de centre de cluster.

Pentru grupul 1 din coloana H, formatarea condiționată selectează ofertele 24, 26, 17 și, într-o măsură mai mică, 2. Citind descrierile acestor oferte, puteți vedea ce au toate în comun: toate au fost făcute pe Pinot Noir.

Privind la coloana I, puteți vedea că toate celulele verzi au un număr minim scăzut. Aceștia sunt cumpărători care nu doresc să cumpere loturi uriașe în timpul tranzacției.

Dar celelalte două centre de cluster, sincer vorbind, sunt greu de interpretat. Ce zici, în loc să interpretezi centrele de cluster, să te uiți la cumpărătorii înșiși din cluster și să stabilești ce fel de oferte le plac? Acest lucru ar putea aduce claritate problemei.

Evaluarea ofertelor prin metoda clusterului

În loc să aflăm ce distanțe față de care centru cluster sunt mai aproape de 1, să verificăm cine este legat de ce cluster și ce oferte preferă.

Pentru a face acest lucru, să începem prin a copia fișa cu informații despre oferte. Să numim copiei 4MS - TopDealsByCluster. Numerotați coloanele de la H la K pe această nouă foaie de la 1 la 4 (ca în Figura 20).

Orez. douăzeci. Crearea unei foi de tabel pentru calcularea popularității ofertelor folosind clustere

Pe foaia 4MC, aveai ancore de cluster de la 1 la 4 pe rândul 39. Tot ce trebuie să faci pentru a număra ofertele în funcție de cluster este să te uiți la numele coloanelor de la H la K pe foaia 4MC - TopDealsByCluster, vezi ce fișă de lucru a fost 4MS legate de acest grup în rândul 39 și apoi a adăugat numărul tranzacțiilor lor din fiecare rând. Astfel, vom obține numărul total de cumpărători din acest cluster care au făcut tranzacții.

Să începem cu celula H2, care conține numărul de cumpărători ai clusterului 1 care au acceptat oferta nr. 1 și anume malbec-ul din ianuarie. Trebuie să adăugați valorile celulelor din intervalul L2: DG2 pe o foaie 4MC, dar numai clienții din 1 cluster, care este un exemplu clasic de utilizare a formulei sumif / sumif. Arata cam asa:

SUMIF("4MC"!$L$39:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)
=CyMMEOra("4MC"!$L$39:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)

Această formulă funcționează astfel: îi furnizați niște valori condiționate, pe care le verifică în prima parte a „4MC”!$L$39:$DG$39,"4MC, apoi o compară cu 1 din antetul coloanei ("4MC - TopDealsByCluster"! H$1 ) și apoi, pentru fiecare meci, adaugă acea valoare la rândul 2 din a treia parte a formulei „4MC”!$L2:$DG2.

Rețineți că ați folosit referințe absolute ($ în formulă) înainte de orice legătură cu legarea clusterului, numărul rândului din titlurile coloanei și litera coloanei pentru tranzacțiile finalizate. Făcând aceste legături absolute, puteți trage formula oriunde din H2:K33 pentru a calcula numărul de oferte pentru alte centre de cluster și combinații de oferte, ca în Figura 2. 21. Pentru a face aceste coloane mai lizibile, le puteți aplica și formatare condiționată.

Orez. 21. Numărul total de oferte per ofertă, defalcat pe cluster

Selectând coloanele de la A la K și aplicând filtrarea automată, puteți sorta aceste date. Sortând coloana H de la cel mai mic la cel mai mare, veți vedea care tranzacții sunt cele mai populare în grupul 1 (Fig. 22).

Orez. 22. Sortare cluster 1. Pinot, Pinot, Pinot!

După cum am menționat mai devreme, cele mai mari patru tranzacții pentru acest cluster sunt pinos. Acești tipi abuzează în mod clar de filmul Sideways. Dacă sortați grupul 2, atunci vă va deveni destul de clar că aceștia sunt mici cumpărători angro (Fig. 23).

Dar când sortați clusterul 3, nu este atât de ușor să înțelegeți nimic. Ofertele mari pot fi numărate pe degete, iar diferența dintre ele și restul nu este atât de evidentă. Cu toate acestea, cele mai populare oferte au încă ceva în comun - reduceri destul de bune, 5 din cele 6 cele mai mari oferte sunt pentru vin spumant, iar Franța este producător pentru 3 din 4 dintre ele. Cu toate acestea, aceste ipoteze sunt ambigue.

În ceea ce privește grupul 4, acestor băieți evident le-a plăcut oferta din august pentru șampanie din anumite motive. De asemenea, 5 din cele 6 mari tranzacții sunt pentru vinul francez, iar 9 din cele 10 cele mai mari tranzacții sunt pentru un volum mare de mărfuri. Poate că acesta este un grup mare angro care gravitează spre vinurile franceze? Intersecția clusterelor 3 și 4 este, de asemenea, îngrijorătoare.