วิธีการและเครื่องมือสำหรับการแบ่งส่วนผู้บริโภค ทบทวนวิธีการวิเคราะห์คลัสเตอร์และการประเมินการบังคับใช้สำหรับการแก้ปัญหาการแบ่งส่วนตลาดผู้บริโภค ผลลัพธ์ของการแบ่งส่วนโดยใช้วิธีการปรับขนาดหลายมิติ

วิธีการแบ่งกลุ่ม

วิธีการแบ่งส่วน "พื้นฐาน" บางวิธีสามารถแยกแยะได้ ที่สำคัญที่สุดคือการวิเคราะห์กลุ่มผู้บริโภค (อนุกรมวิธาน) กลุ่มผู้บริโภคเกิดขึ้นจากการจัดกลุ่มผู้ที่ให้คำตอบที่คล้ายคลึงกันสำหรับคำถามที่ถาม ผู้ซื้อสามารถจัดกลุ่มได้หากพวกเขาอายุ รายได้ นิสัย ฯลฯ ใกล้เคียงกัน ความคล้ายคลึงกันระหว่างผู้ซื้อขึ้นอยู่กับการวัดที่แตกต่างกัน แต่ผลรวมถ่วงน้ำหนักของความแตกต่างยกกำลังสองระหว่างการตอบคำถามของผู้ซื้อต่อคำถามมักใช้เป็นตัวชี้วัดความคล้ายคลึงกัน ผลลัพธ์ของอัลกอริธึมการจัดกลุ่มสามารถเป็นแผนผังลำดับชั้นหรือการรวมกลุ่มของผู้บริโภคออกเป็นกลุ่มๆ มีอัลกอริธึมคลัสเตอร์จำนวนมากพอสมควร

ตัวอย่างเช่น ในสหรัฐอเมริกา มีการใช้การวิเคราะห์คลัสเตอร์ของระบบที่เรียกว่า PRIZM อย่างกว้างขวาง , ซึ่งเริ่มจัดกลุ่มโดยลดชุดตัวชี้วัดทางสังคมและประชากรที่เป็นไปได้ 1,000 รายการ ระบบนี้สร้างกลุ่มทางสังคมและประชากรสำหรับอาณาเขตทั้งหมดของสหรัฐอเมริกา ดังนั้นคลัสเตอร์ 28 จึงถูกแยกออก - ครอบครัวที่ตกอยู่ในคลัสเตอร์นี้รวมถึงบุคคลที่ประสบความสำเร็จในอาชีพการงานหรือการบริหารงานมากที่สุด กลุ่มนี้ยังสะท้อนรายได้สูง การศึกษา ทรัพย์สิน และอายุเฉลี่ยโดยประมาณ แม้ว่าคลัสเตอร์นี้จะมีประชากรเพียง 7% ของประชากรสหรัฐฯ แต่ก็มีความสำคัญสำหรับผู้ประกอบการที่ขายผลิตภัณฑ์ระดับไฮเอนด์


มีตัวอย่างอื่นๆ ของการแบ่งส่วนผู้บริโภคตามการวิเคราะห์คลัสเตอร์ ตัวอย่างเช่น ในกลุ่ม "จิตวิทยา" สถานที่ที่สำคัญมากคือ "ทัศนคติของผู้บริโภคต่อความแปลกใหม่ของผลิตภัณฑ์" (รูปที่ 3)

รูปที่ 3

ดังจะเห็นได้จากข้อมูลข้างต้น ผู้บริโภคจำนวนมากที่สุดหมายถึงจำนวนผู้ซื้อทั่วไป

การแบ่งส่วนผู้บริโภคตามการวิเคราะห์คลัสเตอร์เป็นวิธี "คลาสสิก" ในเวลาเดียวกัน มีเทคนิคในการแบ่งส่วนตลาดตามสิ่งที่เรียกว่า "การแบ่งส่วนผลิตภัณฑ์" หรือการแบ่งส่วนตลาดตามพารามิเตอร์ของผลิตภัณฑ์ เป็นสิ่งสำคัญอย่างยิ่งในการผลิตและการตลาดของผลิตภัณฑ์ใหม่ สิ่งที่สำคัญเป็นพิเศษคือการแบ่งกลุ่มตามผลิตภัณฑ์ โดยอิงจากการศึกษาแนวโน้มของตลาดในระยะยาว กระบวนการของการพัฒนาและการผลิตผลิตภัณฑ์ใหม่ การเสร็จสิ้นโครงการการลงทุนขนาดใหญ่ต้องใช้เวลาค่อนข้างนาน และความถูกต้องของผลการวิเคราะห์ตลาดและการประเมินความสามารถของมันเป็นสิ่งสำคัญอย่างยิ่งที่นี่ ในสภาพการทำงานในตลาดดั้งเดิมของผลิตภัณฑ์มาตรฐาน การคำนวณกำลังการผลิตสามารถทำได้โดยใช้วิธีการรวมของตลาด ในสภาพสมัยใหม่ เพื่อเพิ่มความสามารถในการแข่งขันและกำหนดความสามารถของตลาดได้อย่างถูกต้อง ไม่เพียงพออีกต่อไปสำหรับองค์กรที่จะแบ่งกลุ่มตลาดในทิศทางเดียว - คำจำกัดความของกลุ่มผู้บริโภคตามเกณฑ์บางอย่าง ภายในกรอบของการตลาดแบบบูรณาการ ยังจำเป็นต้องแบ่งกลุ่มผลิตภัณฑ์ตามพารามิเตอร์ที่สำคัญที่สุดสำหรับการโปรโมตในตลาด เพื่อการนี้ วิธีการคอมไพล์ การ์ดการทำงาน- ดำเนินการแบ่งส่วนสองครั้งตามผลิตภัณฑ์และผู้บริโภค

แผนที่การทำงาน" อาจเป็นปัจจัยเดียว (การแบ่งกลุ่มจะดำเนินการตามปัจจัยหนึ่งและสำหรับกลุ่มผลิตภัณฑ์ที่เป็นเนื้อเดียวกัน) และหลายปัจจัย (การวิเคราะห์ว่ากลุ่มผู้บริโภคใดที่รูปแบบผลิตภัณฑ์เฉพาะมีไว้สำหรับและพารามิเตอร์ใดที่สำคัญที่สุดสำหรับการส่งเสริม ผลิตภัณฑ์ในตลาด) โดยการรวบรวมการ์ดการทำงาน คุณสามารถกำหนดได้ว่าผลิตภัณฑ์ใดได้รับการออกแบบสำหรับส่วนตลาดใด พารามิเตอร์การทำงานใดที่สอดคล้องกับความต้องการของผู้บริโภคบางอย่าง

ในการพัฒนาผลิตภัณฑ์ใหม่ เทคนิคนี้ถือว่าควรคำนึงถึงปัจจัยทั้งหมดที่สะท้อนถึงระบบความชอบของผู้บริโภค และในขณะเดียวกันก็ควรคำนึงถึงพารามิเตอร์ทางเทคนิคของผลิตภัณฑ์ใหม่ ซึ่งสามารถตอบสนองความต้องการของผู้บริโภคได้ มีการกำหนดกลุ่มผู้บริโภค โดยแต่ละกลุ่มมีชุดคำขอและความชอบของตนเอง ปัจจัยที่เลือกทั้งหมดจะถูกจัดลำดับตามระดับความสำคัญของแต่ละกลุ่มผู้บริโภค

แนวทางนี้ช่วยให้คุณเห็นในขั้นตอนการพัฒนาว่าพารามิเตอร์ของผลิตภัณฑ์ต้องปรับปรุงการออกแบบอย่างไร หรือพิจารณาว่ามีตลาดที่เพียงพอสำหรับโมเดลนี้หรือไม่

ให้เรายกตัวอย่างของการวิเคราะห์ตลาดที่เกี่ยวข้องกับโครงการคอมพิวเตอร์ภายใต้การพัฒนา "Apple" (ตารางที่ 1) (ดูหน้าถัดไป)

ตารางที่ 1." การแบ่งส่วนตลาดคอมพิวเตอร์ส่วนบุคคลและปัจจัยที่นำมาพิจารณาในการพัฒนาผลิตภัณฑ์สำหรับมัน (1982) "

ปัจจัย ส่วนแบ่งตลาดตามกลุ่มผู้บริโภค แบบอย่าง
บ้าน ที่โรงเรียน ที่มหาวิทยาลัย ไปที่บ้าน. สำนักงาน ในธุรกิจขนาดเล็ก ในบริษัท แต่ ใน
ข้อกำหนดทางเทคนิค * * *** ** ** ** *** **
ราคา *** *** ** *** *** ** 0 **
คุณสมบัติพิเศษ * * ** * * * ** *
ความน่าเชื่อถือ ** * * ** ** * 0 **
สะดวกในการใช้ ** ** * ** * 0 *** ***
ความเข้ากันได้ 0 0 0 0 0 *** 0 0
อุปกรณ์ต่อพ่วง 0 0 0 0 0 *** 0 0
ซอฟต์แวร์ * * ** ** ** *** * **

***เป็นปัจจัยที่สำคัญมาก

** - ปัจจัยสำคัญ

* - ปัจจัยที่ไม่สำคัญ

0 - ปัจจัยเล็กน้อย

การวิเคราะห์อย่างง่ายนี้แสดงให้เห็นว่ารุ่น A เป็นคอมพิวเตอร์ที่ไม่มีตลาด และรุ่น B เป็นผลิตภัณฑ์ที่เหมาะสมที่สุดสำหรับมหาวิทยาลัยและธุรกิจขนาดเล็ก

บริษัทเคยเดิมพันคอมพิวเตอร์ A แล้วแพ้

โดยทั่วไป ในทางปฏิบัติของโลก มีการใช้แนวทางพื้นฐาน 2 วิธีในการแบ่งส่วนการตลาด - (ดู: รูปแบบทั่วไปของการวิเคราะห์กลุ่ม (รูปที่ 4)) (หน้าถัดไป)



ภายในวิธีแรก เรียกว่า "ลำดับความสำคัญ" สัญญาณของการแบ่งส่วน จำนวนส่วน จำนวน ลักษณะ แผนที่ของความสนใจเป็นที่รู้จัก กล่าวคือ สันนิษฐานว่ากลุ่มเซ็กเมนต์ในวิธีนี้ได้เกิดขึ้นแล้ว วิธี "จัดลำดับความสำคัญ" ใช้ในกรณีที่การแบ่งส่วนไม่ได้เป็นส่วนหนึ่งของการศึกษาในปัจจุบัน แต่ทำหน้าที่เป็นพื้นฐานเสริมสำหรับการแก้ปัญหาทางการตลาดอื่นๆ บางครั้ง วิธีนี้จะใช้เมื่อมีการกำหนดส่วนตลาดอย่างชัดเจน เมื่อความแปรปรวนของกลุ่มตลาดไม่สูง "ไพรเออรี่" ยังเป็นที่ยอมรับในการสร้างผลิตภัณฑ์ใหม่ที่เน้นกลุ่มตลาดที่เป็นที่รู้จัก

ภายในกรอบของวิธีที่สอง เรียกว่า "เฉพาะกิจ (ตามคลัสเตอร์)" ความไม่แน่นอนของสัญญาณของการแบ่งส่วนและสาระสำคัญของส่วนต่างๆ เอง นักวิจัยจะเลือกตัวแปรจำนวนหนึ่งซึ่งโต้ตอบกับ ผู้ตอบแบบสอบถาม (วิธีการเกี่ยวข้องกับการทำแบบสำรวจ) และจากนั้น ขึ้นอยู่กับทัศนคติที่ระบุไว้ต่อตัวแปรบางกลุ่ม ผู้ตอบแบบสอบถามอยู่ในกลุ่มที่เกี่ยวข้อง ในขณะที่แผนที่ความสนใจที่ระบุในการวิเคราะห์ที่ตามมาถือเป็นวิธีรอง วิธีการนี้จะใช้เมื่อ การแบ่งกลุ่มตลาดผู้บริโภค โครงสร้างส่วนงานที่ไม่ได้กำหนดไว้ในส่วนที่เกี่ยวข้องกับผลิตภัณฑ์ที่ขาย

แบ่งตามวิธี " ลำดับความสำคัญ "

เมื่อเลือกจำนวนเซ็กเมนต์ที่ควรแบ่งตลาด พวกเขามักจะถูกชี้นำโดยฟังก์ชันวัตถุประสงค์ - กำหนดเซ็กเมนต์ที่มีแนวโน้มมากที่สุด เห็นได้ชัดว่า เมื่อสร้างตัวอย่าง ไม่จำเป็นต้องรวมกลุ่มเข้าไปด้วย ซึ่งมีศักยภาพในการซื้อค่อนข้างน้อยเมื่อเทียบกับผลิตภัณฑ์ที่อยู่ระหว่างการศึกษา ตามการศึกษาแสดงให้เห็นว่าจำนวนกลุ่มไม่ควรเกิน 10 ส่วนส่วนเกินมักเกี่ยวข้องกับรายละเอียดที่มากเกินไปของคุณลักษณะการแบ่งส่วนและนำไปสู่การ "เบลอ" ของคุณลักษณะโดยไม่จำเป็น

ตัวอย่างเช่น เมื่อแบ่งตามระดับรายได้ ขอแนะนำให้แบ่งผู้ซื้อที่มีศักยภาพทั้งหมดออกเป็นส่วนๆ ที่มีปริมาณเท่ากัน โดยคำนึงถึงปริมาณของแต่ละส่วนอย่างน้อยไม่น้อยกว่าปริมาณการขายบริการโดยประมาณตาม ความรู้เกี่ยวกับกำลังการผลิตขององค์กร ตัวอย่างที่ประสบความสำเร็จมากที่สุดที่อธิบายข้างต้นและแสดงให้เห็นถึงความเป็นไปได้ในการแบ่งผู้บริโภคที่มีศักยภาพออกเป็นกลุ่มส่วนที่มีความเสถียร คือ การแบ่งส่วนประชากรตามรายได้ เมื่อประชากรทั้งหมดถูกแบ่งออกเป็นกลุ่ม 20% ห้ากลุ่ม การกระจายรายได้ที่นำเสนอสำหรับกลุ่มประชากร 20% ห้ากลุ่มจะได้รับเป็นประจำในการรวบรวมและรายงานทางสถิติ คล้ายกับที่แสดงในตาราง 2

ตารางที่ 2 ."การกระจายรายได้ตามกลุ่มประชากร %"

ความสะดวกในการทำงานกับกลุ่มเซ็กเมนต์ดังกล่าวนั้นชัดเจน โดยเฉพาะอย่างยิ่งในแง่ของการติดตามความสามารถ

10 มีนาคม 2558

การเข้าสู่ตลาดใด ๆ ด้วยผลิตภัณฑ์ - ผู้บริโภค, อุตสาหกรรม - ผู้ผลิตต้องเข้าใจว่าเขาไม่สามารถให้บริการลูกค้าทั้งหมดได้แม้จะมีกำลังการผลิตที่เพียงพอ ท้ายที่สุดแล้ว ผู้ซื้อใช้ผลิตภัณฑ์นี้ในรูปแบบต่างๆ และที่สำคัญที่สุดคือพวกเขาซื้อโดยได้รับคำแนะนำจากแรงจูงใจต่างๆ ดังนั้นฉันจึงมักจะแยกย่อยผู้ซื้อ (การแบ่งส่วน) ตามแรงจูงใจเหล่านี้และลักษณะอื่น ๆ และหลังจากนั้น - ข้อเสนอของสินค้าที่ผลิตด้วยการพิจารณาสูงสุดของลักษณะเหล่านี้ ไม่มีการพูดเกินจริงที่จะกล่าวว่าแนวทางในอุดมคติในการวางแผนกิจกรรมทางการตลาดจากมุมมองของการตอบสนองความต้องการของผู้บริโภคนั้น ถือได้ว่าเป็นการปรับผลิตภัณฑ์และบริการให้เข้ากับความต้องการของผู้บริโภคแต่ละราย

จนถึงปี 1960 ทฤษฎีและแนวปฏิบัติของธุรกิจถูกครอบงำด้วยการปฐมนิเทศไปสู่ตลาดมวลชนโดยรวม สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่าผู้ผลิตสามารถผลิตสินค้าจำนวนมากและประหยัดจากขนาดได้ โดยมุ่งเน้นไปที่ตลาดทั่วไปที่ไม่กระจาย แต่ตั้งแต่ยุค 60 แนวโน้มความต้องการในการแยกแยะความต้องการเฉพาะของผู้บริโภคซึ่งสะท้อนให้เห็นในการแบ่งส่วนตลาดการขายเริ่มมีความแข็งแกร่ง

ในสภาวะที่ทันสมัยของการแข่งขันที่เพิ่มขึ้นในตลาดการขาย ปัญหาความจำเป็นในการเพิ่มความสามารถในการแข่งขันของผลิตภัณฑ์อุตสาหกรรมในประเทศในตลาดภายในประเทศและต่างประเทศได้เกิดขึ้นจริง ภายใต้เงื่อนไขเหล่านี้ ประเด็นสำคัญคือการค้นหาสำรองเพื่อลดต้นทุนเป็นพื้นฐานทางเศรษฐกิจของราคาและกำไร เป็นผลให้ผู้ประกอบการอุตสาหกรรมจำนวนมากกำลังดำเนินตามกลยุทธ์ต้นทุนต่ำโดยมุ่งเน้นไปที่วิธีการต่าง ๆ ของการดำเนินการ: การปฏิเสธบริการที่เกี่ยวข้องที่มีราคาแพง ประหยัดต้นทุนโดยการสร้างแบบจำลองสินค้าที่มีราคาถูกกว่าการผลิตและอื่นๆ แต่ต้นทุนโดยตรงส่วนใหญ่จะถูกกำหนดโดยเทคโนโลยีการผลิต ระดับการบรรทุกของผู้ผลิตสินค้าโภคภัณฑ์ระดับองค์กร และความเป็นไปได้ในการลดต้นทุนการจัดการโดยการปรับปรุงประสิทธิภาพในการจัดการพื้นที่การทำงานขององค์กรยังคงใช้งานไม่ได้

เครื่องมือที่ทันสมัยอย่างหนึ่งคือการลดต้นทุนการจัดการและเพิ่มคุณภาพของการจัดการ ซึ่งสามารถตีความได้ว่าเป็นความถูกต้องของการคาดการณ์กำไร ความสามารถในการทำกำไรสำหรับแต่ละคลัสเตอร์ (กลุ่มผู้ประกอบการอุตสาหกรรมประเภทเดียวกันของกิจกรรมทางเศรษฐกิจ) เปรียบเทียบ กับสถานการณ์เริ่มต้นหรือความถูกต้องของการคาดการณ์ความสามารถในการทำกำไรของพื้นที่หน้าที่ของกิจกรรมเหล่านี้ องค์กรคือ การวิเคราะห์แบบกลุ่ม

ความสำคัญของการแบ่งส่วนเป็นเครื่องมือทางการตลาดที่มีประสิทธิภาพอธิบายได้จากคุณลักษณะต่อไปนี้:

ü การแบ่งส่วนเป็นวิธีที่มีประสิทธิภาพสูงในการแข่งขัน เนื่องจากเน้นที่การระบุและตอบสนองความต้องการเฉพาะของผู้บริโภค
ü มุ่งเน้นกิจกรรมของบริษัทในตลาดเฉพาะ โดยเฉพาะอย่างยิ่งสำหรับบริษัทที่เริ่มกิจกรรมทางการตลาด
ü การแบ่งส่วนตลาดช่วยให้กำหนดทิศทางการตลาดของบริษัทได้อย่างสมเหตุสมผลมากขึ้น
ü ด้วยความช่วยเหลือของการแบ่งส่วน มันเป็นไปได้ที่จะกำหนดเป้าหมายทางการตลาดที่เป็นจริง
ü การแบ่งส่วนตลาดที่ประสบความสำเร็จส่งผลต่อประสิทธิผลของการตลาดโดยรวม ตั้งแต่การวิจัยตลาดและผู้บริโภคไปจนถึงการสร้างระบบการขายและการส่งเสริมการขายที่เหมาะสม

ในทฤษฎีการตลาด แนวคิด TP -การตลาด . มันถูกสร้างขึ้นจากตัวย่อของตัวอักษรตัวแรกของคำภาษาอังกฤษการแบ่งส่วน(การแบ่งส่วน)การกำหนดเป้าหมาย(เลือกตลาดเป้าหมาย) และการวางตำแหน่ง(การวางตำแหน่ง). TP -การตลาด เป็นหัวใจสำคัญของการตลาดเชิงกลยุทธ์สมัยใหม่

การแบ่งส่วนตลาด - นี่คือการแบ่งผู้บริโภคออกเป็นกลุ่มตามความแตกต่างในความต้องการ ลักษณะหรือพฤติกรรม และการพัฒนาสำหรับแต่ละกลุ่มของส่วนประสมทางการตลาดที่แยกจากกัน

ส่วนตลาด ประกอบด้วยผู้บริโภคตอบสนองในลักษณะเดียวกันกับสิ่งจูงใจทางการตลาดชุดเดียวกัน

1. การแบ่งส่วนตลาด- ขั้นตอนการจัดสรรผู้บริโภคแต่ละกลุ่มภายในตลาดร่วม
2. การเลือกตลาดเป้าหมาย- ในกลุ่มตลาดที่เลือก กลุ่มเป้าหมายจะถูกเลือก กล่าวคือ กลุ่มที่บริษัทเน้นกิจกรรม
3. การวางตำแหน่ง- การระบุผลิตภัณฑ์ของบริษัทในกลุ่มผลิตภัณฑ์อนาล็อก

เป้าหมายสูงสุดของการแบ่งกลุ่มตลาดเป้าหมายคือการเลือกเซ็กเมนต์ (หรือเซ็กเมนต์) ของผู้บริโภค ความพึงพอใจของความต้องการในกิจกรรมของบริษัทจะมุ่งเน้น
นักการตลาดเชื่อว่าการจัดสรรส่วนตลาดที่ถูกต้องนั้นเป็นความสำเร็จในเชิงพาณิชย์เพียงครึ่งเดียว กฎหมายพาเรโต (กฎหมาย 80:20).

วิธีการแบ่งส่วนตลาด:

วิธีการก่อน;

· วิธีการคลัสเตอร์;

· วิธีการแบ่งส่วนแบบยืดหยุ่น

· วิธีการแบ่งส่วนส่วนประกอบ

ที่ วิธีการลำดับความสำคัญสมมติฐานการแบ่งส่วนตลาดถูกหยิบยกขึ้นมาก่อนแล้วจึงทดสอบในหลักสูตรการวิจัยการตลาด ดังนั้นวิธีนี้จึงเรียกว่า Priori คือ ไม่มีประสบการณ์ วิธีการแบ่งส่วนตลาดนี้เป็นวิธีที่ใช้กันมากที่สุด เนื่องจากมีความเรียบง่าย ความพร้อมใช้งานของวิธีการที่นำไปใช้ได้จริง และต้นทุนในการดำเนินการต่ำ

วิธีการคลัสเตอร์แสดงว่าโครงสร้างตลาดไม่เป็นที่รู้จัก พวกเขาไม่ได้กำหนดตัวแปรตาม แต่มองหากลุ่มธรรมชาติที่พบในฐานข้อมูลของผู้บริโภคที่ได้รับจากการวิจัยตลาด ในกรณีนี้ ผู้ตอบแบบสำรวจจะถูกจัดกลุ่มจากกลุ่มผู้บริโภคที่มีศักยภาพก่อนโดยใช้ขั้นตอนการวิเคราะห์พิเศษออกเป็นกลุ่มตามธรรมชาติ - ส่วนตลาด หลังจากนั้นจะมีการกำหนดตัวแปรด้วยความช่วยเหลือซึ่งจะสามารถกำหนดส่วนตลาดอย่างเป็นทางการได้

เมื่อเปรียบเทียบกับการแบ่งส่วนก่อน เมื่อกำหนดส่วนโดยตัวแปรโดยประมาณในช่วงเริ่มต้นของการศึกษา และด้วยการแบ่งส่วนคลัสเตอร์ เมื่อส่วนที่เลือกเกิดขึ้นจากผลการวิเคราะห์กลุ่ม ตัวแบบ การแบ่งส่วนแบบยืดหยุ่นเสนอแนวทางการแก้ปัญหาแบบไดนามิก ด้วยวิธีการนี้ จะสามารถพัฒนาและทดสอบกลุ่มต่างๆ ได้จำนวนมาก โดยแต่ละส่วนรวมถึงผู้บริโภคหรือองค์กรที่มีการรับรู้ที่คล้ายคลึงกันของผลิตภัณฑ์ "รุ่นทดลอง" ใหม่ (ระบุโดยการกำหนดค่าของคุณลักษณะเฉพาะของผลิตภัณฑ์) การแบ่งส่วนแบบยืดหยุ่นรวมผลลัพธ์ของการวิเคราะห์แบบคู่และแบบจำลองคอมพิวเตอร์ของพฤติกรรมผู้บริโภคเมื่อเลือกผลิตภัณฑ์

การแบ่งส่วนส่วนประกอบเปลี่ยนจุดเน้นของการแบ่งส่วนตลาดเป็นลักษณะบุคลิกภาพ (อธิบายโดยชุดของลักษณะทางประชากรศาสตร์และจิตวิทยา) ที่จะเข้ากับคุณลักษณะของผลิตภัณฑ์ได้ดีขึ้น ในการแบ่งส่วนตามองค์ประกอบ ผู้วิจัยมีความสนใจในการเปรียบเทียบพารามิเตอร์ของมูลค่าของผลิตภัณฑ์และลักษณะต่างๆ ของผู้ตอบแบบสอบถาม เมื่อกำหนดพารามิเตอร์ทั้งสองชุดนี้แล้ว ผู้วิจัยสามารถให้คำแนะนำสำหรับการพัฒนาคุณสมบัติของผลิตภัณฑ์ที่เป็นไปได้สำหรับผู้บริโภคทุกประเภท

กระบวนการแบ่งส่วนตลาด

กระบวนการแบ่งส่วนเกิดขึ้นในแปดขั้นตอน

กลยุทธ์การครอบคลุมตลาด
ขั้นตอนแรกคือการเลือกวิธีการแบ่งส่วน

ขั้นตอนที่สองคือการตรวจสอบความเป็นเนื้อเดียวกันของกลุ่มคือ เราตรวจสอบว่าปฏิกิริยาของผู้บริโภคต่อผลิตภัณฑ์ในกลุ่มนี้เหมือนกันหรือไม่

ขั้นตอนที่สามคือการตรวจสอบระดับความแตกต่างของกลุ่มคือ เราตรวจสอบจำนวนผลิตภัณฑ์ที่มีการคำนวณและความหลากหลายของสินค้าที่องค์กรนำเสนอ

ขั้นตอนที่สี่คือการประเมินระดับการเข้าถึงได้ของเซ็กเมนต์เช่น จำเป็นต้องประเมินว่าองค์กรมีช่องทางการขายผลิตภัณฑ์เพียงพอหรือไม่ ปริมาณงานของช่องทางเหล่านี้คือเท่าใด องค์กรสามารถรับประกันการขายผลิตภัณฑ์ทั้งหมดได้หรือไม่ ไม่ว่าจะเป็นระบบสำหรับการส่งมอบผลิตภัณฑ์ไปยัง ผู้บริโภคมีความน่าเชื่อถือเพียงพอ

ขั้นตอนที่ห้าคือการตรวจสอบระดับการทำกำไรของกลุ่มคือ ราคาที่เป็นไปได้ของผลิตภัณฑ์เมื่อทำงานในส่วนนี้และกำหนดต้นทุนโดยคำนึงถึงการปรับตัวของผลิตภัณฑ์สำหรับส่วนนี้ (ความสามารถในการทำกำไร ≈ ความสามารถในการทำกำไร)

ขั้นตอนที่หกคือการประเมินความเสถียรของส่วนงาน

ขั้นตอนที่เจ็ดคือการเลือกกลุ่มเป้าหมาย

ขั้นตอนที่แปดคือกลยุทธ์ความครอบคลุมตลาด

การประเมินความน่าดึงดูดใจของเซ็กเมนต์และแนวคิดของตลาดเป้าหมาย

ความน่าดึงดูดใจของส่วนการตลาดถูกกำหนดตามเกณฑ์ที่แต่ละบริษัทกำหนดอย่างอิสระ

เกณฑ์บางข้อไม่ได้มีความสำคัญเท่าเทียมกัน ดังนั้นจึงต้องพิจารณาเกณฑ์แต่ละข้อแยกกัน จุดประสงค์ของการวิเคราะห์ความน่าดึงดูดใจคือการคำนวณนัยสำคัญแบบถ่วงน้ำหนักของเกณฑ์ที่กำหนดลักษณะ "ความน่าดึงดูดใจ" ของผลิตภัณฑ์หนึ่งๆ

ตลาดเป้าหมายคือกลุ่มตลาดที่เหมาะสมและทำกำไรได้มากที่สุด (หรือส่วนเดียว) สำหรับองค์กรที่ดำเนินกิจกรรม

บริษัทควรส่งเสริมความแตกต่างของผลิตภัณฑ์ที่ดึงดูดตลาดเป้าหมายมากที่สุด

ในการประเมินส่วนตลาด พิจารณาปัจจัยสองประการ: (1) ความน่าดึงดูดใจโดยรวม และ (2) เป้าหมายและทรัพยากรของบริษัทที่กำลังพัฒนา


เกณฑ์การประเมินความน่าดึงดูดใจของตลาดเป้าหมาย

1. ขนาด (ความจุ) ของตลาด - ภายใต้ความสามารถของตลาดสินค้าโภคภัณฑ์เป็นที่เข้าใจกันว่าปริมาณการขายสินค้าที่เป็นไปได้ (ผลิตภัณฑ์เฉพาะขององค์กร) ในระดับและอัตราส่วนของราคาที่แตกต่างกัน ความสามารถของตลาดมีลักษณะตามขนาดของความต้องการของประชากรและขนาดของอุปทานสินค้าโภคภัณฑ์

2. ที่ตั้งทางภูมิศาสตร์

3. ยอดขายที่แท้จริงและศักยภาพ
ปริมาณการขายจริง - จำนวนสินค้าและบริการที่องค์กรสามารถขายได้จริงภายใต้เงื่อนไขการดำเนินงานที่มีอยู่ ต้นทุนการโฆษณาโดยประมาณและระดับราคาที่ตั้งใจจะสร้าง

ปริมาณการขายที่เป็นไปได้ (ข้อเสนอ) - ส่วนแบ่งของตลาดที่มีศักยภาพที่องค์กรหวังว่าจะครอบครองและตามจำนวนสินค้าสูงสุดที่สามารถวางใจได้สำหรับการขายด้วยความสามารถ

4. ระดับที่แท้จริงและศักยภาพและความเข้มข้นของการแข่งขัน

ความสามารถที่แท้จริงและศักยภาพของบริษัทในการออกแบบ ผลิต และทำการตลาดผลิตภัณฑ์ที่มีความน่าสนใจในแง่ของราคาและปัจจัยที่ไม่ใช่ราคามากกว่าผลิตภัณฑ์ของคู่แข่ง

ความเข้มข้นของการแข่งขันและระดับความสามารถในการแข่งขันของบริษัทจะถูกกำหนดโดยศักยภาพของตลาด ความสะดวกในการเข้า; ประเภทของสินค้า ความสม่ำเสมอของตลาด โครงสร้างอุตสาหกรรมหรือตำแหน่งการแข่งขันของบริษัท โอกาสในการสร้างสรรค์นวัตกรรมทางเทคโนโลยี เป็นต้น

5. ความเป็นไปได้ในการครอบคลุมตลาด

จำนวนร้านค้าและศูนย์ที่มีศักยภาพที่จะจำหน่ายผลิตภัณฑ์

6. ต้นทุนการส่งเสริมการขายที่แท้จริงและอาจเกิดขึ้น

7. ระยะของวัฏจักรชีวิตของตลาด - เช่น การพัฒนาผลิตภัณฑ์ ระยะการนำไปปฏิบัติ ระยะการพัฒนา (การเติบโต) ระยะวุฒิภาวะ หรือระยะการตกต่ำ

8. แนวโน้มตลาด กล่าวคือ ทิศทางการพัฒนา แนวโน้ม

9. ข้อกำหนดเพิ่มเติมของผู้บริโภคสำหรับผลิตภัณฑ์

10. ระดับราคาที่แท้จริงและศักยภาพ

11. ความคาดหวังของผู้บริโภคและการตอบสนองที่แท้จริงต่อความพยายามทางการตลาดของผลิตภัณฑ์

SMEs ควรระบุและเลือกปัจจัยความสำเร็จที่สำคัญสองถึงสามประการจากการวิเคราะห์ความน่าดึงดูดใจของแต่ละกลุ่มตลาด ปัจจัยความสำเร็จที่สำคัญจะเป็น "คำขวัญ" ของบริษัท และจะต้องจดจำไว้เสมอ เป็นสถานการณ์ที่สำคัญที่สุดที่ต้องหรือไม่ต้องเกิดขึ้นเพื่อให้บริษัทประสบความสำเร็จในตลาดผลิตภัณฑ์เฉพาะ

กลยุทธ์การครอบคลุมตลาด

เมื่อทำการแบ่งส่วนเสร็จสิ้นแล้ว บริษัทต้องกำหนดว่าส่วนใดที่จะกำหนดเป้าหมายกิจกรรม ตามระดับความครอบคลุมของตลาด กลยุทธ์สามประเภทที่เป็นไปได้:

1. ส่วนงานเดียว (การตลาดแบบเข้มข้น)

บริษัทมุ่งเน้นไปที่ส่วนแบ่งขนาดใหญ่ของตลาดย่อยอย่างน้อยหนึ่งแห่ง ตัวอย่างเช่น โฟล์คสวาเก้นได้เน้นความพยายามในตลาดรถยนต์ขนาดเล็ก ด้วยการตลาดแบบเข้มข้น บริษัทสามารถรักษาตำแหน่งทางการตลาดที่แข็งแกร่งในเซ็กเมนต์ที่ให้บริการได้ เนื่องจากทราบความต้องการของเซ็กเมนต์เหล่านั้นดีกว่าใครๆ และมีชื่อเสียงในระดับหนึ่ง นอกจากนี้ จากความเชี่ยวชาญด้านมาตรการการผลิต การจัดจำหน่ายและการส่งเสริมการขาย บริษัทสามารถประสบความสำเร็จทางเศรษฐกิจในหลายด้านของกิจกรรม อย่างไรก็ตาม กลยุทธ์นี้เกี่ยวข้องกับระดับความเสี่ยงที่เพิ่มขึ้น: กลุ่มที่เลือกอาจไม่ตรงตามความคาดหวัง ในเรื่องนี้ หลายบริษัทเลือกที่จะกระจายกิจกรรมของตน ครอบคลุมกลุ่มตลาดต่างๆ

แนวทางนี้บางครั้งเรียกว่า "กลยุทธ์เฉพาะ" เพราะ ซึ่งมักจะทำด้วยทรัพยากรที่จำกัด

2. หลายส่วน (การตลาดส่วนต่าง)

บริษัทจำนวนมากขึ้นกำลังใช้กลยุทธ์นี้

ด้วยการนำเสนอผลิตภัณฑ์ที่หลากหลาย บริษัทหวังที่จะบรรลุการเติบโตของยอดขายและการเจาะลึกเข้าไปในแต่ละกลุ่มตลาด เธอคาดหวังว่าการเสริมความแข็งแกร่งให้กับตำแหน่งในตลาดหลายกลุ่ม เธอจะสามารถระบุตัวตนของผู้บริโภคถึงบริษัทที่มีหมวดหมู่ผลิตภัณฑ์นี้ได้ นอกจากนี้ เธอคาดว่าการซื้อซ้ำจะเพิ่มขึ้น เนื่องจากเป็นผลิตภัณฑ์ของบริษัทที่สอดคล้องกับความต้องการของผู้บริโภค ไม่ใช่ในทางกลับกัน

3. ครอบคลุมตลาดทั้งหมด (การตลาดไม่แตกต่าง)

ผู้เชี่ยวชาญด้านการตลาดส่วนใหญ่เชื่อว่ากลยุทธ์นี้มีขอบเขตจำกัด

ในกรณีนี้ บริษัทไม่ได้เน้นว่าความต้องการของลูกค้าแตกต่างกันอย่างไร แต่เน้นที่ความต้องการเหล่านี้เหมือนกัน พัฒนาผลิตภัณฑ์และโปรแกรมการตลาดที่จะดึงดูดลูกค้าให้ได้มากที่สุด ขึ้นอยู่กับวิธีการกระจายมวลชนและการโฆษณาจำนวนมาก มุ่งมั่นที่จะให้ผลิตภัณฑ์มีภาพลักษณ์ที่เหนือกว่าในจิตใจของผู้คน ตัวอย่างของการตลาดที่ไม่แตกต่างกัน เราสามารถอ้างถึงการดำเนินการของบริษัท Krasny Oktyabr ซึ่งเมื่อหลายปีก่อนได้เสนอแบรนด์ช็อกโกแลตสำหรับทุกคน

การตลาดที่ไม่แตกต่างนั้นประหยัด ต้นทุนในการผลิตสินค้า การรักษาสินค้าคงคลัง และการขนส่งสินค้านั้นต่ำ ค่าใช้จ่ายในการโฆษณาที่มีการตลาดที่ไม่แตกต่างกันนั้นยังอยู่ในระดับต่ำอีกด้วย การขาดความจำเป็นในการวิจัยการตลาดของกลุ่มตลาดและการวางแผนที่แยกย่อยตามกลุ่มเหล่านี้จะช่วยลดต้นทุนของการวิจัยการตลาดและการจัดการผลิตภัณฑ์

แนวความคิดของการวางตำแหน่ง

การวางตำแหน่งเป็นกระบวนการในการหาตำแหน่งทางการตลาดให้กับบริษัท ผลิตภัณฑ์ หรือบริการที่จะแยกแยะ (เขา) ออกจากตำแหน่งของคู่แข่ง การวางตำแหน่งดำเนินการโดยคำนึงถึงกลุ่มเป้าหมายเฉพาะของผู้บริโภคซึ่งสร้างและนำเสนอข้อดีและเอกลักษณ์ หากไม่มีความคิดที่ชัดเจนว่าตำแหน่งนี้มุ่งเป้าไปที่อะไร เป็นเรื่องยากมาก แม้กระทั่งแทบจะเป็นไปไม่ได้เลยที่จะจัดการตัดสินใจทางการตลาดให้สอดคล้องกัน คำจำกัดความของตำแหน่งที่แข่งขันได้มักจะกำหนดชุดเครื่องมือทางการตลาดที่มีประสิทธิภาพสูงสุด
โดยสรุปเราสามารถพูดได้ว่า การวางตำแหน่งเป็นกลยุทธ์ทางการตลาดเพื่อสร้างความสัมพันธ์ที่แน่นแฟ้นของแบรนด์ของคุณ (ผลิตภัณฑ์หรือบริษัท) กับการเชื่อมโยงบางอย่างหรือดีกว่าด้วยผลประโยชน์

ดังนั้นการจัดตำแหน่งจึงเกี่ยวข้องกับ:
- การสร้างในหัวของผู้บริโภคของสมาคมที่มั่นคงของผลิตภัณฑ์หรือ บริษัท ที่มีสถานที่บางแห่งในตลาด
- รักษาสมาคม (ตำแหน่งที่เลือก) ในระยะยาว

ตำแหน่งของสินค้าในตลาดสถานที่ที่ผลิตภัณฑ์กำหนดอยู่ในใจของผู้บริโภคเมื่อเปรียบเทียบกับผลิตภัณฑ์คู่แข่งที่คล้ายกันจากมุมมองของผู้บริโภค
กลยุทธ์การวางตำแหน่งเป็นชุดของมาตรการที่มุ่งถ่ายทอดแนวคิดการวางตำแหน่งให้ผู้บริโภค ตำแหน่งมีอยู่ในใจของผู้บริโภคเท่านั้น
- กลยุทธ์การนำเสนอสินค้า (บริการ)
- กลยุทธ์การกำหนดราคา
- กลยุทธ์การกระจายสินค้า
- กลยุทธ์ส่งเสริมสินค้า (บริการ)
ข้อจำกัดตำแหน่ง
- ตลาดเป้าหมาย
- คู่แข่งที่แท้จริงและมีศักยภาพ
- กลยุทธ์ของบริษัท

เปลี่ยนตำแหน่ง- การเปลี่ยนแปลงตำแหน่งของผลิตภัณฑ์หรือบริการในด้านการตลาดและการโฆษณา เมื่อได้รับภาพใหม่ กลุ่มเป้าหมายอื่นจะถูกกำหนด การโต้แย้งสำหรับข้อมูลการขายและการโฆษณา การเปลี่ยนแปลงบรรจุภัณฑ์ ฯลฯ
เหตุผลในการปรับตำแหน่ง:
- ตำแหน่งที่น่าสงสัย
- การวางตำแหน่งต่ำ
- การวางตำแหน่งไม่ชัดเจน
- ตำแหน่งที่ไร้ประโยชน์
- การวางตำแหน่งมากเกินไป

ที่อยู่อาศัย ฯลฯ จากนี้น่าจะชัดเจนว่าส่วนตลาดคือ

มีผู้บริโภคกลุ่มหนึ่งที่มีพฤติกรรมเหมือนกันในตลาด

ในทางกลับกัน การแบ่งส่วนตลาดจะแบ่งออกเป็นหลายขั้นตอน

  • 2. ทางเลือกของกลุ่มตลาดอยู่ที่การประเมินแต่ละส่วนในแง่ของความน่าดึงดูดใจ (ความสามารถในการนำผลลัพธ์ที่ต้องการมาสู่องค์กร) ตามการประมาณการเหล่านี้ เลือกส่วนงาน (หรือส่วนงาน) ที่น่าสนใจที่สุด
  • 3. สุดท้าย ขั้นตอนที่สามคือการวางตำแหน่งผลิตภัณฑ์ หลังจากเลือกส่วนตลาดแล้ว จำเป็นต้องคิดว่าผลิตภัณฑ์ที่บริษัทนำเสนอในตลาดจะถูกนำเสนอในตลาดอย่างไร นอกจากนี้ ต้องพัฒนาส่วนประสมทางการตลาดโดยละเอียดด้วย เป็นงานเหล่านี้ที่ได้รับการแก้ไขในขั้นตอนนี้

ในด้านการตลาด มีการระบุคุณลักษณะหลายอย่างที่สามารถปรับปรุงประสิทธิภาพของการแบ่งส่วนได้ สัญญาณเหล่านี้ไม่เกี่ยวกับผู้บริโภค แต่เป็นกลุ่มเอง

  • 1. ส่วนจะต้องมีความหมาย ซึ่งหมายความว่าแอตทริบิวต์ที่รองรับการแบ่งส่วนอย่างน้อยต้องปรับเปลี่ยนตามพฤติกรรมผู้บริโภคอย่างน้อยในระดับหนึ่ง ดังนั้นการมีน้ำหนักเกินจึงมีความสำคัญในแง่ของปริมาณขนมปังที่บริโภค หรือมีปัญหาในการซื้อเสื้อผ้าหรือไม่ อย่างไรก็ตาม สัญลักษณ์นี้ไม่น่าจะมีความสำคัญกับเครื่องสำอางที่เขาใช้
  • 2. ส่วนตลาดต้องมีขนาดใหญ่พอที่จะสามารถสร้างผลกำไรที่จำเป็นสำหรับความสำเร็จของบริษัท หากส่วนนี้เล็กเกินไปจากมุมมองนี้ การพัฒนาและการใช้งานโปรแกรมการตลาดที่เน้นไปที่ส่วนนั้นก็ไม่สมเหตุสมผล
  • 3. ส่วนจะต้องสามารถวัดได้ ซึ่งหมายความว่าคุณลักษณะที่รองรับการแบ่งส่วนจะต้องให้ความเป็นไปได้ของการแยกกลุ่มผู้บริโภคออกจากกลุ่มอื่นๆ อย่างชัดเจนและชัดเจน อายุเป็นตัวอย่างของคุณลักษณะที่วัดได้ เราสามารถแบ่งผู้บริโภคทั้งหมดออกเป็นกลุ่มๆ ได้โดยง่าย ขึ้นอยู่กับค่าที่ตัวแปรนี้ใช้

ตัวอย่างของคุณลักษณะที่ไม่สามารถวัดผลได้อย่างเต็มที่ก็อาจเป็นได้เช่นกัน ความถี่ของการบริโภคผลิตภัณฑ์ ความชอบของผู้บริโภคในบางกรณีอาจแปรผันอย่างมาก สัญญาณที่น่าเชื่อถือกว่ามากจากมุมมองนี้คือความภักดีต่อตราสินค้า แม้ว่าผู้บริโภคจะซื้อสินค้าไม่บ่อยนัก เขาจะเลือกแบรนด์เดียวเสมอโดยปฏิเสธแบรนด์อื่นทั้งหมด

ในที่นี้ควรพิจารณาด้วยว่าผู้ให้สัมภาษณ์มีความจริงใจในการตอบคำถามของผู้วิจัยหรือไม่ จากมุมมองนี้ สัญญาณของประเภทของรสนิยมทางเพศจะวัดได้ไม่ดี แม้ว่าระดับความอดทนของสังคมของเราที่มีต่อชนกลุ่มน้อยทางเพศจะเพิ่มขึ้นอย่างต่อเนื่อง (และนี่เป็นสัญญาณของสังคมที่พัฒนาอย่างเพียงพอ) ไม่ใช่ตัวแทนของชนกลุ่มน้อยเหล่านี้ทุกคนจะกล้าประกาศรสนิยมทางเพศอย่างเปิดเผย

3. กลุ่มต้องสามารถเข้าถึงได้ คุณภาพนี้ไม่เพียงหมายความถึงความสามารถในการเข้าถึงเพื่อการวิจัยเท่านั้น แต่ยังรวมถึงความพร้อมใช้งานของข้อมูลเพิ่มเติมด้วย หากองค์กรสามารถคาดหวังให้สามารถมีอิทธิพลต่อเซ็กเมนต์กระตุกด้วยวิธีการที่มีอยู่แล้วประเมินผลกระทบโดยการเปรียบเทียบสถานะเริ่มต้นกับสถานะหลังการกระทบ ถือว่าเซ็กเมนต์สามารถเข้าถึงได้ เป็นที่ชัดเจนว่าสิ่งนี้เป็นไปได้ก็ต่อเมื่อมีการเข้าถึงข้อมูลเท่านั้น

ในแนวทางปฏิบัติทางการตลาด วิธีแบ่งส่วนข้อมูลมักใช้บ่อยที่สุด 3 วิธี ได้แก่ การจัดกลุ่ม การแบ่งส่วนตามลำดับหลายตัวแปรด้วยตัวแปรตาม และการวิเคราะห์คลัสเตอร์ รายการนี้ไม่ได้หมดวิธีการแบ่งส่วนที่เป็นไปได้ทั้งหมด แต่ก็เพียงพอแล้วที่จะเข้าใจแนวคิดทั่วไปของขั้นตอนนี้และความซับซ้อนที่เกี่ยวข้อง

1. วิธีที่ง่ายที่สุดในการแบ่งส่วนคือการแบ่งตลาดออกเป็นกลุ่มๆ ตามธรรมเนียมในด้านการตลาดและสังคมวิทยาตามคุณลักษณะที่ระบุไว้ข้างต้น ในกรณีนี้ สันนิษฐานง่ายๆ ว่ากลุ่มผู้บริโภคซึ่งระบุโดยอิงตามลักษณะเช่น เพศ อายุ หรืออาชีพ มีลักษณะเป็นชุดความต้องการและพฤติกรรมที่เป็นมาตรฐานอย่างเป็นธรรม

วิธีนี้เหมาะสมที่สุดในกรณีของการเลือกกิจกรรมใหม่ เช่น ในกรณีที่บริษัทเพิ่งเริ่มดำเนินการในตลาดหรือตัดสินใจเข้าสู่ตลาดใหม่

ข้อเสียของวิธีการแบ่งกลุ่มนี้คือขึ้นอยู่กับสมมติฐานและสมมติฐาน การแบ่งกลุ่มผู้บริโภคตามอายุ เพศ อาชีพ ระดับรายได้ หรือสถานะทางสังคมเป็นประเพณีสำหรับการวิจัยการตลาด แต่ไม่ชัดเจนเลยสักนิดว่าตัวแปรเหล่านี้เกี่ยวข้องกับกระบวนการของผู้บริโภคที่ "เสร็จสิ้น" กล่าวอีกนัยหนึ่ง เป็นไปไม่ได้เสมอที่จะยืนยันว่ากิจกรรมของผู้บริโภคขึ้นอยู่กับอายุโดยตรง ตัวอย่างเช่น ดังนั้น โดยการใช้การแบ่งส่วนดังกล่าว นักการตลาดจะเลือกเหตุผลที่มีน้ำหนักไม่เพียงพอสำหรับการเลือกกลุ่มตามอำเภอใจ

เมื่อแบ่งกลุ่มตลาด พึงระลึกไว้เสมอว่าคุณลักษณะที่อยู่ภายใต้การจัดสรรของกลุ่มบางกลุ่มมีความสำคัญต่างกัน ในอีกด้านหนึ่ง เราสามารถพูดคุยเกี่ยวกับสัญญาณที่เกี่ยวข้องโดยตรงกับเป้าหมายขององค์กร สัญญาณดังกล่าวจะเป็นเช่นความเต็มใจที่จะซื้อผลิตภัณฑ์ใหม่ที่มีคุณสมบัติบางอย่างบนพื้นฐานนี้เราสามารถแยกแยะกลุ่มผู้บริโภคที่พร้อมจะทำเช่นนี้และกลุ่มผู้บริโภคที่ไม่ พร้อมสำหรับสิ่งนี้

เนื่องจากองค์กรมีความสนใจในการขายสินค้า พารามิเตอร์นี้จึงเกี่ยวข้องโดยตรงกับเป้าหมายของตน ในทางกลับกัน มีพารามิเตอร์ที่มีนัยสำคัญน้อยกว่าที่ไม่เกี่ยวข้องอย่างใกล้ชิดกับเป้าหมายขององค์กร ตัวอย่างของลักษณะดังกล่าวจะเป็นอายุ ดังนั้นผลิตภัณฑ์นี้หรือผลิตภัณฑ์นั้นจึงเหมาะสำหรับกลุ่มอายุของคนหลังจาก 30 ปี แต่ไม่ได้หมายความว่าทุกคนที่อายุเกินสามสิบจะซื้อสินค้านี้ ดังนั้น อายุที่เป็นพารามิเตอร์การแบ่งส่วนจึงมีความเกี่ยวข้องน้อยกว่ากับเป้าหมายในทันทีขององค์กร

หากปัจจัยที่มีนัยสำคัญจริงๆ มีจำนวนมาก สามารถลดลงได้โดยใช้การวิเคราะห์ปัจจัยที่เรียกว่า มันเกี่ยวข้องกับการเลือกกลุ่มของคุณสมบัติที่เกี่ยวข้อง (พารามิเตอร์) ซึ่งรวมเป็นคุณสมบัติเดียว ตัวอย่างเช่น ระดับของรายได้สัมพันธ์อย่างใกล้ชิดกับขนาดของบ้าน การมีรถ จำนวนการเดินทางท่องเที่ยว การเยี่ยมชมสถานประกอบการ เช่น ร้านอาหารและคลับ ดังนั้นสัญญาณเหล่านี้จึงสามารถรวมเป็นหนึ่งเดียวได้

ขอแนะนำให้ตั้งชื่อคุณลักษณะนี้ ในกรณีของเรา เราอาจเรียกคุณลักษณะใหม่นี้ว่า "จำนวนเงินรายได้" แต่ตีความอย่างกว้างๆ ไม่ใช่แค่เป็นจำนวนเงินที่บุคคลได้รับในหนึ่งเดือนหรือหนึ่งปี ในทำนองเดียวกัน เราสามารถเชื่อมโยงระดับรายได้ อาชีพและการศึกษา ระดับรายได้และความชอบทางการเมือง เป็นต้น

2. การแบ่งส่วนตามลำดับหลายตัวแปรพร้อมตัวแปรตามจะเหมาะสมที่สุดเมื่อบริษัทมีประสบการณ์ในตลาดอยู่แล้ว ในกรณีนี้ การแบ่งส่วนมีวัตถุประสงค์เพื่อระบุส่วนตลาดที่ต้องการมากที่สุดในแง่ของผลลัพธ์ที่มีอยู่แล้ว

เนื่องจากผลลัพธ์หลักที่บริษัทมุ่งหมายคือการดึงกำไรสูงสุด ในกรณีนี้ รายได้ของบริษัทสามารถเลือกเป็นตัวแปรตาม การแบ่งส่วนเบื้องต้นมุ่งเป้าไปที่แง่มุมนี้: จำเป็นต้องระบุกลุ่มผู้บริโภคที่ทำให้เขามีรายได้สูงสุดจากมุมมองขององค์กร

เป็นที่ชัดเจนว่า ขีดจำกัดของรายได้โดยทั่วไปถูกกำหนดโดยอัตนัย และแสดงถึงการประนีประนอมระหว่างสถานการณ์จริงกับสถานการณ์ที่ต้องการ การแยกความแตกต่างได้ตามเงื่อนไข ตัวอย่างเช่น ผู้บริโภคที่มีรายได้มาก ผู้บริโภคที่มีรายได้เฉลี่ย (ที่น่าพอใจ) และผู้บริโภคที่มีรายได้น้อยเกินไป

ขั้นตอนที่สองของการแบ่งส่วนคือการระบุตัวแปรที่สอง ซึ่งเกี่ยวข้องอย่างใกล้ชิดกับตัวแปรแรกมากที่สุด ตัวแปรนี้มักจะเป็น:

  • ก) ความถี่ในการใช้ผลิตภัณฑ์หรือบริการที่จำหน่ายโดยบริษัท
  • b) ระดับรายได้ที่ผู้บริโภคนำมาสู่บริษัท
  • c) ความภักดีของผู้บริโภคต่อแบรนด์ ตัวอย่างเช่น ในการวิจัยการตลาด พบว่าคนอายุ 25-33 ปีนำรายได้สูงสุดมาสู่บริษัท ดังนั้นผู้บริโภคทั้งหมดควรแบ่งออกเป็นสามกลุ่ม: 1) มากถึง 25 ปี; 2) ตั้งแต่ 25 ถึง 33 ปี และ 3) มากกว่า 33 ปี

เมื่อใช้วิธีนี้ เฉพาะส่วนที่ทำกำไรได้มากที่สุดของตลาดเท่านั้นที่จะถูกแบ่งส่วนเพิ่มเติม ในกรณีของเรา นี่คือหมวดหมู่ของผู้บริโภคที่มีอายุระหว่าง 25 ถึง 33 ปี ในขั้นตอนต่อมา จะพบฐานสำหรับการแบ่งส่วนอีกครั้ง ซึ่งเกี่ยวข้องกับระดับการทำกำไรมากที่สุด

ขีด จำกัด การหารในกรณีนี้คือส่วนซึ่งต้องมีคุณสมบัติดังต่อไปนี้:

  • 1) ผู้บริโภคที่เป็นเจ้าของบริษัทนำรายได้สูงสุดมาสู่บริษัท (เช่น รายได้ที่บริษัทได้รับในส่วนนี้ซึ่งคิดเป็นสัดส่วนเพียง 20% ของตลาดคือ 70% ของรายได้ทั้งหมด)
  • 2) ส่วนจะต้องไม่เข้าใจอย่างสมบูรณ์
  • 3) ต้องมีขนาดใหญ่พอที่จะลงทุนในการพัฒนาเพิ่มเติม
  • 4) การแบ่งส่วนเพิ่มเติมควรเป็นไปไม่ได้ (นี่คือคุณลักษณะที่ต้องการ)

ข้อดีของวิธีการแบ่งกลุ่มนี้คือขึ้นอยู่กับตัวแปรที่สำคัญที่สุด วิธีนี้มีข้อเสียเช่นกัน ประการแรก ไม่ได้คำนึงถึงปฏิสัมพันธ์ระหว่างตัวแปรต่างๆ นอกจากนี้ กลุ่มที่ได้รับการจัดสรรอย่างรวดเร็วด้วยความช่วยเหลือกลับกลายเป็นกลุ่มที่เล็กเกินไป ในขณะเดียวกัน โดยทั่วไป วิธีนี้ค่อนข้างจะได้ผล

เมื่อใช้งาน คุณจะเห็นได้ว่าส่วนใดเป็นที่นิยมมากที่สุด อันไหนเป็นได้ และอันไหนควรละทิ้งไปเลย โดยเฉพาะอย่างยิ่ง การใช้วิธีนี้ทำให้สามารถกำหนดงานที่เหมือนจริงมากได้ เช่น การเพิ่มรายได้ที่ได้รับจากผู้บริโภคกลุ่มใดกลุ่มหนึ่ง สุดท้ายนี้จะช่วยให้คุณระบุจุดอ่อนในกิจกรรมของบริษัทได้

3. ไม่เหมือนกับวิธีการแบ่งส่วนสองวิธีก่อนหน้านี้ ซึ่งนักการตลาดเริ่มการวิเคราะห์ตลาดกับประชากรทั้งหมดของผู้บริโภค และค่อยๆ แบ่งพวกเขาออกเป็นกลุ่มๆ ด้วยการวิเคราะห์แบบกลุ่ม ทิศทางจะกลับกัน: การวิเคราะห์เริ่มต้นด้วยผู้บริโภคแต่ละราย ด้วยเหตุนี้ การวิเคราะห์คลัสเตอร์จึงกำหนดให้นักการตลาดต้องมีข้อมูลเกี่ยวกับผู้บริโภคจริงจำนวนมากเพียงพอ ตามกฎแล้ว จำนวนของพวกเขาควรมีอย่างน้อย 200 คน

การวิเคราะห์คลัสเตอร์ประกอบด้วยหลายขั้นตอน

  • 1) ขั้นแรก นักการตลาดจะสุ่มเลือกผู้บริโภครายหนึ่งและเริ่มมองหาอีกรายที่จะคล้ายกับเขามากที่สุดในแง่ของพารามิเตอร์ที่ทราบ เมื่อพบผู้บริโภค 2 รายดังกล่าว จะรวมกันเป็นกลุ่ม คลัสเตอร์อื่นๆ มีการระบุในลักษณะเดียวกัน
  • 2) ขั้นตอนต่อไปคือการรวมผู้บริโภคแต่ละรายและกลุ่มผู้บริโภคเข้าเป็นชุมชนที่กว้างขึ้น พึงระลึกไว้เสมอว่าทั้งผู้บริโภครายบุคคลหรือคลัสเตอร์ที่จัดสรรแล้ว ตลอดจนผู้บริโภคและคลัสเตอร์ สามารถรวมกันเป็นกลุ่มได้ การควบรวมกิจการจะดำเนินการจนกว่าจะได้จำนวนคลัสเตอร์ที่น่าพอใจมากหรือน้อยนั่นคือเซ็กเมนต์ที่สอดคล้องกับผลประโยชน์ขององค์กรในแง่ของปริมาณ
  • 3) การควบคุมความถูกต้องของการจัดสรรคลัสเตอร์คือการที่นักการตลาดดำเนินการแบ่งส่วนเป็นครั้งที่สอง และตรวจสอบว่าสามารถแบ่งส่วนเดียวกันได้หรือไม่โดยใช้มาตรการความคล้ายคลึงกันอื่นๆ ผลลัพธ์ของการแบ่งส่วนหลักและส่วนควบคุมตามการวิเคราะห์คลัสเตอร์จะถูกเปรียบเทียบ หลังจากนั้นจึงทำการปรับปรุงกับการแบ่งส่วนหลัก

ข้อได้เปรียบที่ไม่อาจปฏิเสธได้ของวิธีนี้คือช่วยให้คุณสามารถเริ่มต้นจากข้อมูลเฉพาะเกี่ยวกับผู้บริโภคได้ นักการตลาดที่ใช้วิธีนี้มีโอกาสน้อยที่จะเลือกพารามิเตอร์การแบ่งกลุ่มซึ่งอันที่จริงแล้วมีมูลค่าเพียงเล็กน้อย

ข้อเสียของวิธีนี้คือเมื่อใช้งานจะสามารถเลือกคลัสเตอร์ที่ไม่มีอยู่จริงได้ ซึ่งหมายความว่ากลุ่มผู้บริโภคที่ได้รับจะไม่มีลักษณะพฤติกรรมแบบเดียวกัน นั่นคือเหตุผลที่ขั้นตอนการควบคุมต่างๆ ควรเป็นส่วนบังคับของการวิเคราะห์คลัสเตอร์

ตำแหน่งผลิตภัณฑ์ในตลาดเป็นทิศทางของกิจกรรมทางการตลาดสำหรับการเลือกตลาดเป้าหมาย ซึ่งเกี่ยวข้องกับการวิเคราะห์องค์ประกอบของส่วนประสมทางการตลาดและตำแหน่งผลิตภัณฑ์ในกลุ่มตลาดที่เลือก เพื่อระบุพารามิเตอร์เหล่านั้นที่นำไปสู่การได้เปรียบในการแข่งขัน

หากองค์กรทั้งหมดผลิตผลิตภัณฑ์เดียวกันที่มีลักษณะเหมือนกัน ใช้วิธีการเดียวกันในการส่งเสริมและส่งมอบผลิตภัณฑ์ และให้บริการที่คล้ายคลึงกัน สำหรับผู้บริโภค สิ่งเหล่านี้จะเหมือนกันทั้งหมด

ในขณะเดียวกันก็เป็นสิ่งสำคัญที่จะต้องคำนึงถึงตำแหน่งที่ผลิตภัณฑ์อยู่ในตลาดในปัจจุบัน ตำแหน่งของผลิตภัณฑ์คือความคิดเห็นของผู้บริโภคเกี่ยวกับพารามิเตอร์ที่สำคัญที่สุดของผลิตภัณฑ์ บ่งบอกถึงสถานที่ที่ครอบครองโดยผลิตภัณฑ์เฉพาะในใจของผู้บริโภคที่สัมพันธ์กับผลิตภัณฑ์ของคู่แข่ง ซึ่งแตกต่างจากภาพของผลิตภัณฑ์ซึ่งมีลักษณะทางอารมณ์มากกว่า ตำแหน่งของผลิตภัณฑ์จะถูกสร้างขึ้นตามกฎบนพื้นฐานของพารามิเตอร์ที่วัดในเชิงปริมาณ (ส่วนแบ่งการตลาด คุณลักษณะของผลิตภัณฑ์ ราคา ฯลฯ)

  • การเลือกส่วนตลาดเกี่ยวข้องกับขั้นตอนบางอย่าง ซึ่งประกอบด้วยสามขั้นตอน
  • การแบ่งส่วนตลาดในความหมายที่แคบของมันเอง - การจัดสรรกลุ่มผู้บริโภคที่แตกต่างกันในความต้องการ ความสามารถทางการเงิน นิสัย

ฉันทำงานในอุตสาหกรรมการตลาดผ่านอีเมลสำหรับไซต์ชื่อ MailChimp.com เราช่วยลูกค้าสร้างจดหมายข่าวสำหรับผู้ชมโฆษณา ทุกครั้งที่มีคนเรียกงานของเราว่า "การบรรจุจดหมาย" ฉันรู้สึกหนาวสั่นในใจ

ทำไม? ใช่ เพราะที่อยู่อีเมลไม่ใช่กล่องดำที่คุณทิ้งระเบิดด้วยข้อความเช่นระเบิดอีกต่อไป ไม่ ในการทำการตลาดผ่านอีเมล (เช่นเดียวกับรูปแบบการติดต่อทางออนไลน์อื่น ๆ รวมถึงทวีต โพสต์บน Facebook และแคมเปญ Pinterest) ธุรกิจจะได้รับข้อมูลเชิงลึกเกี่ยวกับวิธีการที่ผู้ชมทำการติดต่อในระดับบุคคลผ่านการติดตามการคลิก คำสั่งซื้อออนไลน์ การกระจายสถานะในโซเชียล เครือข่าย ฯลฯ ข้อมูลนี้ไม่ได้เป็นเพียงการรบกวน พวกเขาแสดงลักษณะผู้ชมของคุณ แต่สำหรับผู้ที่ไม่ได้ฝึกหัด การดำเนินการเหล่านี้คล้ายกับภูมิปัญญาของภาษากรีก หรือภาษาเอสเปรันโต

คุณรวบรวมข้อมูลการทำธุรกรรมจากลูกค้าของคุณ (ผู้ใช้ สมาชิก ฯลฯ) และใช้ข้อมูลของพวกเขาเพื่อทำความเข้าใจผู้ชมของคุณให้ดีขึ้นได้อย่างไร เมื่อคุณต้องติดต่อกับผู้คนจำนวนมาก เป็นการยากที่จะศึกษาลูกค้าแต่ละรายโดยเฉพาะอย่างยิ่งหากพวกเขาทั้งหมดติดต่อคุณในรูปแบบที่แตกต่างกัน แม้ว่าในทางทฤษฎีคุณสามารถติดต่อกับทุกคนเป็นการส่วนตัวได้ แต่ในทางปฏิบัติสิ่งนี้แทบจะเป็นไปไม่ได้เลย

คุณต้องใช้ฐานลูกค้าและค้นหาจุดกึ่งกลางระหว่างการสุ่มทิ้งระเบิดและการตลาดส่วนบุคคลสำหรับลูกค้าแต่ละราย วิธีหนึ่งในการบรรลุความสมดุลนี้คือการใช้คลัสเตอร์เพื่อแบ่งกลุ่มตลาดลูกค้าของคุณ เพื่อให้คุณสามารถเข้าถึงกลุ่มต่างๆ ของฐานลูกค้าของคุณด้วยเนื้อหาที่ตรงเป้าหมาย ข้อเสนอ ฯลฯ

การวิเคราะห์คลัสเตอร์คือการรวบรวมออบเจ็กต์ต่างๆ และการแบ่งอ็อบเจ็กต์ออกเป็นกลุ่มๆ ด้วยการทำงานร่วมกับกลุ่มเหล่านี้—กำหนดสิ่งที่สมาชิกของพวกเขามีเหมือนกันและสิ่งที่ทำให้พวกเขาแตกต่าง—คุณสามารถเรียนรู้มากมายเกี่ยวกับชุดข้อมูลยุ่งที่คุณมี ความรู้นี้จะช่วยให้คุณตัดสินใจได้ดีขึ้นและละเอียดขึ้นกว่าเดิม

ในบริบทนี้ การทำคลัสเตอร์เรียกว่าการทำเหมืองข้อมูลเชิงสำรวจ เนื่องจากเทคนิคเหล่านี้ช่วยให้คุณ "ดึง" ข้อมูลเกี่ยวกับความสัมพันธ์ในชุดข้อมูลขนาดใหญ่ที่คุณไม่สามารถมองเห็นได้ และการค้นพบความเชื่อมโยงในกลุ่มสังคมก็มีประโยชน์ในทุกอุตสาหกรรม ไม่ว่าจะเป็นการแนะนำภาพยนตร์ตามนิสัยของผู้ชมเป้าหมาย เพื่อระบุศูนย์กลางอาชญากรของเมือง หรือเพื่อพิสูจน์การลงทุนทางการเงิน

การใช้คลัสเตอร์ที่ฉันโปรดปรานอย่างหนึ่งคือการทำคลัสเตอร์รูปภาพ: การซ้อนไฟล์รูปภาพที่ "เหมือนกัน" กับคอมพิวเตอร์ ตัวอย่างเช่น ในบริการโฮสต์รูปภาพ เช่น Flickr ผู้ใช้สร้างเนื้อหาจำนวนมาก และการนำทางอย่างง่ายจะเป็นไปไม่ได้เนื่องจากมีรูปภาพจำนวนมาก แต่ด้วยเทคนิคการจัดกลุ่ม คุณจะรวมรูปภาพที่คล้ายกันเข้าด้วยกันได้ ทำให้ผู้ใช้นำทางไปมาระหว่างกลุ่มเหล่านี้ได้ก่อนที่จะทำการจัดเรียงแบบละเอียด

แมชชีนเลิร์นนิงภายใต้การดูแลหรือไม่มีผู้ดูแล

ในการทำเหมืองข้อมูลเชิงสำรวจ ตามคำจำกัดความ คุณไม่ทราบล่วงหน้าว่ากำลังมองหาข้อมูลประเภทใด คุณเป็นนักวิจัย คุณสามารถอธิบายได้อย่างชัดเจนเมื่อลูกค้าสองคนดูคล้ายกันและเมื่อพวกเขาดูแตกต่าง แต่คุณไม่รู้วิธีที่ดีที่สุดในการแบ่งกลุ่มฐานลูกค้าของคุณ ดังนั้นการขอให้คอมพิวเตอร์แบ่งกลุ่มฐานลูกค้าให้คุณเรียกว่าแมชชีนเลิร์นนิงแบบไม่มีผู้ดูแล เพราะคุณไม่สามารถควบคุมอะไรได้ คุณไม่ได้สั่งคอมพิวเตอร์ว่าต้องทำอย่างไร

ตรงกันข้ามกับกระบวนการนี้ มีแมชชีนเลิร์นนิงภายใต้การดูแล ซึ่งมักจะปรากฏขึ้นเมื่อปัญญาประดิษฐ์เข้าสู่หน้าแรก ถ้าฉันรู้ว่าฉันต้องการแบ่งลูกค้าออกเป็นสองกลุ่ม - พูดว่า "มีแนวโน้มที่จะซื้อ" และ "ไม่น่าจะซื้อ" - และป้อนคอมพิวเตอร์ด้วยตัวอย่างทางประวัติศาสตร์ของผู้ซื้อดังกล่าวโดยใช้นวัตกรรมทั้งหมดกับหนึ่งในกลุ่มเหล่านี้ นี่คือ ควบคุม.

ถ้าฉันพูดว่า “นี่คือสิ่งที่ฉันรู้เกี่ยวกับลูกค้าของฉัน และนี่คือวิธีที่จะบอกได้ว่าพวกเขาต่างกันหรือเหมือนกัน บอกฉันสิ่งที่น่าสนใจ” คือการขาดการควบคุม

บทนี้กล่าวถึงวิธีการจัดกลุ่มที่ง่ายที่สุดที่เรียกว่า k-mean ซึ่งมีอายุย้อนไปถึงปี 1950 และนับแต่นั้นมาได้กลายเป็นส่วนสำคัญในการค้นพบความรู้ฐานข้อมูล (KDR) ในอุตสาหกรรมและรัฐบาลต่างๆ

วิธี k-means ไม่ใช่วิธีที่ถูกต้องทางคณิตศาสตร์มากที่สุดในบรรดาวิธีทั้งหมด ประการแรก มันถูกสร้างขึ้นด้วยเหตุผลในการใช้งานได้จริงและสามัญสำนึก เช่น อาหารแอฟริกันอเมริกัน เธอไม่มีสายเลือดที่เก๋ไก๋เหมือนชาวฝรั่งเศส แต่เธอมักจะให้ความสำคัญกับรสนิยมการกินของเรา การจัดกลุ่มด้วย k-mean ดังที่คุณเห็นในไม่ช้านี้ เป็นส่วนหนึ่งของคณิตศาสตร์และส่วนหนึ่งของประวัติศาสตร์ (เกี่ยวกับอดีตของบริษัท หากการเปรียบเทียบเป็นการศึกษาด้านการจัดการ) ข้อได้เปรียบที่ไม่อาจปฏิเสธได้ของมันคือความเรียบง่ายที่เป็นธรรมชาติ

เรามาดูกันว่าวิธีนี้ทำงานอย่างไรด้วยตัวอย่างง่ายๆ

ผู้หญิงเต้นกับสาวๆ ผู้ชายเกาหัว

เป้าหมายของการจัดกลุ่ม k-mean คือการเลือกจุดสองสามจุดในช่องว่างแล้วเปลี่ยนให้เป็นกลุ่ม k (โดยที่ k คือตัวเลขใดๆ ที่คุณเลือก) แต่ละกลุ่มถูกกำหนดโดยจุดตรงกลาง เหมือนกับธงที่ปักไว้บนดวงจันทร์ ส่งสัญญาณว่า “นี่ ศูนย์กลางของกลุ่มของฉัน! เข้าร่วมถ้าคุณอยู่ใกล้ธงนี้มากกว่าคนอื่น!” ศูนย์กลุ่มนี้ (เรียกอย่างเป็นทางการว่าคลัสเตอร์เซ็นทรอยด์) เป็นค่าเฉลี่ยของชื่อ k-mean

ยกตัวอย่าง การเต้นรำของโรงเรียน หากคุณสามารถลบความสยองขวัญของ "ความบันเทิง" นี้ออกจากความทรงจำของคุณแล้ว ฉันเสียใจมากที่นำความทรงจำอันเจ็บปวดกลับคืนมา

ฮีโร่ในตัวอย่างของเรา - นักเรียนโรงเรียนมัธยมมักกะเน่ที่มางานเต้นรำภายใต้ชื่อโรแมนติกว่า "Ball at the Bottom of the Sea" กระจัดกระจายอยู่รอบ ๆ ห้องประชุมดังแสดงในรูปที่ 1. ฉันยังวาดภาพบนไม้ปาร์เก้ใน Photoshop เพื่อให้ง่ายต่อการจินตนาการถึงสถานการณ์

ข้าว. หนึ่ง.นักเรียนม.ปลายมักเน่เข้าแถวหอประชุม

และนี่คือตัวอย่างบางส่วนของเพลงที่ผู้นำรุ่นเยาว์ในโลกเสรีจะเต้นอย่างงุ่มง่าม (ในกรณีที่คุณต้องการใช้ดนตรีประกอบ เช่น บน Spotify):

  • สติกซ์: Come Sail Away
  • ทุกอย่างยกเว้นผู้หญิง: หายไป
  • Ace of Base: ทุกสิ่งที่เธอต้องการ
  • ซอฟต์เซลล์: ความรักที่มีมลทิน
  • Montell Jordan
  • ไอเฟล 65: สีฟ้า

ตอนนี้การจัดกลุ่มโดย k-mean ขึ้นอยู่กับจำนวนคลัสเตอร์ที่คุณต้องการแบ่งปัจจุบัน เริ่มจากสามคลัสเตอร์ (ในบทนี้ เราจะพิจารณาทางเลือกของ k) อัลกอริธึมจะวางธงสามผืนบนพื้นหอประชุมด้วยวิธีที่ถูกต้อง ดังแสดงในรูปที่ 2 ซึ่งคุณจะเห็นธงเริ่มต้น 3 แบบกระจายตามเพศและทำเครื่องหมายด้วยวงกลมสีดำ

ข้าว. 2.ตำแหน่งของศูนย์กลางเริ่มต้นของคลัสเตอร์

ในการจัดกลุ่ม k-mean นักเต้นจะถูกผูกไว้กับศูนย์กลางคลัสเตอร์ที่ใกล้ที่สุด เพื่อให้สามารถลากเส้นแบ่งระหว่างศูนย์กลางสองจุดบนพื้นได้ ดังนั้น หากนักเต้นอยู่ด้านหนึ่งของเส้น เขาจะอยู่ในกลุ่มหนึ่ง หากอยู่อีกด้านหนึ่ง ก็จะเป็นอีกด้านหนึ่ง (ดังในรูปที่ 3)

ข้าว. 3.เส้นกำหนดขอบเขตของคลัสเตอร์

โดยใช้เส้นแบ่งเขตเหล่านี้ เราแบ่งนักเต้นออกเป็นกลุ่มและระบายสีตามนั้น ดังในรูป 4. ไดอะแกรมนี้ ซึ่งแบ่งช่องว่างออกเป็นรูปหลายเหลี่ยมที่กำหนดโดยความใกล้ชิดกับศูนย์กลางคลัสเตอร์หนึ่งหรือศูนย์อื่น เรียกว่าไดอะแกรม Voronoi

ข้าว. 4.การจัดกลุ่มตามกลุ่มที่มีรูปแบบพื้นหลังต่างกันบนแผนภาพโวโรนอย

ลองดูที่การแบ่งเริ่มต้นของเรา มีบางอย่างผิดปกติใช่ไหม พื้นที่ถูกแบ่งออกในลักษณะที่ค่อนข้างแปลก: กลุ่มซ้ายล่างยังคงว่างและบนขอบของกลุ่มขวาบนตรงกันข้ามมีคนจำนวนมาก

อัลกอริทึมการจัดกลุ่มแบบ k-mean จะย้ายศูนย์คลัสเตอร์ไปรอบๆ ฟลอร์จนกว่าจะได้ผลลัพธ์ที่ดีที่สุด

จะกำหนด "ผลลัพธ์ที่ดีที่สุด" ได้อย่างไร? แต่ละคนที่อยู่ห่างไกลจากศูนย์กลางคลัสเตอร์ของพวกเขา ยิ่งระยะทางเฉลี่ยสั้นลงจากผู้เข้าร่วมไปยังศูนย์กลางของกลุ่ม ผลลัพธ์ก็จะยิ่งดีขึ้น

ตอนนี้เราขอแนะนำคำว่า "minimization" - มันจะมีประโยชน์มากสำหรับคุณในการปรับโมเดลให้เหมาะสมสำหรับตำแหน่งที่ดีขึ้นของศูนย์คลัสเตอร์ ในบทนี้ คุณจะทำให้ Solver ย้ายศูนย์คลัสเตอร์นับครั้งไม่ถ้วน วิธีที่ Solver ใช้เพื่อค้นหาตำแหน่งที่ดีที่สุดสำหรับศูนย์คลัสเตอร์คือการค่อยๆ เคลื่อนไปรอบๆ พื้นผิว แก้ไขผลลัพธ์ที่ดีที่สุดที่พบ และรวมเข้าด้วยกัน (หมายถึงการผสมพันธุ์อย่างม้าแข่ง) เพื่อค้นหาตำแหน่งที่ดีที่สุด

ดังนั้นหากไดอะแกรมในรูปที่ 4 ดูค่อนข้างซีด "ค้นหาวิธีแก้ปัญหา" สามารถจัดเรียงศูนย์ดังในรูป 5. ดังนั้นระยะทางเฉลี่ยระหว่างนักเต้นแต่ละคนกับศูนย์กลางของเขาจะลดลงเล็กน้อย

ข้าว. ห้า.ขยับศูนย์เล็กน้อย

เป็นที่ชัดเจนว่าไม่ช้าก็เร็ว Search for a Solution จะตระหนักว่าศูนย์ควรอยู่ตรงกลางของนักเต้นแต่ละกลุ่มดังแสดงในรูปที่ 6.

ข้าว. 6.การจัดกลุ่มที่เหมาะสมที่สุดในการเต้นรำของโรงเรียน

ดี! นี่คือลักษณะของการจัดกลุ่มในอุดมคติ ศูนย์คลัสเตอร์ตั้งอยู่ที่ศูนย์กลางของนักเต้นแต่ละกลุ่ม โดยลดระยะห่างเฉลี่ยระหว่างนักเต้นกับศูนย์กลางที่ใกล้ที่สุด เมื่อจัดกลุ่มเสร็จแล้ว ก็ได้เวลาไปยังส่วนที่สนุก ซึ่งกำลังพยายามหาว่าคลัสเตอร์เหล่านี้หมายถึงอะไร

หากคุณรู้จักสีผมของนักเต้น ความชอบทางการเมืองของพวกเขา หรือเวลาที่พวกเขาเดินทางเป็นร้อยเมตร การจัดกลุ่มก็ไม่สมเหตุสมผลนัก

แต่เมื่อคุณตัดสินใจกำหนดอายุและเพศของคนเหล่านั้น คุณจะเริ่มเห็นแนวโน้มทั่วไปบางอย่าง กลุ่มเล็กที่อยู่ด้านล่างคือผู้สูงอายุ ซึ่งมีแนวโน้มว่าจะมาด้วยมากที่สุด กลุ่มทางซ้ายเป็นเด็กผู้ชายทั้งหมด และกลุ่มทางขวาเป็นเด็กผู้หญิงทั้งหมด และทุกคนก็กลัวที่จะเต้นด้วยกัน

ดังนั้น วิธี k-means ทำให้คุณสามารถแบ่งผู้เข้าร่วมการเต้นรำออกเป็นกลุ่มๆ และเชื่อมโยงลักษณะของผู้เข้าร่วมแต่ละคนกับที่อยู่ในคลัสเตอร์หนึ่งๆ เพื่อทำความเข้าใจเหตุผลของการแยกกันอยู่

ตอนนี้ คุณคงกำลังพูดกับตัวเองว่า “เอาน่า ไร้สาระ ฉันรู้คำตอบแล้วก่อนที่จะเริ่ม คุณถูก. ในตัวอย่างนี้ ใช่ ฉันให้ตัวอย่าง "ของเล่น" ดังกล่าวโดยตั้งใจ โดยต้องแน่ใจว่าคุณสามารถแก้ไขได้โดยดูที่จุดต่างๆ การกระทำเกิดขึ้นในพื้นที่สองมิติซึ่งการจัดกลุ่มจะดำเนินการเบื้องต้นด้วยความช่วยเหลือของดวงตา

แต่ถ้าคุณเปิดร้านที่ขายสินค้าหลายพันชิ้นล่ะ ผู้ซื้อบางรายได้ทำการซื้อหนึ่งหรือสองครั้งในช่วงสองปีที่ผ่านมา อื่น ๆ เป็นโหล และทุกคนก็ซื้อบางอย่างที่แตกต่างออกไป

คุณจะจัดกลุ่มพวกเขาบน "ฟลอร์เต้นรำ" ได้อย่างไร? เริ่มจากความจริงที่ว่าฟลอร์เต้นรำนี้ไม่ใช่แบบสองมิติและไม่ใช่สามมิติ นี่คือพื้นที่ขายสินค้าหนึ่งพันมิติซึ่งผู้ซื้อได้ซื้อหรือไม่ซื้อสินค้าในแต่ละมิติ ดูว่าปัญหาของการรวมกลุ่มเริ่มเร็วแค่ไหนที่เกินความสามารถของ "ลูกตาของประเภทที่หนึ่ง" ตามที่เพื่อนทหารของฉันชอบพูด

ชีวิตจริง: K-Means Clustering ในการตลาดผ่านอีเมล

มาต่อกันที่กรณีที่เฉพาะเจาะจงมากขึ้น ฉันอยู่ในการตลาดผ่านอีเมล ดังนั้นฉันจะยกตัวอย่างจากชีวิตของ Mailchimp.com ที่ฉันทำงาน ตัวอย่างเดียวกันนี้จะใช้ได้กับข้อมูลค้าปลีก ข้อมูลการแปลงโฆษณา โซเชียลมีเดีย ฯลฯ ซึ่งจะโต้ตอบกับข้อมูลเกือบทุกประเภทที่เกี่ยวข้องกับการนำเสนอสื่อโฆษณาให้กับลูกค้า หลังจากนั้นพวกเขาจะเลือกคุณโดยไม่มีเงื่อนไข

ขายส่งไวน์ Empire Joey Bag O'Donuts

ลองนึกภาพสักครู่ว่าคุณอาศัยอยู่ในรัฐนิวเจอร์ซีย์ที่คุณเปิดกิจการ Joey Bag O'Donuts Wholesale Wine Empire ซึ่งเป็นธุรกิจนำเข้า-ส่งออกซึ่งมีจุดประสงค์เพื่อนำไวน์จำนวนมหาศาลจากต่างประเทศมาขายให้กับร้านเหล้าบางแห่ง ประเทศ วิธีการทำงานของธุรกิจคือ Joey เดินทางไปทั่วโลกเพื่อมองหาข้อเสนอที่น่าทึ่งพร้อมไวน์มากมาย เขาจัดส่งให้เขาใน Jersey และมันขึ้นอยู่กับคุณที่จะเก็บมันไว้ในร้านค้าและทำกำไร

คุณพบผู้ซื้อได้หลายวิธี: หน้า Facebook, บัญชี Twitter, บางครั้งแม้แต่จดหมายโดยตรง - ท้ายที่สุดแล้ว อีเมล "ส่งเสริม" ธุรกิจส่วนใหญ่ ปีที่แล้วคุณส่งจดหมายเดือนละหนึ่งฉบับ โดยปกติแต่ละตัวอักษรจะอธิบายข้อตกลงสองหรือสามข้อ เช่น ข้อตกลงหนึ่งกับแชมเปญ และอีกฉบับหนึ่งกล่าวถึงมัลเบก ข้อเสนอบางอย่างน่าทึ่งมาก - ส่วนลด 80% หรือมากกว่า ด้วยเหตุนี้ คุณทำข้อตกลงได้ประมาณ 32 ดีลในหนึ่งปี และทั้งหมดก็ดำเนินไปอย่างราบรื่นไม่มากก็น้อย

แต่เพียงเพราะทุกอย่างเป็นไปด้วยดี ไม่ได้หมายความว่ามันจะไม่ดีขึ้น การเข้าใจแรงจูงใจของลูกค้าให้ลึกซึ้งยิ่งขึ้นอีกเล็กน้อยก็จะเป็นประโยชน์ แน่นอน เมื่อคุณดูคำสั่งซื้อใดคำสั่งซื้อหนึ่ง คุณจะเห็นว่าคำสั่งซื้อหนึ่งๆ ที่ Adams ซื้อแบบมีฟองในเดือนกรกฎาคมด้วยส่วนลด 50% แต่คุณไม่สามารถระบุได้ว่าอะไรทำให้เขาซื้อ เขาชอบปริมาณการสั่งซื้อขั้นต่ำหนึ่งกล่องหกขวดหรือราคาที่ยังไม่ถึงขีดสูงสุดหรือไม่?

คงจะดีถ้าสามารถแบ่งรายชื่อลูกค้าออกเป็นกลุ่มผลประโยชน์ได้ จากนั้นคุณสามารถแก้ไขจดหมายของแต่ละกลุ่มแยกกัน และบางทีอาจส่งเสริมธุรกิจมากยิ่งขึ้น ข้อตกลงใดๆ ก็ตามที่เหมาะสมกับกลุ่มนี้อาจกลายเป็นหัวเรื่องของจดหมายและอยู่ในย่อหน้าแรกของข้อความ การส่งจดหมายแบบกำหนดเป้าหมายประเภทนี้อาจทำให้ยอดขายพุ่งกระฉูด!

เป็นไปได้ที่จะให้คอมพิวเตอร์ทำงานแทนคุณ เมื่อใช้การจัดกลุ่มแบบ k-mean คุณจะค้นหาการจัดกลุ่มที่ดีที่สุด แล้วพยายามหาสาเหตุว่าทำไมจึงดีที่สุด

ชุดข้อมูลเบื้องต้น

เอกสาร Excel ที่เราจะวิเคราะห์ในบทนี้อยู่บนเว็บไซต์ของหนังสือ ประกอบด้วยข้อมูลดั้งเดิมทั้งหมดในกรณีที่คุณต้องการใช้งาน หรือคุณสามารถทำตามข้อความโดยดูที่แผ่นงานที่เหลือในเอกสาร

ในการเริ่มต้น คุณมีแหล่งข้อมูลที่น่าสนใจสองแหล่ง:

  • ข้อมูลเมตาสำหรับคำสั่งซื้อแต่ละรายการจะจัดเก็บไว้ในสเปรดชีต ซึ่งรวมถึงพันธุ์ต่างๆ ปริมาณไวน์ขั้นต่ำต่อคำสั่งซื้อ ส่วนลดการขายปลีก ผ่านขีดจำกัดราคาหรือไม่ และประเทศต้นทาง ข้อมูลนี้ถูกวางไว้ในแท็บที่เรียกว่า OfferInformation ดังแสดงในรูปที่ 7;
  • เมื่อรู้ว่าลูกค้ารายใดกำลังสั่งซื้ออะไร คุณสามารถสลัดข้อมูลนั้นออกจาก MailChimp และป้อนไปยังสเปรดชีตที่มีข้อมูลเมตาของข้อเสนอในแท็บธุรกรรม เหล่านี้เป็นข้อมูลตัวแปรที่นำเสนอดังแสดงในรูปที่ 8 ง่ายมาก: ผู้ซื้อและคำสั่งซื้อของเขา

ข้าว. 7.รายละเอียด 32 ออเดอร์สุดท้าย

ข้าว. 8.รายการสั่งซื้อของลูกค้า

เรากำหนดเรื่องของการวัด

และนี่คือภารกิจ ในปัญหานาฏศิลป์ของโรงเรียน การวัดระยะห่างระหว่างปัจจุบันกับการกำหนดศูนย์กลางคลัสเตอร์นั้นไม่ยากใช่ไหม? คุณเพียงแค่ต้องหารูเล็ตที่เหมาะสม! แต่จะทำอย่างไรตอนนี้?

คุณทราบดีว่าปีที่แล้วมีข้อเสนอ 32 ข้อ และคุณมีรายการคำสั่งซื้อ 324 รายการในแท็บแยกต่างหาก แยกตามผู้ซื้อ แต่หากต้องการวัดระยะทางจากลูกค้าแต่ละรายไปยังศูนย์กลางคลัสเตอร์ คุณต้องวางพวกเขาไว้ในพื้นที่ 32 ดีลนี้ กล่าวอีกนัยหนึ่ง คุณต้องหาว่าข้อตกลงใดที่พวกเขาไม่ได้ทำ และสร้างเมทริกซ์ของข้อตกลงโดยลูกค้า โดยที่ลูกค้าแต่ละรายจะได้รับคอลัมน์ของตนเองที่มีเซลล์ข้อตกลง 32 เซลล์ ซึ่งเต็มไปด้วยเซลล์หากมีการสร้างข้อตกลง และจะมีค่าศูนย์หากไม่ใช่ .

กล่าวอีกนัยหนึ่ง คุณต้องใช้ตารางการซื้อขายเชิงแถวนี้และเปลี่ยนเป็นเมทริกซ์กับลูกค้าในแนวตั้งและข้อเสนอในแนวนอน ตาราง Pivot เป็นวิธีที่ดีที่สุดในการสร้าง

อัลกอริธึมการดำเนินการ: บนเวิร์กชีตที่มีข้อมูลตัวแปร ให้เลือกคอลัมน์ A และ B จากนั้นแทรกตารางสาระสำคัญ เมื่อใช้ตัวช่วยสร้าง PivotTable เพียงเลือกดีลเป็นส่วนหัวของแถวและผู้ซื้อเป็นส่วนหัวของคอลัมน์และเติมข้อมูลในตาราง เซลล์จะมี 1 ถ้ามีคู่ข้อตกลงลูกค้า และ 0 ถ้าไม่มี (ในกรณีนี้ 0 จะแสดงเป็นเซลล์ว่าง) ผลลัพธ์ที่ได้คือตารางที่แสดงในรูปที่ เก้า.

ข้าว. เก้า.ตารางสาระสำคัญ "ข้อตกลงลูกค้า"

เมื่อคุณมีข้อมูลการสั่งซื้อในรูปแบบเมทริกซ์แล้ว ให้คัดลอกแผ่นข้อมูลข้อเสนอและตั้งชื่อเป็นเมทริกซ์ ในชีตใหม่นี้ ให้วางค่าจากตารางเดือย (ไม่จำเป็นต้องคัดลอกและวางหมายเลขดีลเพราะอยู่ในข้อมูลคำสั่งซื้อแล้ว) เริ่มต้นด้วยคอลัมน์ H คุณควรลงเอยด้วยเมทริกซ์เวอร์ชันขยาย พร้อมข้อมูลการสั่งซื้อครบตามภาพ 10.

ข้าว. 10.รายละเอียดดีลและข้อมูลคำสั่งซื้อรวมอยู่ในเมทริกซ์เดียว

มาตรฐานข้อมูล

ในบทนี้ แต่ละมิติข้อมูลของคุณจะแสดงในลักษณะเดียวกัน เป็นข้อมูลไบนารีเกี่ยวกับคำสั่งซื้อ แต่ในสถานการณ์คลัสเตอร์หลายๆ สถานการณ์ เราไม่สามารถทำเช่นนี้ได้ ลองนึกภาพสถานการณ์ที่ผู้คนอยู่รวมกันเป็นกลุ่มตามส่วนสูง น้ำหนัก และเงินเดือน ข้อมูลทั้งสามประเภทนี้มีมิติข้อมูลต่างกัน ความสูงสามารถเปลี่ยนแปลงได้ตั้งแต่ 1.5 ถึง 2 เมตรในขณะที่น้ำหนัก - จาก 50 ถึง 150 กก.

ในบริบทนี้ การวัดระยะห่างระหว่างลูกค้า (เช่น ระหว่างนักเต้นในห้องบอลรูม) กลายเป็นเรื่องที่น่าสับสน ดังนั้นจึงเป็นเรื่องปกติที่จะสร้างมาตรฐานแต่ละคอลัมน์ของข้อมูลโดยการลบค่าเฉลี่ยแล้วหารด้วยการวัดความแปรผันที่เรียกว่าค่าเบี่ยงเบนมาตรฐาน ดังนั้น คอลัมน์ทั้งหมดจะถูกลดให้เป็นค่าเดียว โดยแตกต่างกันในเชิงปริมาณประมาณ 0

มาเริ่มกันที่สี่คลัสเตอร์

ตอนนี้ข้อมูลทั้งหมดของคุณถูกลดขนาดให้อยู่ในรูปแบบเดียวที่สะดวก ในการเริ่มต้นการทำคลัสเตอร์ คุณต้องเลือก k - จำนวนคลัสเตอร์ในอัลกอริทึม k-means มักใช้ค่า k ในลักษณะนี้: นำชุดค่า k ที่ต่างกันมาทดสอบทีละตัว (จะเลือกอย่างไร แล้วจะอธิบายทีหลัง) แต่เราเพิ่งจะเริ่มต้น - ดังนั้นเราจะเลือกเพียงค่าเดียว

คุณจะต้องมีคลัสเตอร์จำนวนหนึ่งที่เหมาะกับสิ่งที่คุณต้องการทำ เห็นได้ชัดว่าคุณไม่ได้ตั้งใจที่จะสร้าง 50 คลัสเตอร์และส่งอีเมลส่งเสริมการขายที่กำหนดเป้าหมาย 50 ฉบับไปยังผู้ชายสองคนจากแต่ละกลุ่ม สิ่งนี้กีดกันการใช้ความหมายของเราในทันที ในกรณีของเรา เราต้องการสิ่งเล็กน้อย เริ่มตัวอย่างนี้ด้วย 4 - ในโลกอุดมคติ คุณอาจแบ่งรายชื่อลูกค้าของคุณออกเป็น 4 กลุ่มที่เข้าใจได้ กลุ่มละ 25 คน (ซึ่งไม่น่าจะเกิดขึ้นจริง)

แล้วถ้าต้องแบ่งผู้ซื้อออกเป็น 4 กลุ่ม จะเลือกแบบไหนดี?

แทนที่จะทำลายแผ่นงาน Matrix ที่สวยงาม ให้คัดลอกข้อมูลไปยังแผ่นงานใหม่และตั้งชื่อเป็น 4MC ตอนนี้คุณสามารถแทรก 4 แท่งหลังจากราคาสูงในแถบ H ถึง K ซึ่งจะเป็นศูนย์กลางของคลัสเตอร์ (หากต้องการแทรกคอลัมน์ ให้คลิกขวาที่คอลัมน์ H แล้วเลือก วาง คอลัมน์จะปรากฏทางด้านซ้าย) ตั้งชื่อคลัสเตอร์เหล่านี้ คลัสเตอร์ 1 ถึง คลัสเตอร์ 4 คุณยังสามารถใช้การจัดรูปแบบตามเงื่อนไขกับคลัสเตอร์เหล่านี้ และทุกครั้งที่คุณตั้งค่า คุณจะ สามารถเห็นความแตกต่างได้

แผ่นงาน 4MC จะปรากฏขึ้นดังแสดงในรูปที่ สิบเอ็ด

ข้าว. สิบเอ็ดศูนย์คลัสเตอร์ที่ว่างเปล่าวางอยู่บนแผ่นงาน 4MC

ในกรณีนี้ ศูนย์คลัสเตอร์ทั้งหมดจะเป็นศูนย์ แต่ในทางเทคนิคแล้ว พวกเขาสามารถเป็นอะไรก็ได้ และโดยเฉพาะอย่างยิ่งคุณจะชอบ - เช่นเดียวกับการเต้นรำของโรงเรียน พวกมันถูกแจกจ่ายในลักษณะที่ลดระยะห่างระหว่างลูกค้าแต่ละรายกับศูนย์คลัสเตอร์ของเขา

เห็นได้ชัดว่าศูนย์เหล่านี้จะมีค่าตั้งแต่ 0 ถึง 1 สำหรับแต่ละธุรกรรม เนื่องจากเวกเตอร์ไคลเอ็นต์ทั้งหมดเป็นไบนารี

แต่การ "วัดระยะห่างระหว่างศูนย์กลางคลัสเตอร์กับผู้ซื้อ" หมายความว่าอย่างไร

ระยะทางแบบยุคลิด: การวัดระยะทางตรงไปข้างหน้า

สำหรับลูกค้าแต่ละราย คุณมีคอลัมน์แยกต่างหาก จะวัดระยะห่างระหว่างพวกเขาได้อย่างไร? ในเรขาคณิต นี่เรียกว่า "เส้นทางที่สั้นที่สุด" และระยะทางที่ได้คือระยะทางแบบยุคลิด

กลับไปที่ห้องประชุมกันสักครู่แล้วลองหาวิธีการแก้ปัญหาของเราที่นั่น

ให้เราวางแกนพิกัดลงบนพื้นและในรูปที่ 12 เราจะเห็นว่า ณ จุด (8,2) เรามีนักเต้น และที่ (4,4) เรามีศูนย์คลัสเตอร์ ในการคำนวณระยะทางระหว่างพวกเขาแบบยุคลิด คุณจะต้องจำทฤษฎีบทพีทาโกรัสที่คุณคุ้นเคยมาตั้งแต่สมัยเรียน

ข้าว. 12. Dancer ที่ (8,2) และคลัสเตอร์เซ็นเตอร์ที่ (4,4)

สองจุดนี้ห่างกัน 8 - 4 = 4 เมตรในแนวตั้ง และ 4 - 2 = 2 เมตรในแนวนอน ตามทฤษฎีบทพีทาโกรัส กำลังสองของระยะห่างระหว่างจุดสองจุดคือ 4L2 + 2L2 = 20 เมตร จากที่นี่ เราคำนวณระยะทางเอง ซึ่งจะเท่ากับสแควร์รูทของ 20 ซึ่งมีค่าประมาณ 4.47 เมตร (ดังในรูปที่ 13)

ข้าว. 13.ระยะทางแบบยุคลิดเท่ากับรากที่สองของผลรวมของระยะทางในแต่ละทิศทาง

ในบริบทของสมาชิกจดหมายข่าว คุณมีมิติข้อมูลมากกว่าสองมิติ แต่ใช้แนวคิดเดียวกัน ระยะห่างระหว่างผู้ซื้อและศูนย์กลางคลัสเตอร์คำนวณโดยนำความแตกต่างระหว่างจุดสองจุดสำหรับแต่ละการค้า ยกกำลังสอง บวก และหารากที่สอง ตัวอย่างเช่น ในแผ่นงาน 4MC คุณต้องการทราบระยะห่างแบบยุคลิดระหว่างจุดศูนย์กลางของคลัสเตอร์ 1 ในคอลัมน์ H และคำสั่งซื้อของลูกค้า Adams ในคอลัมน์ L

ในเซลล์ L34 ภายใต้คำสั่งของ Adams คุณสามารถคำนวณความแตกต่างระหว่างเวกเตอร์ของ Adams และศูนย์กลางคลัสเตอร์ ยกกำลังสอง บวก แล้วทำการรูทโดยใช้สูตรอาร์เรย์ต่อไปนี้ (ตรวจสอบการอ้างอิงแบบสัมบูรณ์ ช่วยให้คุณสามารถลากได้ สูตรนี้ไปทางขวาหรือลงโดยไม่เปลี่ยนการอ้างอิงไปยังศูนย์คลัสเตอร์):


(=ROOT(SUM(L$2:L$33-$H$2:$H$33)A2)))

สูตรอาร์เรย์ (พิมพ์สูตรแล้วกด Ctrl+Shift+Enter หรือ Cmd+Return บน MacOS ตามที่อธิบายไว้ในบทที่ 1) ควรใช้เพราะส่วน (L2:L33-H2:H33)^2 จำเป็นต้องรู้ว่าที่อ้างอิงถึง การคำนวณผลต่างและยกกำลังสองทีละขั้นตอน อย่างไรก็ตาม ผลลัพธ์สุดท้ายเป็นตัวเลขเดียว ในกรณีของเรา 1.732 (ดังในรูปที่ 14) มันมีความหมายดังต่อไปนี้: อดัมส์ทำการซื้อขายสามครั้ง แต่เนื่องจากศูนย์คลัสเตอร์เริ่มต้นเป็นศูนย์ คำตอบจะเท่ากับรากที่สองของ 3 คือ 1.732

ข้าว. สิบสี่ระยะทางระหว่างศูนย์คลัสเตอร์ 1 และอดัมส์

ในสเปรดชีตในรูป ในรูปที่ 2-14 ฉันเทียบชิดขอบแถวบนสุด (ดูบทที่ 1) ระหว่างคอลัมน์ G และ H และตั้งชื่อแถวที่ 34 ในเซลล์ G34 "ระยะทางไปยังคลัสเตอร์ 1" เพื่อดูว่าฉันเลื่อนลงมาที่ใด

ระยะทางและเป็นของคลัสเตอร์สำหรับทุกคน!

ตอนนี้คุณรู้วิธีคำนวณระยะห่างระหว่างเวกเตอร์คำสั่งและศูนย์กลางคลัสเตอร์แล้ว

ได้เวลาเพิ่ม Adams ในการคำนวณระยะทางไปยังศูนย์คลัสเตอร์ที่เหลือโดยลากเซลล์ L34 ลงไปที่ L37 จากนั้นจึงเปลี่ยนการอ้างอิงไปยังศูนย์กลางคลัสเตอร์ด้วยตนเองจากคอลัมน์ H เป็นคอลัมน์ I, J และ K ในเซลล์ด้านล่าง ผลลัพธ์ควรเป็น 4 สูตรต่อไปนี้ใน L34:L37:

(=SQRT(SUM((L$2:L$33-$H$2:$H$33)A2)))
(=SQRT(SUM((L$2:L$33-$I$2:$I$33)A2)))
(=SQRT(SUM((L$2:L$33-$J$2:$J$33)A2)))
(=SQRT(SUM((L$2:L$33-$K$2:$K$33)A2)))
(=ROOT(SUM((L$2:L$33-$H$2:$H$33)A2)))
(=ROOT(SUM((L$2:L$33-$I$2:$I$33)A2)))
(=ROOT(SUM((L$2:L$33-$J$2:$J$33)A2)))
(=ROOT(SUM((L$2:L$33-$K$2:$K$33)A2)))

เนื่องจากคุณใช้ลิงก์แบบสัมบูรณ์สำหรับศูนย์คลัสเตอร์ (ซึ่งคือความหมายของเครื่องหมาย $ ในสูตร ตามที่กล่าวไว้ในบทที่ 1) คุณสามารถลาก L34:L37 ไปที่ DG34:DG37 เพื่อคำนวณระยะทางจากลูกค้าแต่ละรายไปยังคลัสเตอร์ทั้งสี่ได้ ศูนย์ ติดป้ายกำกับแถวในคอลัมน์ G ในเซลล์ 35 ถึง 37 "ระยะทางไปยังคลัสเตอร์ 2" เป็นต้น ระยะทางที่คำนวณใหม่จะแสดงในรูปที่ 2 15.

ข้าว. 15.การคำนวณระยะทางจากลูกค้าแต่ละรายไปยังศูนย์คลัสเตอร์ทั้งหมด

ตอนนี้คุณทราบระยะทางของลูกค้าแต่ละรายไปยังศูนย์คลัสเตอร์ทั้งสี่แห่งแล้ว การกระจายระหว่างกระจุกตามระยะทางที่สั้นที่สุดในสองขั้นตอนดังนี้

อันดับแรก กลับไปที่ Adams ในคอลัมน์ L และคำนวณระยะทางต่ำสุดไปยังศูนย์กลางคลัสเตอร์ในเซลล์ L38 มันง่าย:

ขั้นต่ำ(L34:L37)
=นาที(L34:L37)

สำหรับการคำนวณ เราใช้สูตรการจับคู่/ค้นหา (สำหรับรายละเอียดเพิ่มเติม ดูบทที่ 1) เมื่อใส่ใน L39 คุณจะเห็นหมายเลขเซลล์จากช่วงเวลา L34:L37 (นับตามลำดับจาก 1) ซึ่งอยู่ที่ระยะทางต่ำสุด:

การแข่งขัน(L38,L34:L37,0) =การค้นหาตำแหน่ง(L38,L34:L37,0)

ในกรณีนี้ ระยะทางจะเท่ากันสำหรับคลัสเตอร์ทั้งสี่ ดังนั้นสูตรจะเลือกอันแรก (L34) และคืนค่า 1 (รูปที่ 16)

ข้าว. 16.การเพิ่ม Cluster Bindings ให้กับ Sheet

คุณยังสามารถลากสองสูตรนี้ไปที่ DG38: DG39 สำหรับการจัดระเบียบเพิ่มเติม ให้เพิ่มชื่อแถว 38 และ 39 ในเซลล์ 38 และ 39 ของคอลัมน์ G "Minimum Cluster Distance" และ "Assigned Cluster"

ค้นหาโซลูชันสำหรับศูนย์คลัสเตอร์

สเปรดชีตของคุณได้รับการอัปเดตด้วยการคำนวณระยะทางและการรวมคลัสเตอร์ ตอนนี้ เพื่อกำหนดตำแหน่งที่ดีที่สุดของศูนย์กลางคลัสเตอร์ คุณต้องค้นหาค่าดังกล่าวในคอลัมน์จาก H ถึง K ที่ลดระยะห่างทั้งหมดระหว่างลูกค้าและศูนย์กลางคลัสเตอร์ที่เกี่ยวข้อง โดยระบุไว้ในบรรทัดที่ 39 สำหรับแต่ละรายการ ลูกค้า.

เมื่อคุณได้ยินคำว่า "ย่อเล็กสุด": ขั้นตอนการปรับให้เหมาะสมจะเริ่มต้นขึ้น และการเพิ่มประสิทธิภาพจะดำเนินการโดยใช้ "ค้นหาโซลูชัน"

ในการใช้การค้นหาโซลูชัน คุณจะต้องมีเซลล์สำหรับผลลัพธ์ ดังนั้นใน A36 เราจะสรุประยะทางทั้งหมดระหว่างผู้ซื้อและศูนย์กลางคลัสเตอร์ของพวกเขา:

ผลรวม(L38:DG38)
=CMMA(L3 8:DG3 8)

ผลรวมของระยะทางจากลูกค้าไปยังศูนย์กลางคลัสเตอร์ที่ใกล้ที่สุดคือฟังก์ชันวัตถุประสงค์ที่เราพบก่อนหน้านี้ระหว่างการจัดกลุ่มหอประชุม McAcne High School แต่ระยะทางแบบยุคลิดที่มีกำลังและรากที่สองนั้นเป็นฟังก์ชันที่ไม่เชิงเส้นอย่างมหึมา ดังนั้นคุณต้องใช้อัลกอริธึมโซลูชันเชิงวิวัฒนาการแทนวิธีซิมเพล็กซ์

คุณใช้วิธีนี้ไปแล้วในบทที่ 1 อัลกอริธึมแบบซิมเพล็กซ์ ถ้าเป็นไปได้ จะทำงานได้เร็วกว่าอัลกอริธึมอื่น แต่ไม่สามารถใช้ในการคำนวณรูต สี่เหลี่ยม และฟังก์ชันอื่นที่ไม่ใช่เชิงเส้นได้ เช่นเดียวกับที่ไร้ประโยชน์คือ OpenSolver ซึ่งใช้อัลกอริธึมแบบซิมเพล็กซ์ แม้ว่าจะดูเหมือนว่าจะใช้สเตียรอยด์ก็ตาม

ในกรณีของเรา อัลกอริธึมวิวัฒนาการที่สร้างขึ้นใน Search for a Solution ใช้การผสมผสานระหว่างการค้นหาแบบสุ่มและโซลูชัน "ครอสโอเวอร์" ที่ยอดเยี่ยมเพื่อค้นหาโซลูชันที่มีประสิทธิภาพ เช่นเดียวกับวิวัฒนาการในบริบททางชีววิทยา

คุณมีทุกสิ่งที่จำเป็นในการตั้งค่างานก่อน "ค้นหาวิธีแก้ปัญหา":

  • เป้าหมาย: เพื่อลดระยะทางรวมจากผู้ซื้อไปยังศูนย์กลางคลัสเตอร์ (A36);
  • ตัวแปร: เวกเตอร์ของแต่ละธุรกรรมที่สัมพันธ์กับศูนย์คลัสเตอร์ (Н2:К33);
  • เงื่อนไข: ศูนย์คลัสเตอร์ต้องมีค่าระหว่าง 0 ถึง 1

แนะนำให้ใช้ "ค้นหาวิธีแก้ปัญหา" และค้อน เราตั้งค่าภารกิจ "กำลังค้นหาวิธีแก้ปัญหา": เพื่อลดขนาด A36 โดยเปลี่ยนค่าของ H2:K33 ด้วยเงื่อนไข H2:K33<=1, как и все векторы сделок. Убедитесь, что переменные отмечены как положительные и выбран эволюционный алгоритм (рис. 17).

ข้าว. 17.การตั้งค่า Solver สำหรับการทำคลัสเตอร์ 4-Clustering

แต่การตั้งเป้าหมายไม่ใช่ทุกอย่าง คุณจะต้องเหนื่อยเล็กน้อยโดยเลือกตัวเลือกที่จำเป็นสำหรับอัลกอริธึมวิวัฒนาการโดยคลิกปุ่ม "พารามิเตอร์" ในหน้าต่าง "ค้นหาวิธีแก้ปัญหา" และไปที่หน้าต่างการตั้งค่า ฉันแนะนำให้คุณตั้งเวลาสูงสุดเป็นอีก 30 วินาที ขึ้นอยู่กับว่าคุณยินดีที่จะรอ "ค้นหาวิธีแก้ปัญหา" นานแค่ไหนเพื่อรับมือกับงานของมัน ในรูป 18 ฉันตั้งค่าของฉันเป็น 600 วินาที (10 นาที) ด้วยวิธีนี้ ฉันสามารถเรียกใช้ "Search for a Solution" และไปรับประทานอาหารกลางวันได้ และหากคุณรู้สึกอยากยกเลิกมันตั้งแต่เนิ่นๆ เพียงกด Escape แล้วออกด้วยทางออกที่ดีที่สุดที่จะหาได้

ข้าว. สิบแปดพารามิเตอร์อัลกอริทึมวิวัฒนาการ

คลิกเรียกใช้และดู Excel ทำสิ่งนั้นจนกว่าอัลกอริธึมวิวัฒนาการมาบรรจบกัน

ความหมายของผลลัพธ์

ทันทีที่ "ค้นหาวิธีแก้ปัญหา" ให้ศูนย์คลัสเตอร์ที่เหมาะสมที่สุด ความสนุกก็เริ่มขึ้น ไปต่อกันที่กลุ่มกันเลย! ในรูป ในรูปที่ 19 เราจะเห็นว่า Solver พบระยะทางรวมที่เหมาะสมที่สุดที่ 140.7 และศูนย์กลางคลัสเตอร์ทั้งสี่แห่ง - ด้วยการจัดรูปแบบตามเงื่อนไข! - ดูแตกต่างอย่างสิ้นเชิง

ข้าว. 19.ศูนย์คลัสเตอร์ที่ดีที่สุดสี่แห่ง

โปรดทราบว่าศูนย์คลัสเตอร์ของคุณอาจแตกต่างจากที่นำเสนอในหนังสือ เนื่องจากอัลกอริธึมวิวัฒนาการใช้ตัวเลขสุ่มและคำตอบจะแตกต่างกันในแต่ละครั้ง คลัสเตอร์อาจแตกต่างไปจากเดิมอย่างสิ้นเชิงหรือมีแนวโน้มมากกว่าในลำดับที่ต่างกัน (เช่น คลัสเตอร์ 1 ของฉันอาจอยู่ใกล้กับคลัสเตอร์ 4 ของคุณมาก เป็นต้น)

เนื่องจากคุณแทรกคำอธิบายทางการค้าในคอลัมน์ B ถึง G เมื่อคุณสร้างชีต คุณจึงสามารถอ่านรายละเอียดในรูปที่ 19 ซึ่งเป็นสิ่งสำคัญในการทำความเข้าใจแนวคิดของคลัสเตอร์เซ็นเตอร์

สำหรับคลัสเตอร์ 1 ในคอลัมน์ H การจัดรูปแบบตามเงื่อนไขจะเลือกดีล 24, 26, 17 และ 2 ในระดับที่น้อยกว่า เมื่ออ่านคำอธิบายของดีลเหล่านี้ คุณจะเห็นสิ่งที่เหมือนกันทั้งหมด: ทำทั้งหมดบน Pinot นัวร์

เมื่อดูที่คอลัมน์ I คุณจะเห็นว่าเซลล์สีเขียวทั้งหมดมีจำนวนขั้นต่ำที่ต่ำ เหล่านี้เป็นผู้ซื้อที่ไม่เต็มใจที่จะซื้อล็อตใหญ่ระหว่างการทำธุรกรรม

แต่อีกสองศูนย์คลัสเตอร์ พูดตามตรง ยากที่จะตีความ แทนที่จะตีความคลัสเตอร์เซ็นเตอร์ ให้มองที่ตัวผู้ซื้อในคลัสเตอร์และตัดสินใจว่าพวกเขาชอบดีลประเภทไหน? สิ่งนี้อาจนำมาซึ่งความชัดเจนในประเด็น

การให้คะแนนดีลโดยวิธีคลัสเตอร์

แทนที่จะค้นหาว่าศูนย์กลางคลัสเตอร์ใดอยู่ใกล้กับ 1 มากที่สุด ให้ตรวจสอบว่าใครเชื่อมโยงกับคลัสเตอร์ใดและดีลใดที่พวกเขาต้องการ

ในการดำเนินการนี้ ให้เริ่มต้นด้วยการคัดลอกเอกสารข้อมูลข้อเสนอ มาเรียกสำเนา 4MS - TopDealsByCluster นับคอลัมน์จาก H ถึง K บนแผ่นงานใหม่นี้ตั้งแต่ 1 ถึง 4 (ดังในรูปที่ 20)

ข้าว. ยี่สิบ.การสร้างตารางชีตสำหรับคำนวณความนิยมของดีลโดยใช้คลัสเตอร์

ในชีต 4MC คุณมีคลัสเตอร์แองเคอร์ตั้งแต่ 1 ถึง 4 ในแถวที่ 39 สิ่งที่คุณต้องทำเพื่อนับดีลตามคลัสเตอร์คือดูชื่อคอลัมน์จาก H ถึง K บนชีต 4MC - TopDealsByCluster ดูว่าเวิร์กชีต 4MS ใด ผูกกับคลัสเตอร์นี้ในแถวที่ 39 แล้วเพิ่มจำนวนธุรกรรมในแต่ละแถว ดังนั้น เราจะได้รับจำนวนผู้ซื้อทั้งหมดในกลุ่มนี้ที่ทำธุรกรรม

มาเริ่มกันที่เซลล์ H2 ซึ่งประกอบด้วยจำนวนผู้ซื้อคลัสเตอร์ 1 ที่ยอมรับข้อเสนอหมายเลข 1 คือ malbec มกราคม คุณต้องเพิ่มค่าของเซลล์ในช่วง L2: DG2 บนชีต 4MC แต่เฉพาะลูกค้าจาก 1 คลัสเตอร์ ซึ่งเป็นตัวอย่างคลาสสิกของการใช้สูตร sumif / sumif ดูเหมือนว่านี้:

SUMIF("4MC"!$L$39:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)
=CyMMEOra("4MC"!$L$39:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)

สูตรนี้ทำงานดังนี้: คุณระบุค่าตามเงื่อนไขบางอย่าง ซึ่งจะตรวจสอบในส่วนแรกของ "4MC"!$L$39:$DG$39,"4MC แล้วเปรียบเทียบกับ 1 ในส่วนหัวของคอลัมน์ ("4MC - TopDealsByCluster"! H$1 ) จากนั้น สำหรับแต่ละคู่ที่ตรงกัน จะเพิ่มค่านั้นให้กับแถวที่ 2 ในส่วนที่สามของสูตร "4MC"!$L2:$DG2

โปรดทราบว่าคุณได้ใช้การอ้างอิงแบบสัมบูรณ์ ($ ในสูตร) ​​ก่อนสิ่งใดก็ตามที่เกี่ยวข้องกับการรวมคลัสเตอร์ หมายเลขแถวในส่วนหัวของคอลัมน์ และตัวอักษรประจำคอลัมน์สำหรับการซื้อขายที่เสร็จสมบูรณ์ เมื่อทำให้ลิงก์เหล่านี้เป็นค่าสัมบูรณ์ คุณสามารถลากสูตรไปที่ใดก็ได้จาก H2:K33 เพื่อคำนวณจำนวนดีลสำหรับศูนย์คลัสเตอร์อื่นๆ และการรวมดีล ดังในรูปที่ 2 21. เพื่อให้คอลัมน์เหล่านี้อ่านง่ายขึ้น คุณสามารถใช้การจัดรูปแบบตามเงื่อนไขกับคอลัมน์เหล่านี้ได้

ข้าว. 21.จำนวนดีลทั้งหมดต่อข้อเสนอ แยกตามคลัสเตอร์

โดยการเลือกคอลัมน์ A ถึง K และใช้การกรองอัตโนมัติ คุณสามารถจัดเรียงข้อมูลนี้ได้ โดยการจัดเรียงคอลัมน์ H จากน้อยไปมาก คุณจะเห็นว่าธุรกรรมใดได้รับความนิยมมากที่สุดในคลัสเตอร์ 1 (รูปที่ 22)

ข้าว. 22.การเรียงลำดับคลัสเตอร์ 1. Pinot, Pinot, Pinot!

ดังที่ฉันได้กล่าวไว้ก่อนหน้านี้ การซื้อขายที่ใหญ่ที่สุดสี่รายการสำหรับคลัสเตอร์นี้คือพินอส พวกเหล่านี้กำลังดูถูกหนังไซด์เวย์อย่างชัดเจน หากคุณจัดเรียงคลัสเตอร์ 2 จะค่อนข้างชัดเจนสำหรับคุณว่าเหล่านี้เป็นผู้ซื้อขายส่งรายย่อย (รูปที่ 23)

แต่เมื่อคุณจัดเรียงคลัสเตอร์ 3 มันไม่ง่ายเลยที่จะเข้าใจอะไร ข้อตกลงขนาดใหญ่สามารถนับได้เพียงนิ้วเดียว และความแตกต่างระหว่างข้อตกลงเหล่านี้กับส่วนที่เหลือไม่ชัดเจนนัก อย่างไรก็ตาม ดีลที่ได้รับความนิยมมากที่สุดยังคงมีบางอย่างที่เหมือนกัน เช่น ส่วนลดที่ค่อนข้างดี 5 ใน 6 ดีลที่ใหญ่ที่สุดคือสปาร์กลิงไวน์ และฝรั่งเศสเป็นผู้ผลิต 3 ใน 4 ดีล อย่างไรก็ตาม ข้อสันนิษฐานเหล่านี้ไม่ชัดเจน

สำหรับคลัสเตอร์ 4 คนเหล่านี้เห็นได้ชัดว่าชอบข้อเสนอสำหรับแชมเปญในเดือนสิงหาคมด้วยเหตุผลบางอย่าง นอกจากนี้ 5 ใน 6 ธุรกรรมที่ใหญ่ที่สุดสำหรับไวน์ฝรั่งเศส และ 9 ใน 10 ดีลที่ใหญ่ที่สุดสำหรับสินค้าปริมาณมาก บางทีนี่อาจเป็นกลุ่มขายส่งขนาดใหญ่ที่มุ่งสู่ไวน์ฝรั่งเศส จุดตัดของกลุ่ม 3 และ 4 ก็น่าเป็นห่วงเช่นกัน