วิธีการและเครื่องมือสำหรับการแบ่งส่วนผู้บริโภค ทบทวนวิธีการวิเคราะห์คลัสเตอร์และการประเมินการบังคับใช้สำหรับการแก้ปัญหาการแบ่งส่วนตลาดผู้บริโภค ผลลัพธ์ของการแบ่งส่วนโดยใช้วิธีการปรับขนาดหลายมิติ
วิธีการแบ่งกลุ่ม
วิธีการแบ่งส่วน "พื้นฐาน" บางวิธีสามารถแยกแยะได้ ที่สำคัญที่สุดคือการวิเคราะห์กลุ่มผู้บริโภค (อนุกรมวิธาน) กลุ่มผู้บริโภคเกิดขึ้นจากการจัดกลุ่มผู้ที่ให้คำตอบที่คล้ายคลึงกันสำหรับคำถามที่ถาม ผู้ซื้อสามารถจัดกลุ่มได้หากพวกเขาอายุ รายได้ นิสัย ฯลฯ ใกล้เคียงกัน ความคล้ายคลึงกันระหว่างผู้ซื้อขึ้นอยู่กับการวัดที่แตกต่างกัน แต่ผลรวมถ่วงน้ำหนักของความแตกต่างยกกำลังสองระหว่างการตอบคำถามของผู้ซื้อต่อคำถามมักใช้เป็นตัวชี้วัดความคล้ายคลึงกัน ผลลัพธ์ของอัลกอริธึมการจัดกลุ่มสามารถเป็นแผนผังลำดับชั้นหรือการรวมกลุ่มของผู้บริโภคออกเป็นกลุ่มๆ มีอัลกอริธึมคลัสเตอร์จำนวนมากพอสมควร
ตัวอย่างเช่น ในสหรัฐอเมริกา มีการใช้การวิเคราะห์คลัสเตอร์ของระบบที่เรียกว่า PRIZM อย่างกว้างขวาง , ซึ่งเริ่มจัดกลุ่มโดยลดชุดตัวชี้วัดทางสังคมและประชากรที่เป็นไปได้ 1,000 รายการ ระบบนี้สร้างกลุ่มทางสังคมและประชากรสำหรับอาณาเขตทั้งหมดของสหรัฐอเมริกา ดังนั้นคลัสเตอร์ 28 จึงถูกแยกออก - ครอบครัวที่ตกอยู่ในคลัสเตอร์นี้รวมถึงบุคคลที่ประสบความสำเร็จในอาชีพการงานหรือการบริหารงานมากที่สุด กลุ่มนี้ยังสะท้อนรายได้สูง การศึกษา ทรัพย์สิน และอายุเฉลี่ยโดยประมาณ แม้ว่าคลัสเตอร์นี้จะมีประชากรเพียง 7% ของประชากรสหรัฐฯ แต่ก็มีความสำคัญสำหรับผู้ประกอบการที่ขายผลิตภัณฑ์ระดับไฮเอนด์
มีตัวอย่างอื่นๆ ของการแบ่งส่วนผู้บริโภคตามการวิเคราะห์คลัสเตอร์ ตัวอย่างเช่น ในกลุ่ม "จิตวิทยา" สถานที่ที่สำคัญมากคือ "ทัศนคติของผู้บริโภคต่อความแปลกใหม่ของผลิตภัณฑ์" (รูปที่ 3)
รูปที่ 3
ดังจะเห็นได้จากข้อมูลข้างต้น ผู้บริโภคจำนวนมากที่สุดหมายถึงจำนวนผู้ซื้อทั่วไป
การแบ่งส่วนผู้บริโภคตามการวิเคราะห์คลัสเตอร์เป็นวิธี "คลาสสิก" ในเวลาเดียวกัน มีเทคนิคในการแบ่งส่วนตลาดตามสิ่งที่เรียกว่า "การแบ่งส่วนผลิตภัณฑ์" หรือการแบ่งส่วนตลาดตามพารามิเตอร์ของผลิตภัณฑ์ เป็นสิ่งสำคัญอย่างยิ่งในการผลิตและการตลาดของผลิตภัณฑ์ใหม่ สิ่งที่สำคัญเป็นพิเศษคือการแบ่งกลุ่มตามผลิตภัณฑ์ โดยอิงจากการศึกษาแนวโน้มของตลาดในระยะยาว กระบวนการของการพัฒนาและการผลิตผลิตภัณฑ์ใหม่ การเสร็จสิ้นโครงการการลงทุนขนาดใหญ่ต้องใช้เวลาค่อนข้างนาน และความถูกต้องของผลการวิเคราะห์ตลาดและการประเมินความสามารถของมันเป็นสิ่งสำคัญอย่างยิ่งที่นี่ ในสภาพการทำงานในตลาดดั้งเดิมของผลิตภัณฑ์มาตรฐาน การคำนวณกำลังการผลิตสามารถทำได้โดยใช้วิธีการรวมของตลาด ในสภาพสมัยใหม่ เพื่อเพิ่มความสามารถในการแข่งขันและกำหนดความสามารถของตลาดได้อย่างถูกต้อง ไม่เพียงพออีกต่อไปสำหรับองค์กรที่จะแบ่งกลุ่มตลาดในทิศทางเดียว - คำจำกัดความของกลุ่มผู้บริโภคตามเกณฑ์บางอย่าง ภายในกรอบของการตลาดแบบบูรณาการ ยังจำเป็นต้องแบ่งกลุ่มผลิตภัณฑ์ตามพารามิเตอร์ที่สำคัญที่สุดสำหรับการโปรโมตในตลาด เพื่อการนี้ วิธีการคอมไพล์ การ์ดการทำงาน- ดำเนินการแบ่งส่วนสองครั้งตามผลิตภัณฑ์และผู้บริโภค
แผนที่การทำงาน" อาจเป็นปัจจัยเดียว (การแบ่งกลุ่มจะดำเนินการตามปัจจัยหนึ่งและสำหรับกลุ่มผลิตภัณฑ์ที่เป็นเนื้อเดียวกัน) และหลายปัจจัย (การวิเคราะห์ว่ากลุ่มผู้บริโภคใดที่รูปแบบผลิตภัณฑ์เฉพาะมีไว้สำหรับและพารามิเตอร์ใดที่สำคัญที่สุดสำหรับการส่งเสริม ผลิตภัณฑ์ในตลาด) โดยการรวบรวมการ์ดการทำงาน คุณสามารถกำหนดได้ว่าผลิตภัณฑ์ใดได้รับการออกแบบสำหรับส่วนตลาดใด พารามิเตอร์การทำงานใดที่สอดคล้องกับความต้องการของผู้บริโภคบางอย่าง
ในการพัฒนาผลิตภัณฑ์ใหม่ เทคนิคนี้ถือว่าควรคำนึงถึงปัจจัยทั้งหมดที่สะท้อนถึงระบบความชอบของผู้บริโภค และในขณะเดียวกันก็ควรคำนึงถึงพารามิเตอร์ทางเทคนิคของผลิตภัณฑ์ใหม่ ซึ่งสามารถตอบสนองความต้องการของผู้บริโภคได้ มีการกำหนดกลุ่มผู้บริโภค โดยแต่ละกลุ่มมีชุดคำขอและความชอบของตนเอง ปัจจัยที่เลือกทั้งหมดจะถูกจัดลำดับตามระดับความสำคัญของแต่ละกลุ่มผู้บริโภค
แนวทางนี้ช่วยให้คุณเห็นในขั้นตอนการพัฒนาว่าพารามิเตอร์ของผลิตภัณฑ์ต้องปรับปรุงการออกแบบอย่างไร หรือพิจารณาว่ามีตลาดที่เพียงพอสำหรับโมเดลนี้หรือไม่
ให้เรายกตัวอย่างของการวิเคราะห์ตลาดที่เกี่ยวข้องกับโครงการคอมพิวเตอร์ภายใต้การพัฒนา "Apple" (ตารางที่ 1) (ดูหน้าถัดไป)
ตารางที่ 1." การแบ่งส่วนตลาดคอมพิวเตอร์ส่วนบุคคลและปัจจัยที่นำมาพิจารณาในการพัฒนาผลิตภัณฑ์สำหรับมัน (1982) "
ปัจจัย | ส่วนแบ่งตลาดตามกลุ่มผู้บริโภค | แบบอย่าง | ||||||
บ้าน | ที่โรงเรียน | ที่มหาวิทยาลัย | ไปที่บ้าน. สำนักงาน | ในธุรกิจขนาดเล็ก | ในบริษัท | แต่ | ใน | |
ข้อกำหนดทางเทคนิค | * | * | *** | ** | ** | ** | *** | ** |
ราคา | *** | *** | ** | *** | *** | ** | 0 | ** |
คุณสมบัติพิเศษ | * | * | ** | * | * | * | ** | * |
ความน่าเชื่อถือ | ** | * | * | ** | ** | * | 0 | ** |
สะดวกในการใช้ | ** | ** | * | ** | * | 0 | *** | *** |
ความเข้ากันได้ | 0 | 0 | 0 | 0 | 0 | *** | 0 | 0 |
อุปกรณ์ต่อพ่วง | 0 | 0 | 0 | 0 | 0 | *** | 0 | 0 |
ซอฟต์แวร์ | * | * | ** | ** | ** | *** | * | ** |
***เป็นปัจจัยที่สำคัญมาก
** - ปัจจัยสำคัญ
* - ปัจจัยที่ไม่สำคัญ
0 - ปัจจัยเล็กน้อย
การวิเคราะห์อย่างง่ายนี้แสดงให้เห็นว่ารุ่น A เป็นคอมพิวเตอร์ที่ไม่มีตลาด และรุ่น B เป็นผลิตภัณฑ์ที่เหมาะสมที่สุดสำหรับมหาวิทยาลัยและธุรกิจขนาดเล็ก
บริษัทเคยเดิมพันคอมพิวเตอร์ A แล้วแพ้
โดยทั่วไป ในทางปฏิบัติของโลก มีการใช้แนวทางพื้นฐาน 2 วิธีในการแบ่งส่วนการตลาด - (ดู: รูปแบบทั่วไปของการวิเคราะห์กลุ่ม (รูปที่ 4)) (หน้าถัดไป)
10 มีนาคม 2558
การเข้าสู่ตลาดใด ๆ ด้วยผลิตภัณฑ์ - ผู้บริโภค, อุตสาหกรรม - ผู้ผลิตต้องเข้าใจว่าเขาไม่สามารถให้บริการลูกค้าทั้งหมดได้แม้จะมีกำลังการผลิตที่เพียงพอ ท้ายที่สุดแล้ว ผู้ซื้อใช้ผลิตภัณฑ์นี้ในรูปแบบต่างๆ และที่สำคัญที่สุดคือพวกเขาซื้อโดยได้รับคำแนะนำจากแรงจูงใจต่างๆ ดังนั้นฉันจึงมักจะแยกย่อยผู้ซื้อ (การแบ่งส่วน) ตามแรงจูงใจเหล่านี้และลักษณะอื่น ๆ และหลังจากนั้น - ข้อเสนอของสินค้าที่ผลิตด้วยการพิจารณาสูงสุดของลักษณะเหล่านี้ ไม่มีการพูดเกินจริงที่จะกล่าวว่าแนวทางในอุดมคติในการวางแผนกิจกรรมทางการตลาดจากมุมมองของการตอบสนองความต้องการของผู้บริโภคนั้น ถือได้ว่าเป็นการปรับผลิตภัณฑ์และบริการให้เข้ากับความต้องการของผู้บริโภคแต่ละราย
จนถึงปี 1960 ทฤษฎีและแนวปฏิบัติของธุรกิจถูกครอบงำด้วยการปฐมนิเทศไปสู่ตลาดมวลชนโดยรวม สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่าผู้ผลิตสามารถผลิตสินค้าจำนวนมากและประหยัดจากขนาดได้ โดยมุ่งเน้นไปที่ตลาดทั่วไปที่ไม่กระจาย แต่ตั้งแต่ยุค 60 แนวโน้มความต้องการในการแยกแยะความต้องการเฉพาะของผู้บริโภคซึ่งสะท้อนให้เห็นในการแบ่งส่วนตลาดการขายเริ่มมีความแข็งแกร่ง
ในสภาวะที่ทันสมัยของการแข่งขันที่เพิ่มขึ้นในตลาดการขาย ปัญหาความจำเป็นในการเพิ่มความสามารถในการแข่งขันของผลิตภัณฑ์อุตสาหกรรมในประเทศในตลาดภายในประเทศและต่างประเทศได้เกิดขึ้นจริง ภายใต้เงื่อนไขเหล่านี้ ประเด็นสำคัญคือการค้นหาสำรองเพื่อลดต้นทุนเป็นพื้นฐานทางเศรษฐกิจของราคาและกำไร เป็นผลให้ผู้ประกอบการอุตสาหกรรมจำนวนมากกำลังดำเนินตามกลยุทธ์ต้นทุนต่ำโดยมุ่งเน้นไปที่วิธีการต่าง ๆ ของการดำเนินการ: การปฏิเสธบริการที่เกี่ยวข้องที่มีราคาแพง ประหยัดต้นทุนโดยการสร้างแบบจำลองสินค้าที่มีราคาถูกกว่าการผลิตและอื่นๆ แต่ต้นทุนโดยตรงส่วนใหญ่จะถูกกำหนดโดยเทคโนโลยีการผลิต ระดับการบรรทุกของผู้ผลิตสินค้าโภคภัณฑ์ระดับองค์กร และความเป็นไปได้ในการลดต้นทุนการจัดการโดยการปรับปรุงประสิทธิภาพในการจัดการพื้นที่การทำงานขององค์กรยังคงใช้งานไม่ได้
เครื่องมือที่ทันสมัยอย่างหนึ่งคือการลดต้นทุนการจัดการและเพิ่มคุณภาพของการจัดการ ซึ่งสามารถตีความได้ว่าเป็นความถูกต้องของการคาดการณ์กำไร ความสามารถในการทำกำไรสำหรับแต่ละคลัสเตอร์ (กลุ่มผู้ประกอบการอุตสาหกรรมประเภทเดียวกันของกิจกรรมทางเศรษฐกิจ) เปรียบเทียบ กับสถานการณ์เริ่มต้นหรือความถูกต้องของการคาดการณ์ความสามารถในการทำกำไรของพื้นที่หน้าที่ของกิจกรรมเหล่านี้ องค์กรคือ การวิเคราะห์แบบกลุ่ม
ความสำคัญของการแบ่งส่วนเป็นเครื่องมือทางการตลาดที่มีประสิทธิภาพอธิบายได้จากคุณลักษณะต่อไปนี้:
ü
การแบ่งส่วนเป็นวิธีที่มีประสิทธิภาพสูงในการแข่งขัน เนื่องจากเน้นที่การระบุและตอบสนองความต้องการเฉพาะของผู้บริโภค
ü
มุ่งเน้นกิจกรรมของบริษัทในตลาดเฉพาะ โดยเฉพาะอย่างยิ่งสำหรับบริษัทที่เริ่มกิจกรรมทางการตลาด
ü
การแบ่งส่วนตลาดช่วยให้กำหนดทิศทางการตลาดของบริษัทได้อย่างสมเหตุสมผลมากขึ้น
ü
ด้วยความช่วยเหลือของการแบ่งส่วน มันเป็นไปได้ที่จะกำหนดเป้าหมายทางการตลาดที่เป็นจริง
ü
การแบ่งส่วนตลาดที่ประสบความสำเร็จส่งผลต่อประสิทธิผลของการตลาดโดยรวม ตั้งแต่การวิจัยตลาดและผู้บริโภคไปจนถึงการสร้างระบบการขายและการส่งเสริมการขายที่เหมาะสม
ในทฤษฎีการตลาด แนวคิด ส TP -การตลาด . มันถูกสร้างขึ้นจากตัวย่อของตัวอักษรตัวแรกของคำภาษาอังกฤษการแบ่งส่วน(การแบ่งส่วน)การกำหนดเป้าหมาย(เลือกตลาดเป้าหมาย) และการวางตำแหน่ง(การวางตำแหน่ง). ส TP -การตลาด เป็นหัวใจสำคัญของการตลาดเชิงกลยุทธ์สมัยใหม่
การแบ่งส่วนตลาด - นี่คือการแบ่งผู้บริโภคออกเป็นกลุ่มตามความแตกต่างในความต้องการ ลักษณะหรือพฤติกรรม และการพัฒนาสำหรับแต่ละกลุ่มของส่วนประสมทางการตลาดที่แยกจากกัน
ส่วนตลาด ประกอบด้วยผู้บริโภคตอบสนองในลักษณะเดียวกันกับสิ่งจูงใจทางการตลาดชุดเดียวกัน
1.
การแบ่งส่วนตลาด- ขั้นตอนการจัดสรรผู้บริโภคแต่ละกลุ่มภายในตลาดร่วม
2.
การเลือกตลาดเป้าหมาย- ในกลุ่มตลาดที่เลือก กลุ่มเป้าหมายจะถูกเลือก กล่าวคือ กลุ่มที่บริษัทเน้นกิจกรรม
3.
การวางตำแหน่ง- การระบุผลิตภัณฑ์ของบริษัทในกลุ่มผลิตภัณฑ์อนาล็อก
เป้าหมายสูงสุดของการแบ่งกลุ่มตลาดเป้าหมายคือการเลือกเซ็กเมนต์ (หรือเซ็กเมนต์) ของผู้บริโภค ความพึงพอใจของความต้องการในกิจกรรมของบริษัทจะมุ่งเน้น
นักการตลาดเชื่อว่าการจัดสรรส่วนตลาดที่ถูกต้องนั้นเป็นความสำเร็จในเชิงพาณิชย์เพียงครึ่งเดียว กฎหมายพาเรโต (กฎหมาย 80:20).
วิธีการแบ่งส่วนตลาด:
วิธีการก่อน;
· วิธีการคลัสเตอร์;
· วิธีการแบ่งส่วนแบบยืดหยุ่น
· วิธีการแบ่งส่วนส่วนประกอบ
ที่ วิธีการลำดับความสำคัญสมมติฐานการแบ่งส่วนตลาดถูกหยิบยกขึ้นมาก่อนแล้วจึงทดสอบในหลักสูตรการวิจัยการตลาด ดังนั้นวิธีนี้จึงเรียกว่า Priori คือ ไม่มีประสบการณ์ วิธีการแบ่งส่วนตลาดนี้เป็นวิธีที่ใช้กันมากที่สุด เนื่องจากมีความเรียบง่าย ความพร้อมใช้งานของวิธีการที่นำไปใช้ได้จริง และต้นทุนในการดำเนินการต่ำ
วิธีการคลัสเตอร์แสดงว่าโครงสร้างตลาดไม่เป็นที่รู้จัก พวกเขาไม่ได้กำหนดตัวแปรตาม แต่มองหากลุ่มธรรมชาติที่พบในฐานข้อมูลของผู้บริโภคที่ได้รับจากการวิจัยตลาด ในกรณีนี้ ผู้ตอบแบบสำรวจจะถูกจัดกลุ่มจากกลุ่มผู้บริโภคที่มีศักยภาพก่อนโดยใช้ขั้นตอนการวิเคราะห์พิเศษออกเป็นกลุ่มตามธรรมชาติ - ส่วนตลาด หลังจากนั้นจะมีการกำหนดตัวแปรด้วยความช่วยเหลือซึ่งจะสามารถกำหนดส่วนตลาดอย่างเป็นทางการได้
เมื่อเปรียบเทียบกับการแบ่งส่วนก่อน เมื่อกำหนดส่วนโดยตัวแปรโดยประมาณในช่วงเริ่มต้นของการศึกษา และด้วยการแบ่งส่วนคลัสเตอร์ เมื่อส่วนที่เลือกเกิดขึ้นจากผลการวิเคราะห์กลุ่ม ตัวแบบ การแบ่งส่วนแบบยืดหยุ่นเสนอแนวทางการแก้ปัญหาแบบไดนามิก ด้วยวิธีการนี้ จะสามารถพัฒนาและทดสอบกลุ่มต่างๆ ได้จำนวนมาก โดยแต่ละส่วนรวมถึงผู้บริโภคหรือองค์กรที่มีการรับรู้ที่คล้ายคลึงกันของผลิตภัณฑ์ "รุ่นทดลอง" ใหม่ (ระบุโดยการกำหนดค่าของคุณลักษณะเฉพาะของผลิตภัณฑ์) การแบ่งส่วนแบบยืดหยุ่นรวมผลลัพธ์ของการวิเคราะห์แบบคู่และแบบจำลองคอมพิวเตอร์ของพฤติกรรมผู้บริโภคเมื่อเลือกผลิตภัณฑ์
การแบ่งส่วนส่วนประกอบเปลี่ยนจุดเน้นของการแบ่งส่วนตลาดเป็นลักษณะบุคลิกภาพ (อธิบายโดยชุดของลักษณะทางประชากรศาสตร์และจิตวิทยา) ที่จะเข้ากับคุณลักษณะของผลิตภัณฑ์ได้ดีขึ้น ในการแบ่งส่วนตามองค์ประกอบ ผู้วิจัยมีความสนใจในการเปรียบเทียบพารามิเตอร์ของมูลค่าของผลิตภัณฑ์และลักษณะต่างๆ ของผู้ตอบแบบสอบถาม เมื่อกำหนดพารามิเตอร์ทั้งสองชุดนี้แล้ว ผู้วิจัยสามารถให้คำแนะนำสำหรับการพัฒนาคุณสมบัติของผลิตภัณฑ์ที่เป็นไปได้สำหรับผู้บริโภคทุกประเภท
กระบวนการแบ่งส่วนตลาด
กระบวนการแบ่งส่วนเกิดขึ้นในแปดขั้นตอน
กลยุทธ์การครอบคลุมตลาด |
ขั้นตอนที่สองคือการตรวจสอบความเป็นเนื้อเดียวกันของกลุ่มคือ เราตรวจสอบว่าปฏิกิริยาของผู้บริโภคต่อผลิตภัณฑ์ในกลุ่มนี้เหมือนกันหรือไม่
ขั้นตอนที่สามคือการตรวจสอบระดับความแตกต่างของกลุ่มคือ เราตรวจสอบจำนวนผลิตภัณฑ์ที่มีการคำนวณและความหลากหลายของสินค้าที่องค์กรนำเสนอ
ขั้นตอนที่สี่คือการประเมินระดับการเข้าถึงได้ของเซ็กเมนต์เช่น จำเป็นต้องประเมินว่าองค์กรมีช่องทางการขายผลิตภัณฑ์เพียงพอหรือไม่ ปริมาณงานของช่องทางเหล่านี้คือเท่าใด องค์กรสามารถรับประกันการขายผลิตภัณฑ์ทั้งหมดได้หรือไม่ ไม่ว่าจะเป็นระบบสำหรับการส่งมอบผลิตภัณฑ์ไปยัง ผู้บริโภคมีความน่าเชื่อถือเพียงพอ
ขั้นตอนที่ห้าคือการตรวจสอบระดับการทำกำไรของกลุ่มคือ ราคาที่เป็นไปได้ของผลิตภัณฑ์เมื่อทำงานในส่วนนี้และกำหนดต้นทุนโดยคำนึงถึงการปรับตัวของผลิตภัณฑ์สำหรับส่วนนี้ (ความสามารถในการทำกำไร ≈ ความสามารถในการทำกำไร)
ขั้นตอนที่หกคือการประเมินความเสถียรของส่วนงาน
ขั้นตอนที่เจ็ดคือการเลือกกลุ่มเป้าหมาย
ขั้นตอนที่แปดคือกลยุทธ์ความครอบคลุมตลาด
การประเมินความน่าดึงดูดใจของเซ็กเมนต์และแนวคิดของตลาดเป้าหมาย
ความน่าดึงดูดใจของส่วนการตลาดถูกกำหนดตามเกณฑ์ที่แต่ละบริษัทกำหนดอย่างอิสระ
เกณฑ์บางข้อไม่ได้มีความสำคัญเท่าเทียมกัน ดังนั้นจึงต้องพิจารณาเกณฑ์แต่ละข้อแยกกัน จุดประสงค์ของการวิเคราะห์ความน่าดึงดูดใจคือการคำนวณนัยสำคัญแบบถ่วงน้ำหนักของเกณฑ์ที่กำหนดลักษณะ "ความน่าดึงดูดใจ" ของผลิตภัณฑ์หนึ่งๆ
ตลาดเป้าหมายคือกลุ่มตลาดที่เหมาะสมและทำกำไรได้มากที่สุด (หรือส่วนเดียว) สำหรับองค์กรที่ดำเนินกิจกรรม
บริษัทควรส่งเสริมความแตกต่างของผลิตภัณฑ์ที่ดึงดูดตลาดเป้าหมายมากที่สุด
ในการประเมินส่วนตลาด พิจารณาปัจจัยสองประการ: (1) ความน่าดึงดูดใจโดยรวม และ (2) เป้าหมายและทรัพยากรของบริษัทที่กำลังพัฒนา
เกณฑ์การประเมินความน่าดึงดูดใจของตลาดเป้าหมาย
1. ขนาด (ความจุ) ของตลาด - ภายใต้ความสามารถของตลาดสินค้าโภคภัณฑ์เป็นที่เข้าใจกันว่าปริมาณการขายสินค้าที่เป็นไปได้ (ผลิตภัณฑ์เฉพาะขององค์กร) ในระดับและอัตราส่วนของราคาที่แตกต่างกัน ความสามารถของตลาดมีลักษณะตามขนาดของความต้องการของประชากรและขนาดของอุปทานสินค้าโภคภัณฑ์
2. ที่ตั้งทางภูมิศาสตร์
3. ยอดขายที่แท้จริงและศักยภาพ
ปริมาณการขายจริง - จำนวนสินค้าและบริการที่องค์กรสามารถขายได้จริงภายใต้เงื่อนไขการดำเนินงานที่มีอยู่ ต้นทุนการโฆษณาโดยประมาณและระดับราคาที่ตั้งใจจะสร้าง
ปริมาณการขายที่เป็นไปได้ (ข้อเสนอ) - ส่วนแบ่งของตลาดที่มีศักยภาพที่องค์กรหวังว่าจะครอบครองและตามจำนวนสินค้าสูงสุดที่สามารถวางใจได้สำหรับการขายด้วยความสามารถ
4. ระดับที่แท้จริงและศักยภาพและความเข้มข้นของการแข่งขัน
ความสามารถที่แท้จริงและศักยภาพของบริษัทในการออกแบบ ผลิต และทำการตลาดผลิตภัณฑ์ที่มีความน่าสนใจในแง่ของราคาและปัจจัยที่ไม่ใช่ราคามากกว่าผลิตภัณฑ์ของคู่แข่ง
ความเข้มข้นของการแข่งขันและระดับความสามารถในการแข่งขันของบริษัทจะถูกกำหนดโดยศักยภาพของตลาด ความสะดวกในการเข้า; ประเภทของสินค้า ความสม่ำเสมอของตลาด โครงสร้างอุตสาหกรรมหรือตำแหน่งการแข่งขันของบริษัท โอกาสในการสร้างสรรค์นวัตกรรมทางเทคโนโลยี เป็นต้น
5. ความเป็นไปได้ในการครอบคลุมตลาด
จำนวนร้านค้าและศูนย์ที่มีศักยภาพที่จะจำหน่ายผลิตภัณฑ์
6. ต้นทุนการส่งเสริมการขายที่แท้จริงและอาจเกิดขึ้น
7. ระยะของวัฏจักรชีวิตของตลาด - เช่น การพัฒนาผลิตภัณฑ์ ระยะการนำไปปฏิบัติ ระยะการพัฒนา (การเติบโต) ระยะวุฒิภาวะ หรือระยะการตกต่ำ
8. แนวโน้มตลาด กล่าวคือ ทิศทางการพัฒนา แนวโน้ม
9. ข้อกำหนดเพิ่มเติมของผู้บริโภคสำหรับผลิตภัณฑ์
10. ระดับราคาที่แท้จริงและศักยภาพ
11. ความคาดหวังของผู้บริโภคและการตอบสนองที่แท้จริงต่อความพยายามทางการตลาดของผลิตภัณฑ์
SMEs ควรระบุและเลือกปัจจัยความสำเร็จที่สำคัญสองถึงสามประการจากการวิเคราะห์ความน่าดึงดูดใจของแต่ละกลุ่มตลาด ปัจจัยความสำเร็จที่สำคัญจะเป็น "คำขวัญ" ของบริษัท และจะต้องจดจำไว้เสมอ เป็นสถานการณ์ที่สำคัญที่สุดที่ต้องหรือไม่ต้องเกิดขึ้นเพื่อให้บริษัทประสบความสำเร็จในตลาดผลิตภัณฑ์เฉพาะ
กลยุทธ์การครอบคลุมตลาด
เมื่อทำการแบ่งส่วนเสร็จสิ้นแล้ว บริษัทต้องกำหนดว่าส่วนใดที่จะกำหนดเป้าหมายกิจกรรม ตามระดับความครอบคลุมของตลาด กลยุทธ์สามประเภทที่เป็นไปได้:
1. ส่วนงานเดียว (การตลาดแบบเข้มข้น)
บริษัทมุ่งเน้นไปที่ส่วนแบ่งขนาดใหญ่ของตลาดย่อยอย่างน้อยหนึ่งแห่ง ตัวอย่างเช่น โฟล์คสวาเก้นได้เน้นความพยายามในตลาดรถยนต์ขนาดเล็ก ด้วยการตลาดแบบเข้มข้น บริษัทสามารถรักษาตำแหน่งทางการตลาดที่แข็งแกร่งในเซ็กเมนต์ที่ให้บริการได้ เนื่องจากทราบความต้องการของเซ็กเมนต์เหล่านั้นดีกว่าใครๆ และมีชื่อเสียงในระดับหนึ่ง นอกจากนี้ จากความเชี่ยวชาญด้านมาตรการการผลิต การจัดจำหน่ายและการส่งเสริมการขาย บริษัทสามารถประสบความสำเร็จทางเศรษฐกิจในหลายด้านของกิจกรรม อย่างไรก็ตาม กลยุทธ์นี้เกี่ยวข้องกับระดับความเสี่ยงที่เพิ่มขึ้น: กลุ่มที่เลือกอาจไม่ตรงตามความคาดหวัง ในเรื่องนี้ หลายบริษัทเลือกที่จะกระจายกิจกรรมของตน ครอบคลุมกลุ่มตลาดต่างๆ
แนวทางนี้บางครั้งเรียกว่า "กลยุทธ์เฉพาะ" เพราะ ซึ่งมักจะทำด้วยทรัพยากรที่จำกัด
2. หลายส่วน (การตลาดส่วนต่าง)
บริษัทจำนวนมากขึ้นกำลังใช้กลยุทธ์นี้
ด้วยการนำเสนอผลิตภัณฑ์ที่หลากหลาย บริษัทหวังที่จะบรรลุการเติบโตของยอดขายและการเจาะลึกเข้าไปในแต่ละกลุ่มตลาด เธอคาดหวังว่าการเสริมความแข็งแกร่งให้กับตำแหน่งในตลาดหลายกลุ่ม เธอจะสามารถระบุตัวตนของผู้บริโภคถึงบริษัทที่มีหมวดหมู่ผลิตภัณฑ์นี้ได้ นอกจากนี้ เธอคาดว่าการซื้อซ้ำจะเพิ่มขึ้น เนื่องจากเป็นผลิตภัณฑ์ของบริษัทที่สอดคล้องกับความต้องการของผู้บริโภค ไม่ใช่ในทางกลับกัน
3. ครอบคลุมตลาดทั้งหมด (การตลาดไม่แตกต่าง)
ผู้เชี่ยวชาญด้านการตลาดส่วนใหญ่เชื่อว่ากลยุทธ์นี้มีขอบเขตจำกัด
ในกรณีนี้ บริษัทไม่ได้เน้นว่าความต้องการของลูกค้าแตกต่างกันอย่างไร แต่เน้นที่ความต้องการเหล่านี้เหมือนกัน พัฒนาผลิตภัณฑ์และโปรแกรมการตลาดที่จะดึงดูดลูกค้าให้ได้มากที่สุด ขึ้นอยู่กับวิธีการกระจายมวลชนและการโฆษณาจำนวนมาก มุ่งมั่นที่จะให้ผลิตภัณฑ์มีภาพลักษณ์ที่เหนือกว่าในจิตใจของผู้คน ตัวอย่างของการตลาดที่ไม่แตกต่างกัน เราสามารถอ้างถึงการดำเนินการของบริษัท Krasny Oktyabr ซึ่งเมื่อหลายปีก่อนได้เสนอแบรนด์ช็อกโกแลตสำหรับทุกคน
การตลาดที่ไม่แตกต่างนั้นประหยัด ต้นทุนในการผลิตสินค้า การรักษาสินค้าคงคลัง และการขนส่งสินค้านั้นต่ำ ค่าใช้จ่ายในการโฆษณาที่มีการตลาดที่ไม่แตกต่างกันนั้นยังอยู่ในระดับต่ำอีกด้วย การขาดความจำเป็นในการวิจัยการตลาดของกลุ่มตลาดและการวางแผนที่แยกย่อยตามกลุ่มเหล่านี้จะช่วยลดต้นทุนของการวิจัยการตลาดและการจัดการผลิตภัณฑ์
แนวความคิดของการวางตำแหน่ง
การวางตำแหน่งเป็นกระบวนการในการหาตำแหน่งทางการตลาดให้กับบริษัท ผลิตภัณฑ์ หรือบริการที่จะแยกแยะ (เขา) ออกจากตำแหน่งของคู่แข่ง การวางตำแหน่งดำเนินการโดยคำนึงถึงกลุ่มเป้าหมายเฉพาะของผู้บริโภคซึ่งสร้างและนำเสนอข้อดีและเอกลักษณ์ หากไม่มีความคิดที่ชัดเจนว่าตำแหน่งนี้มุ่งเป้าไปที่อะไร เป็นเรื่องยากมาก แม้กระทั่งแทบจะเป็นไปไม่ได้เลยที่จะจัดการตัดสินใจทางการตลาดให้สอดคล้องกัน คำจำกัดความของตำแหน่งที่แข่งขันได้มักจะกำหนดชุดเครื่องมือทางการตลาดที่มีประสิทธิภาพสูงสุด
โดยสรุปเราสามารถพูดได้ว่า การวางตำแหน่งเป็นกลยุทธ์ทางการตลาดเพื่อสร้างความสัมพันธ์ที่แน่นแฟ้นของแบรนด์ของคุณ (ผลิตภัณฑ์หรือบริษัท) กับการเชื่อมโยงบางอย่างหรือดีกว่าด้วยผลประโยชน์
ดังนั้นการจัดตำแหน่งจึงเกี่ยวข้องกับ:
- การสร้างในหัวของผู้บริโภคของสมาคมที่มั่นคงของผลิตภัณฑ์หรือ บริษัท ที่มีสถานที่บางแห่งในตลาด
- รักษาสมาคม (ตำแหน่งที่เลือก) ในระยะยาว
ตำแหน่งของสินค้าในตลาดสถานที่ที่ผลิตภัณฑ์กำหนดอยู่ในใจของผู้บริโภคเมื่อเปรียบเทียบกับผลิตภัณฑ์คู่แข่งที่คล้ายกันจากมุมมองของผู้บริโภค
กลยุทธ์การวางตำแหน่งเป็นชุดของมาตรการที่มุ่งถ่ายทอดแนวคิดการวางตำแหน่งให้ผู้บริโภค ตำแหน่งมีอยู่ในใจของผู้บริโภคเท่านั้น
- กลยุทธ์การนำเสนอสินค้า (บริการ)
- กลยุทธ์การกำหนดราคา
- กลยุทธ์การกระจายสินค้า
- กลยุทธ์ส่งเสริมสินค้า (บริการ)
ข้อจำกัดตำแหน่ง
- ตลาดเป้าหมาย
- คู่แข่งที่แท้จริงและมีศักยภาพ
- กลยุทธ์ของบริษัท
เปลี่ยนตำแหน่ง- การเปลี่ยนแปลงตำแหน่งของผลิตภัณฑ์หรือบริการในด้านการตลาดและการโฆษณา เมื่อได้รับภาพใหม่ กลุ่มเป้าหมายอื่นจะถูกกำหนด การโต้แย้งสำหรับข้อมูลการขายและการโฆษณา การเปลี่ยนแปลงบรรจุภัณฑ์ ฯลฯ
เหตุผลในการปรับตำแหน่ง:
- ตำแหน่งที่น่าสงสัย
- การวางตำแหน่งต่ำ
- การวางตำแหน่งไม่ชัดเจน
- ตำแหน่งที่ไร้ประโยชน์
- การวางตำแหน่งมากเกินไป
ที่อยู่อาศัย ฯลฯ จากนี้น่าจะชัดเจนว่าส่วนตลาดคือ
มีผู้บริโภคกลุ่มหนึ่งที่มีพฤติกรรมเหมือนกันในตลาด
ในทางกลับกัน การแบ่งส่วนตลาดจะแบ่งออกเป็นหลายขั้นตอน
- 2. ทางเลือกของกลุ่มตลาดอยู่ที่การประเมินแต่ละส่วนในแง่ของความน่าดึงดูดใจ (ความสามารถในการนำผลลัพธ์ที่ต้องการมาสู่องค์กร) ตามการประมาณการเหล่านี้ เลือกส่วนงาน (หรือส่วนงาน) ที่น่าสนใจที่สุด
- 3. สุดท้าย ขั้นตอนที่สามคือการวางตำแหน่งผลิตภัณฑ์ หลังจากเลือกส่วนตลาดแล้ว จำเป็นต้องคิดว่าผลิตภัณฑ์ที่บริษัทนำเสนอในตลาดจะถูกนำเสนอในตลาดอย่างไร นอกจากนี้ ต้องพัฒนาส่วนประสมทางการตลาดโดยละเอียดด้วย เป็นงานเหล่านี้ที่ได้รับการแก้ไขในขั้นตอนนี้
ในด้านการตลาด มีการระบุคุณลักษณะหลายอย่างที่สามารถปรับปรุงประสิทธิภาพของการแบ่งส่วนได้ สัญญาณเหล่านี้ไม่เกี่ยวกับผู้บริโภค แต่เป็นกลุ่มเอง
- 1. ส่วนจะต้องมีความหมาย ซึ่งหมายความว่าแอตทริบิวต์ที่รองรับการแบ่งส่วนอย่างน้อยต้องปรับเปลี่ยนตามพฤติกรรมผู้บริโภคอย่างน้อยในระดับหนึ่ง ดังนั้นการมีน้ำหนักเกินจึงมีความสำคัญในแง่ของปริมาณขนมปังที่บริโภค หรือมีปัญหาในการซื้อเสื้อผ้าหรือไม่ อย่างไรก็ตาม สัญลักษณ์นี้ไม่น่าจะมีความสำคัญกับเครื่องสำอางที่เขาใช้
- 2. ส่วนตลาดต้องมีขนาดใหญ่พอที่จะสามารถสร้างผลกำไรที่จำเป็นสำหรับความสำเร็จของบริษัท หากส่วนนี้เล็กเกินไปจากมุมมองนี้ การพัฒนาและการใช้งานโปรแกรมการตลาดที่เน้นไปที่ส่วนนั้นก็ไม่สมเหตุสมผล
- 3. ส่วนจะต้องสามารถวัดได้ ซึ่งหมายความว่าคุณลักษณะที่รองรับการแบ่งส่วนจะต้องให้ความเป็นไปได้ของการแยกกลุ่มผู้บริโภคออกจากกลุ่มอื่นๆ อย่างชัดเจนและชัดเจน อายุเป็นตัวอย่างของคุณลักษณะที่วัดได้ เราสามารถแบ่งผู้บริโภคทั้งหมดออกเป็นกลุ่มๆ ได้โดยง่าย ขึ้นอยู่กับค่าที่ตัวแปรนี้ใช้
ตัวอย่างของคุณลักษณะที่ไม่สามารถวัดผลได้อย่างเต็มที่ก็อาจเป็นได้เช่นกัน ความถี่ของการบริโภคผลิตภัณฑ์ ความชอบของผู้บริโภคในบางกรณีอาจแปรผันอย่างมาก สัญญาณที่น่าเชื่อถือกว่ามากจากมุมมองนี้คือความภักดีต่อตราสินค้า แม้ว่าผู้บริโภคจะซื้อสินค้าไม่บ่อยนัก เขาจะเลือกแบรนด์เดียวเสมอโดยปฏิเสธแบรนด์อื่นทั้งหมด
ในที่นี้ควรพิจารณาด้วยว่าผู้ให้สัมภาษณ์มีความจริงใจในการตอบคำถามของผู้วิจัยหรือไม่ จากมุมมองนี้ สัญญาณของประเภทของรสนิยมทางเพศจะวัดได้ไม่ดี แม้ว่าระดับความอดทนของสังคมของเราที่มีต่อชนกลุ่มน้อยทางเพศจะเพิ่มขึ้นอย่างต่อเนื่อง (และนี่เป็นสัญญาณของสังคมที่พัฒนาอย่างเพียงพอ) ไม่ใช่ตัวแทนของชนกลุ่มน้อยเหล่านี้ทุกคนจะกล้าประกาศรสนิยมทางเพศอย่างเปิดเผย
3. กลุ่มต้องสามารถเข้าถึงได้ คุณภาพนี้ไม่เพียงหมายความถึงความสามารถในการเข้าถึงเพื่อการวิจัยเท่านั้น แต่ยังรวมถึงความพร้อมใช้งานของข้อมูลเพิ่มเติมด้วย หากองค์กรสามารถคาดหวังให้สามารถมีอิทธิพลต่อเซ็กเมนต์กระตุกด้วยวิธีการที่มีอยู่แล้วประเมินผลกระทบโดยการเปรียบเทียบสถานะเริ่มต้นกับสถานะหลังการกระทบ ถือว่าเซ็กเมนต์สามารถเข้าถึงได้ เป็นที่ชัดเจนว่าสิ่งนี้เป็นไปได้ก็ต่อเมื่อมีการเข้าถึงข้อมูลเท่านั้น
ในแนวทางปฏิบัติทางการตลาด วิธีแบ่งส่วนข้อมูลมักใช้บ่อยที่สุด 3 วิธี ได้แก่ การจัดกลุ่ม การแบ่งส่วนตามลำดับหลายตัวแปรด้วยตัวแปรตาม และการวิเคราะห์คลัสเตอร์ รายการนี้ไม่ได้หมดวิธีการแบ่งส่วนที่เป็นไปได้ทั้งหมด แต่ก็เพียงพอแล้วที่จะเข้าใจแนวคิดทั่วไปของขั้นตอนนี้และความซับซ้อนที่เกี่ยวข้อง
1. วิธีที่ง่ายที่สุดในการแบ่งส่วนคือการแบ่งตลาดออกเป็นกลุ่มๆ ตามธรรมเนียมในด้านการตลาดและสังคมวิทยาตามคุณลักษณะที่ระบุไว้ข้างต้น ในกรณีนี้ สันนิษฐานง่ายๆ ว่ากลุ่มผู้บริโภคซึ่งระบุโดยอิงตามลักษณะเช่น เพศ อายุ หรืออาชีพ มีลักษณะเป็นชุดความต้องการและพฤติกรรมที่เป็นมาตรฐานอย่างเป็นธรรม
วิธีนี้เหมาะสมที่สุดในกรณีของการเลือกกิจกรรมใหม่ เช่น ในกรณีที่บริษัทเพิ่งเริ่มดำเนินการในตลาดหรือตัดสินใจเข้าสู่ตลาดใหม่
ข้อเสียของวิธีการแบ่งกลุ่มนี้คือขึ้นอยู่กับสมมติฐานและสมมติฐาน การแบ่งกลุ่มผู้บริโภคตามอายุ เพศ อาชีพ ระดับรายได้ หรือสถานะทางสังคมเป็นประเพณีสำหรับการวิจัยการตลาด แต่ไม่ชัดเจนเลยสักนิดว่าตัวแปรเหล่านี้เกี่ยวข้องกับกระบวนการของผู้บริโภคที่ "เสร็จสิ้น" กล่าวอีกนัยหนึ่ง เป็นไปไม่ได้เสมอที่จะยืนยันว่ากิจกรรมของผู้บริโภคขึ้นอยู่กับอายุโดยตรง ตัวอย่างเช่น ดังนั้น โดยการใช้การแบ่งส่วนดังกล่าว นักการตลาดจะเลือกเหตุผลที่มีน้ำหนักไม่เพียงพอสำหรับการเลือกกลุ่มตามอำเภอใจ
เมื่อแบ่งกลุ่มตลาด พึงระลึกไว้เสมอว่าคุณลักษณะที่อยู่ภายใต้การจัดสรรของกลุ่มบางกลุ่มมีความสำคัญต่างกัน ในอีกด้านหนึ่ง เราสามารถพูดคุยเกี่ยวกับสัญญาณที่เกี่ยวข้องโดยตรงกับเป้าหมายขององค์กร สัญญาณดังกล่าวจะเป็นเช่นความเต็มใจที่จะซื้อผลิตภัณฑ์ใหม่ที่มีคุณสมบัติบางอย่างบนพื้นฐานนี้เราสามารถแยกแยะกลุ่มผู้บริโภคที่พร้อมจะทำเช่นนี้และกลุ่มผู้บริโภคที่ไม่ พร้อมสำหรับสิ่งนี้
เนื่องจากองค์กรมีความสนใจในการขายสินค้า พารามิเตอร์นี้จึงเกี่ยวข้องโดยตรงกับเป้าหมายของตน ในทางกลับกัน มีพารามิเตอร์ที่มีนัยสำคัญน้อยกว่าที่ไม่เกี่ยวข้องอย่างใกล้ชิดกับเป้าหมายขององค์กร ตัวอย่างของลักษณะดังกล่าวจะเป็นอายุ ดังนั้นผลิตภัณฑ์นี้หรือผลิตภัณฑ์นั้นจึงเหมาะสำหรับกลุ่มอายุของคนหลังจาก 30 ปี แต่ไม่ได้หมายความว่าทุกคนที่อายุเกินสามสิบจะซื้อสินค้านี้ ดังนั้น อายุที่เป็นพารามิเตอร์การแบ่งส่วนจึงมีความเกี่ยวข้องน้อยกว่ากับเป้าหมายในทันทีขององค์กร
หากปัจจัยที่มีนัยสำคัญจริงๆ มีจำนวนมาก สามารถลดลงได้โดยใช้การวิเคราะห์ปัจจัยที่เรียกว่า มันเกี่ยวข้องกับการเลือกกลุ่มของคุณสมบัติที่เกี่ยวข้อง (พารามิเตอร์) ซึ่งรวมเป็นคุณสมบัติเดียว ตัวอย่างเช่น ระดับของรายได้สัมพันธ์อย่างใกล้ชิดกับขนาดของบ้าน การมีรถ จำนวนการเดินทางท่องเที่ยว การเยี่ยมชมสถานประกอบการ เช่น ร้านอาหารและคลับ ดังนั้นสัญญาณเหล่านี้จึงสามารถรวมเป็นหนึ่งเดียวได้
ขอแนะนำให้ตั้งชื่อคุณลักษณะนี้ ในกรณีของเรา เราอาจเรียกคุณลักษณะใหม่นี้ว่า "จำนวนเงินรายได้" แต่ตีความอย่างกว้างๆ ไม่ใช่แค่เป็นจำนวนเงินที่บุคคลได้รับในหนึ่งเดือนหรือหนึ่งปี ในทำนองเดียวกัน เราสามารถเชื่อมโยงระดับรายได้ อาชีพและการศึกษา ระดับรายได้และความชอบทางการเมือง เป็นต้น
2. การแบ่งส่วนตามลำดับหลายตัวแปรพร้อมตัวแปรตามจะเหมาะสมที่สุดเมื่อบริษัทมีประสบการณ์ในตลาดอยู่แล้ว ในกรณีนี้ การแบ่งส่วนมีวัตถุประสงค์เพื่อระบุส่วนตลาดที่ต้องการมากที่สุดในแง่ของผลลัพธ์ที่มีอยู่แล้ว
เนื่องจากผลลัพธ์หลักที่บริษัทมุ่งหมายคือการดึงกำไรสูงสุด ในกรณีนี้ รายได้ของบริษัทสามารถเลือกเป็นตัวแปรตาม การแบ่งส่วนเบื้องต้นมุ่งเป้าไปที่แง่มุมนี้: จำเป็นต้องระบุกลุ่มผู้บริโภคที่ทำให้เขามีรายได้สูงสุดจากมุมมองขององค์กร
เป็นที่ชัดเจนว่า ขีดจำกัดของรายได้โดยทั่วไปถูกกำหนดโดยอัตนัย และแสดงถึงการประนีประนอมระหว่างสถานการณ์จริงกับสถานการณ์ที่ต้องการ การแยกความแตกต่างได้ตามเงื่อนไข ตัวอย่างเช่น ผู้บริโภคที่มีรายได้มาก ผู้บริโภคที่มีรายได้เฉลี่ย (ที่น่าพอใจ) และผู้บริโภคที่มีรายได้น้อยเกินไป
ขั้นตอนที่สองของการแบ่งส่วนคือการระบุตัวแปรที่สอง ซึ่งเกี่ยวข้องอย่างใกล้ชิดกับตัวแปรแรกมากที่สุด ตัวแปรนี้มักจะเป็น:
- ก) ความถี่ในการใช้ผลิตภัณฑ์หรือบริการที่จำหน่ายโดยบริษัท
- b) ระดับรายได้ที่ผู้บริโภคนำมาสู่บริษัท
- c) ความภักดีของผู้บริโภคต่อแบรนด์ ตัวอย่างเช่น ในการวิจัยการตลาด พบว่าคนอายุ 25-33 ปีนำรายได้สูงสุดมาสู่บริษัท ดังนั้นผู้บริโภคทั้งหมดควรแบ่งออกเป็นสามกลุ่ม: 1) มากถึง 25 ปี; 2) ตั้งแต่ 25 ถึง 33 ปี และ 3) มากกว่า 33 ปี
เมื่อใช้วิธีนี้ เฉพาะส่วนที่ทำกำไรได้มากที่สุดของตลาดเท่านั้นที่จะถูกแบ่งส่วนเพิ่มเติม ในกรณีของเรา นี่คือหมวดหมู่ของผู้บริโภคที่มีอายุระหว่าง 25 ถึง 33 ปี ในขั้นตอนต่อมา จะพบฐานสำหรับการแบ่งส่วนอีกครั้ง ซึ่งเกี่ยวข้องกับระดับการทำกำไรมากที่สุด
ขีด จำกัด การหารในกรณีนี้คือส่วนซึ่งต้องมีคุณสมบัติดังต่อไปนี้:
- 1) ผู้บริโภคที่เป็นเจ้าของบริษัทนำรายได้สูงสุดมาสู่บริษัท (เช่น รายได้ที่บริษัทได้รับในส่วนนี้ซึ่งคิดเป็นสัดส่วนเพียง 20% ของตลาดคือ 70% ของรายได้ทั้งหมด)
- 2) ส่วนจะต้องไม่เข้าใจอย่างสมบูรณ์
- 3) ต้องมีขนาดใหญ่พอที่จะลงทุนในการพัฒนาเพิ่มเติม
- 4) การแบ่งส่วนเพิ่มเติมควรเป็นไปไม่ได้ (นี่คือคุณลักษณะที่ต้องการ)
ข้อดีของวิธีการแบ่งกลุ่มนี้คือขึ้นอยู่กับตัวแปรที่สำคัญที่สุด วิธีนี้มีข้อเสียเช่นกัน ประการแรก ไม่ได้คำนึงถึงปฏิสัมพันธ์ระหว่างตัวแปรต่างๆ นอกจากนี้ กลุ่มที่ได้รับการจัดสรรอย่างรวดเร็วด้วยความช่วยเหลือกลับกลายเป็นกลุ่มที่เล็กเกินไป ในขณะเดียวกัน โดยทั่วไป วิธีนี้ค่อนข้างจะได้ผล
เมื่อใช้งาน คุณจะเห็นได้ว่าส่วนใดเป็นที่นิยมมากที่สุด อันไหนเป็นได้ และอันไหนควรละทิ้งไปเลย โดยเฉพาะอย่างยิ่ง การใช้วิธีนี้ทำให้สามารถกำหนดงานที่เหมือนจริงมากได้ เช่น การเพิ่มรายได้ที่ได้รับจากผู้บริโภคกลุ่มใดกลุ่มหนึ่ง สุดท้ายนี้จะช่วยให้คุณระบุจุดอ่อนในกิจกรรมของบริษัทได้
3. ไม่เหมือนกับวิธีการแบ่งส่วนสองวิธีก่อนหน้านี้ ซึ่งนักการตลาดเริ่มการวิเคราะห์ตลาดกับประชากรทั้งหมดของผู้บริโภค และค่อยๆ แบ่งพวกเขาออกเป็นกลุ่มๆ ด้วยการวิเคราะห์แบบกลุ่ม ทิศทางจะกลับกัน: การวิเคราะห์เริ่มต้นด้วยผู้บริโภคแต่ละราย ด้วยเหตุนี้ การวิเคราะห์คลัสเตอร์จึงกำหนดให้นักการตลาดต้องมีข้อมูลเกี่ยวกับผู้บริโภคจริงจำนวนมากเพียงพอ ตามกฎแล้ว จำนวนของพวกเขาควรมีอย่างน้อย 200 คน
การวิเคราะห์คลัสเตอร์ประกอบด้วยหลายขั้นตอน
- 1) ขั้นแรก นักการตลาดจะสุ่มเลือกผู้บริโภครายหนึ่งและเริ่มมองหาอีกรายที่จะคล้ายกับเขามากที่สุดในแง่ของพารามิเตอร์ที่ทราบ เมื่อพบผู้บริโภค 2 รายดังกล่าว จะรวมกันเป็นกลุ่ม คลัสเตอร์อื่นๆ มีการระบุในลักษณะเดียวกัน
- 2) ขั้นตอนต่อไปคือการรวมผู้บริโภคแต่ละรายและกลุ่มผู้บริโภคเข้าเป็นชุมชนที่กว้างขึ้น พึงระลึกไว้เสมอว่าทั้งผู้บริโภครายบุคคลหรือคลัสเตอร์ที่จัดสรรแล้ว ตลอดจนผู้บริโภคและคลัสเตอร์ สามารถรวมกันเป็นกลุ่มได้ การควบรวมกิจการจะดำเนินการจนกว่าจะได้จำนวนคลัสเตอร์ที่น่าพอใจมากหรือน้อยนั่นคือเซ็กเมนต์ที่สอดคล้องกับผลประโยชน์ขององค์กรในแง่ของปริมาณ
- 3) การควบคุมความถูกต้องของการจัดสรรคลัสเตอร์คือการที่นักการตลาดดำเนินการแบ่งส่วนเป็นครั้งที่สอง และตรวจสอบว่าสามารถแบ่งส่วนเดียวกันได้หรือไม่โดยใช้มาตรการความคล้ายคลึงกันอื่นๆ ผลลัพธ์ของการแบ่งส่วนหลักและส่วนควบคุมตามการวิเคราะห์คลัสเตอร์จะถูกเปรียบเทียบ หลังจากนั้นจึงทำการปรับปรุงกับการแบ่งส่วนหลัก
ข้อได้เปรียบที่ไม่อาจปฏิเสธได้ของวิธีนี้คือช่วยให้คุณสามารถเริ่มต้นจากข้อมูลเฉพาะเกี่ยวกับผู้บริโภคได้ นักการตลาดที่ใช้วิธีนี้มีโอกาสน้อยที่จะเลือกพารามิเตอร์การแบ่งกลุ่มซึ่งอันที่จริงแล้วมีมูลค่าเพียงเล็กน้อย
ข้อเสียของวิธีนี้คือเมื่อใช้งานจะสามารถเลือกคลัสเตอร์ที่ไม่มีอยู่จริงได้ ซึ่งหมายความว่ากลุ่มผู้บริโภคที่ได้รับจะไม่มีลักษณะพฤติกรรมแบบเดียวกัน นั่นคือเหตุผลที่ขั้นตอนการควบคุมต่างๆ ควรเป็นส่วนบังคับของการวิเคราะห์คลัสเตอร์
ตำแหน่งผลิตภัณฑ์ในตลาดเป็นทิศทางของกิจกรรมทางการตลาดสำหรับการเลือกตลาดเป้าหมาย ซึ่งเกี่ยวข้องกับการวิเคราะห์องค์ประกอบของส่วนประสมทางการตลาดและตำแหน่งผลิตภัณฑ์ในกลุ่มตลาดที่เลือก เพื่อระบุพารามิเตอร์เหล่านั้นที่นำไปสู่การได้เปรียบในการแข่งขัน
หากองค์กรทั้งหมดผลิตผลิตภัณฑ์เดียวกันที่มีลักษณะเหมือนกัน ใช้วิธีการเดียวกันในการส่งเสริมและส่งมอบผลิตภัณฑ์ และให้บริการที่คล้ายคลึงกัน สำหรับผู้บริโภค สิ่งเหล่านี้จะเหมือนกันทั้งหมด
ในขณะเดียวกันก็เป็นสิ่งสำคัญที่จะต้องคำนึงถึงตำแหน่งที่ผลิตภัณฑ์อยู่ในตลาดในปัจจุบัน ตำแหน่งของผลิตภัณฑ์คือความคิดเห็นของผู้บริโภคเกี่ยวกับพารามิเตอร์ที่สำคัญที่สุดของผลิตภัณฑ์ บ่งบอกถึงสถานที่ที่ครอบครองโดยผลิตภัณฑ์เฉพาะในใจของผู้บริโภคที่สัมพันธ์กับผลิตภัณฑ์ของคู่แข่ง ซึ่งแตกต่างจากภาพของผลิตภัณฑ์ซึ่งมีลักษณะทางอารมณ์มากกว่า ตำแหน่งของผลิตภัณฑ์จะถูกสร้างขึ้นตามกฎบนพื้นฐานของพารามิเตอร์ที่วัดในเชิงปริมาณ (ส่วนแบ่งการตลาด คุณลักษณะของผลิตภัณฑ์ ราคา ฯลฯ)
- การเลือกส่วนตลาดเกี่ยวข้องกับขั้นตอนบางอย่าง ซึ่งประกอบด้วยสามขั้นตอน
- การแบ่งส่วนตลาดในความหมายที่แคบของมันเอง - การจัดสรรกลุ่มผู้บริโภคที่แตกต่างกันในความต้องการ ความสามารถทางการเงิน นิสัย
ฉันทำงานในอุตสาหกรรมการตลาดผ่านอีเมลสำหรับไซต์ชื่อ MailChimp.com เราช่วยลูกค้าสร้างจดหมายข่าวสำหรับผู้ชมโฆษณา ทุกครั้งที่มีคนเรียกงานของเราว่า "การบรรจุจดหมาย" ฉันรู้สึกหนาวสั่นในใจ
ทำไม? ใช่ เพราะที่อยู่อีเมลไม่ใช่กล่องดำที่คุณทิ้งระเบิดด้วยข้อความเช่นระเบิดอีกต่อไป ไม่ ในการทำการตลาดผ่านอีเมล (เช่นเดียวกับรูปแบบการติดต่อทางออนไลน์อื่น ๆ รวมถึงทวีต โพสต์บน Facebook และแคมเปญ Pinterest) ธุรกิจจะได้รับข้อมูลเชิงลึกเกี่ยวกับวิธีการที่ผู้ชมทำการติดต่อในระดับบุคคลผ่านการติดตามการคลิก คำสั่งซื้อออนไลน์ การกระจายสถานะในโซเชียล เครือข่าย ฯลฯ ข้อมูลนี้ไม่ได้เป็นเพียงการรบกวน พวกเขาแสดงลักษณะผู้ชมของคุณ แต่สำหรับผู้ที่ไม่ได้ฝึกหัด การดำเนินการเหล่านี้คล้ายกับภูมิปัญญาของภาษากรีก หรือภาษาเอสเปรันโต
คุณรวบรวมข้อมูลการทำธุรกรรมจากลูกค้าของคุณ (ผู้ใช้ สมาชิก ฯลฯ) และใช้ข้อมูลของพวกเขาเพื่อทำความเข้าใจผู้ชมของคุณให้ดีขึ้นได้อย่างไร เมื่อคุณต้องติดต่อกับผู้คนจำนวนมาก เป็นการยากที่จะศึกษาลูกค้าแต่ละรายโดยเฉพาะอย่างยิ่งหากพวกเขาทั้งหมดติดต่อคุณในรูปแบบที่แตกต่างกัน แม้ว่าในทางทฤษฎีคุณสามารถติดต่อกับทุกคนเป็นการส่วนตัวได้ แต่ในทางปฏิบัติสิ่งนี้แทบจะเป็นไปไม่ได้เลย
คุณต้องใช้ฐานลูกค้าและค้นหาจุดกึ่งกลางระหว่างการสุ่มทิ้งระเบิดและการตลาดส่วนบุคคลสำหรับลูกค้าแต่ละราย วิธีหนึ่งในการบรรลุความสมดุลนี้คือการใช้คลัสเตอร์เพื่อแบ่งกลุ่มตลาดลูกค้าของคุณ เพื่อให้คุณสามารถเข้าถึงกลุ่มต่างๆ ของฐานลูกค้าของคุณด้วยเนื้อหาที่ตรงเป้าหมาย ข้อเสนอ ฯลฯ
การวิเคราะห์คลัสเตอร์คือการรวบรวมออบเจ็กต์ต่างๆ และการแบ่งอ็อบเจ็กต์ออกเป็นกลุ่มๆ ด้วยการทำงานร่วมกับกลุ่มเหล่านี้—กำหนดสิ่งที่สมาชิกของพวกเขามีเหมือนกันและสิ่งที่ทำให้พวกเขาแตกต่าง—คุณสามารถเรียนรู้มากมายเกี่ยวกับชุดข้อมูลยุ่งที่คุณมี ความรู้นี้จะช่วยให้คุณตัดสินใจได้ดีขึ้นและละเอียดขึ้นกว่าเดิม
ในบริบทนี้ การทำคลัสเตอร์เรียกว่าการทำเหมืองข้อมูลเชิงสำรวจ เนื่องจากเทคนิคเหล่านี้ช่วยให้คุณ "ดึง" ข้อมูลเกี่ยวกับความสัมพันธ์ในชุดข้อมูลขนาดใหญ่ที่คุณไม่สามารถมองเห็นได้ และการค้นพบความเชื่อมโยงในกลุ่มสังคมก็มีประโยชน์ในทุกอุตสาหกรรม ไม่ว่าจะเป็นการแนะนำภาพยนตร์ตามนิสัยของผู้ชมเป้าหมาย เพื่อระบุศูนย์กลางอาชญากรของเมือง หรือเพื่อพิสูจน์การลงทุนทางการเงิน
การใช้คลัสเตอร์ที่ฉันโปรดปรานอย่างหนึ่งคือการทำคลัสเตอร์รูปภาพ: การซ้อนไฟล์รูปภาพที่ "เหมือนกัน" กับคอมพิวเตอร์ ตัวอย่างเช่น ในบริการโฮสต์รูปภาพ เช่น Flickr ผู้ใช้สร้างเนื้อหาจำนวนมาก และการนำทางอย่างง่ายจะเป็นไปไม่ได้เนื่องจากมีรูปภาพจำนวนมาก แต่ด้วยเทคนิคการจัดกลุ่ม คุณจะรวมรูปภาพที่คล้ายกันเข้าด้วยกันได้ ทำให้ผู้ใช้นำทางไปมาระหว่างกลุ่มเหล่านี้ได้ก่อนที่จะทำการจัดเรียงแบบละเอียด
แมชชีนเลิร์นนิงภายใต้การดูแลหรือไม่มีผู้ดูแล
ในการทำเหมืองข้อมูลเชิงสำรวจ ตามคำจำกัดความ คุณไม่ทราบล่วงหน้าว่ากำลังมองหาข้อมูลประเภทใด คุณเป็นนักวิจัย คุณสามารถอธิบายได้อย่างชัดเจนเมื่อลูกค้าสองคนดูคล้ายกันและเมื่อพวกเขาดูแตกต่าง แต่คุณไม่รู้วิธีที่ดีที่สุดในการแบ่งกลุ่มฐานลูกค้าของคุณ ดังนั้นการขอให้คอมพิวเตอร์แบ่งกลุ่มฐานลูกค้าให้คุณเรียกว่าแมชชีนเลิร์นนิงแบบไม่มีผู้ดูแล เพราะคุณไม่สามารถควบคุมอะไรได้ คุณไม่ได้สั่งคอมพิวเตอร์ว่าต้องทำอย่างไร
ตรงกันข้ามกับกระบวนการนี้ มีแมชชีนเลิร์นนิงภายใต้การดูแล ซึ่งมักจะปรากฏขึ้นเมื่อปัญญาประดิษฐ์เข้าสู่หน้าแรก ถ้าฉันรู้ว่าฉันต้องการแบ่งลูกค้าออกเป็นสองกลุ่ม - พูดว่า "มีแนวโน้มที่จะซื้อ" และ "ไม่น่าจะซื้อ" - และป้อนคอมพิวเตอร์ด้วยตัวอย่างทางประวัติศาสตร์ของผู้ซื้อดังกล่าวโดยใช้นวัตกรรมทั้งหมดกับหนึ่งในกลุ่มเหล่านี้ นี่คือ ควบคุม.
ถ้าฉันพูดว่า “นี่คือสิ่งที่ฉันรู้เกี่ยวกับลูกค้าของฉัน และนี่คือวิธีที่จะบอกได้ว่าพวกเขาต่างกันหรือเหมือนกัน บอกฉันสิ่งที่น่าสนใจ” คือการขาดการควบคุม
บทนี้กล่าวถึงวิธีการจัดกลุ่มที่ง่ายที่สุดที่เรียกว่า k-mean ซึ่งมีอายุย้อนไปถึงปี 1950 และนับแต่นั้นมาได้กลายเป็นส่วนสำคัญในการค้นพบความรู้ฐานข้อมูล (KDR) ในอุตสาหกรรมและรัฐบาลต่างๆ
วิธี k-means ไม่ใช่วิธีที่ถูกต้องทางคณิตศาสตร์มากที่สุดในบรรดาวิธีทั้งหมด ประการแรก มันถูกสร้างขึ้นด้วยเหตุผลในการใช้งานได้จริงและสามัญสำนึก เช่น อาหารแอฟริกันอเมริกัน เธอไม่มีสายเลือดที่เก๋ไก๋เหมือนชาวฝรั่งเศส แต่เธอมักจะให้ความสำคัญกับรสนิยมการกินของเรา การจัดกลุ่มด้วย k-mean ดังที่คุณเห็นในไม่ช้านี้ เป็นส่วนหนึ่งของคณิตศาสตร์และส่วนหนึ่งของประวัติศาสตร์ (เกี่ยวกับอดีตของบริษัท หากการเปรียบเทียบเป็นการศึกษาด้านการจัดการ) ข้อได้เปรียบที่ไม่อาจปฏิเสธได้ของมันคือความเรียบง่ายที่เป็นธรรมชาติ
เรามาดูกันว่าวิธีนี้ทำงานอย่างไรด้วยตัวอย่างง่ายๆ
ผู้หญิงเต้นกับสาวๆ ผู้ชายเกาหัว
เป้าหมายของการจัดกลุ่ม k-mean คือการเลือกจุดสองสามจุดในช่องว่างแล้วเปลี่ยนให้เป็นกลุ่ม k (โดยที่ k คือตัวเลขใดๆ ที่คุณเลือก) แต่ละกลุ่มถูกกำหนดโดยจุดตรงกลาง เหมือนกับธงที่ปักไว้บนดวงจันทร์ ส่งสัญญาณว่า “นี่ ศูนย์กลางของกลุ่มของฉัน! เข้าร่วมถ้าคุณอยู่ใกล้ธงนี้มากกว่าคนอื่น!” ศูนย์กลุ่มนี้ (เรียกอย่างเป็นทางการว่าคลัสเตอร์เซ็นทรอยด์) เป็นค่าเฉลี่ยของชื่อ k-mean
ยกตัวอย่าง การเต้นรำของโรงเรียน หากคุณสามารถลบความสยองขวัญของ "ความบันเทิง" นี้ออกจากความทรงจำของคุณแล้ว ฉันเสียใจมากที่นำความทรงจำอันเจ็บปวดกลับคืนมา
ฮีโร่ในตัวอย่างของเรา - นักเรียนโรงเรียนมัธยมมักกะเน่ที่มางานเต้นรำภายใต้ชื่อโรแมนติกว่า "Ball at the Bottom of the Sea" กระจัดกระจายอยู่รอบ ๆ ห้องประชุมดังแสดงในรูปที่ 1. ฉันยังวาดภาพบนไม้ปาร์เก้ใน Photoshop เพื่อให้ง่ายต่อการจินตนาการถึงสถานการณ์
ข้าว. หนึ่ง.นักเรียนม.ปลายมักเน่เข้าแถวหอประชุม
และนี่คือตัวอย่างบางส่วนของเพลงที่ผู้นำรุ่นเยาว์ในโลกเสรีจะเต้นอย่างงุ่มง่าม (ในกรณีที่คุณต้องการใช้ดนตรีประกอบ เช่น บน Spotify):
- สติกซ์: Come Sail Away
- ทุกอย่างยกเว้นผู้หญิง: หายไป
- Ace of Base: ทุกสิ่งที่เธอต้องการ
- ซอฟต์เซลล์: ความรักที่มีมลทิน
- Montell Jordan
- ไอเฟล 65: สีฟ้า
ตอนนี้การจัดกลุ่มโดย k-mean ขึ้นอยู่กับจำนวนคลัสเตอร์ที่คุณต้องการแบ่งปัจจุบัน เริ่มจากสามคลัสเตอร์ (ในบทนี้ เราจะพิจารณาทางเลือกของ k) อัลกอริธึมจะวางธงสามผืนบนพื้นหอประชุมด้วยวิธีที่ถูกต้อง ดังแสดงในรูปที่ 2 ซึ่งคุณจะเห็นธงเริ่มต้น 3 แบบกระจายตามเพศและทำเครื่องหมายด้วยวงกลมสีดำ
ข้าว. 2.ตำแหน่งของศูนย์กลางเริ่มต้นของคลัสเตอร์
ในการจัดกลุ่ม k-mean นักเต้นจะถูกผูกไว้กับศูนย์กลางคลัสเตอร์ที่ใกล้ที่สุด เพื่อให้สามารถลากเส้นแบ่งระหว่างศูนย์กลางสองจุดบนพื้นได้ ดังนั้น หากนักเต้นอยู่ด้านหนึ่งของเส้น เขาจะอยู่ในกลุ่มหนึ่ง หากอยู่อีกด้านหนึ่ง ก็จะเป็นอีกด้านหนึ่ง (ดังในรูปที่ 3)
ข้าว. 3.เส้นกำหนดขอบเขตของคลัสเตอร์
โดยใช้เส้นแบ่งเขตเหล่านี้ เราแบ่งนักเต้นออกเป็นกลุ่มและระบายสีตามนั้น ดังในรูป 4. ไดอะแกรมนี้ ซึ่งแบ่งช่องว่างออกเป็นรูปหลายเหลี่ยมที่กำหนดโดยความใกล้ชิดกับศูนย์กลางคลัสเตอร์หนึ่งหรือศูนย์อื่น เรียกว่าไดอะแกรม Voronoi
ข้าว. 4.การจัดกลุ่มตามกลุ่มที่มีรูปแบบพื้นหลังต่างกันบนแผนภาพโวโรนอย
ลองดูที่การแบ่งเริ่มต้นของเรา มีบางอย่างผิดปกติใช่ไหม พื้นที่ถูกแบ่งออกในลักษณะที่ค่อนข้างแปลก: กลุ่มซ้ายล่างยังคงว่างและบนขอบของกลุ่มขวาบนตรงกันข้ามมีคนจำนวนมาก
อัลกอริทึมการจัดกลุ่มแบบ k-mean จะย้ายศูนย์คลัสเตอร์ไปรอบๆ ฟลอร์จนกว่าจะได้ผลลัพธ์ที่ดีที่สุด
จะกำหนด "ผลลัพธ์ที่ดีที่สุด" ได้อย่างไร? แต่ละคนที่อยู่ห่างไกลจากศูนย์กลางคลัสเตอร์ของพวกเขา ยิ่งระยะทางเฉลี่ยสั้นลงจากผู้เข้าร่วมไปยังศูนย์กลางของกลุ่ม ผลลัพธ์ก็จะยิ่งดีขึ้น
ตอนนี้เราขอแนะนำคำว่า "minimization" - มันจะมีประโยชน์มากสำหรับคุณในการปรับโมเดลให้เหมาะสมสำหรับตำแหน่งที่ดีขึ้นของศูนย์คลัสเตอร์ ในบทนี้ คุณจะทำให้ Solver ย้ายศูนย์คลัสเตอร์นับครั้งไม่ถ้วน วิธีที่ Solver ใช้เพื่อค้นหาตำแหน่งที่ดีที่สุดสำหรับศูนย์คลัสเตอร์คือการค่อยๆ เคลื่อนไปรอบๆ พื้นผิว แก้ไขผลลัพธ์ที่ดีที่สุดที่พบ และรวมเข้าด้วยกัน (หมายถึงการผสมพันธุ์อย่างม้าแข่ง) เพื่อค้นหาตำแหน่งที่ดีที่สุด
ดังนั้นหากไดอะแกรมในรูปที่ 4 ดูค่อนข้างซีด "ค้นหาวิธีแก้ปัญหา" สามารถจัดเรียงศูนย์ดังในรูป 5. ดังนั้นระยะทางเฉลี่ยระหว่างนักเต้นแต่ละคนกับศูนย์กลางของเขาจะลดลงเล็กน้อย
ข้าว. ห้า.ขยับศูนย์เล็กน้อย
เป็นที่ชัดเจนว่าไม่ช้าก็เร็ว Search for a Solution จะตระหนักว่าศูนย์ควรอยู่ตรงกลางของนักเต้นแต่ละกลุ่มดังแสดงในรูปที่ 6.
ข้าว. 6.การจัดกลุ่มที่เหมาะสมที่สุดในการเต้นรำของโรงเรียน
ดี! นี่คือลักษณะของการจัดกลุ่มในอุดมคติ ศูนย์คลัสเตอร์ตั้งอยู่ที่ศูนย์กลางของนักเต้นแต่ละกลุ่ม โดยลดระยะห่างเฉลี่ยระหว่างนักเต้นกับศูนย์กลางที่ใกล้ที่สุด เมื่อจัดกลุ่มเสร็จแล้ว ก็ได้เวลาไปยังส่วนที่สนุก ซึ่งกำลังพยายามหาว่าคลัสเตอร์เหล่านี้หมายถึงอะไร
หากคุณรู้จักสีผมของนักเต้น ความชอบทางการเมืองของพวกเขา หรือเวลาที่พวกเขาเดินทางเป็นร้อยเมตร การจัดกลุ่มก็ไม่สมเหตุสมผลนัก
แต่เมื่อคุณตัดสินใจกำหนดอายุและเพศของคนเหล่านั้น คุณจะเริ่มเห็นแนวโน้มทั่วไปบางอย่าง กลุ่มเล็กที่อยู่ด้านล่างคือผู้สูงอายุ ซึ่งมีแนวโน้มว่าจะมาด้วยมากที่สุด กลุ่มทางซ้ายเป็นเด็กผู้ชายทั้งหมด และกลุ่มทางขวาเป็นเด็กผู้หญิงทั้งหมด และทุกคนก็กลัวที่จะเต้นด้วยกัน
ดังนั้น วิธี k-means ทำให้คุณสามารถแบ่งผู้เข้าร่วมการเต้นรำออกเป็นกลุ่มๆ และเชื่อมโยงลักษณะของผู้เข้าร่วมแต่ละคนกับที่อยู่ในคลัสเตอร์หนึ่งๆ เพื่อทำความเข้าใจเหตุผลของการแยกกันอยู่
ตอนนี้ คุณคงกำลังพูดกับตัวเองว่า “เอาน่า ไร้สาระ ฉันรู้คำตอบแล้วก่อนที่จะเริ่ม คุณถูก. ในตัวอย่างนี้ ใช่ ฉันให้ตัวอย่าง "ของเล่น" ดังกล่าวโดยตั้งใจ โดยต้องแน่ใจว่าคุณสามารถแก้ไขได้โดยดูที่จุดต่างๆ การกระทำเกิดขึ้นในพื้นที่สองมิติซึ่งการจัดกลุ่มจะดำเนินการเบื้องต้นด้วยความช่วยเหลือของดวงตา
แต่ถ้าคุณเปิดร้านที่ขายสินค้าหลายพันชิ้นล่ะ ผู้ซื้อบางรายได้ทำการซื้อหนึ่งหรือสองครั้งในช่วงสองปีที่ผ่านมา อื่น ๆ เป็นโหล และทุกคนก็ซื้อบางอย่างที่แตกต่างออกไป
คุณจะจัดกลุ่มพวกเขาบน "ฟลอร์เต้นรำ" ได้อย่างไร? เริ่มจากความจริงที่ว่าฟลอร์เต้นรำนี้ไม่ใช่แบบสองมิติและไม่ใช่สามมิติ นี่คือพื้นที่ขายสินค้าหนึ่งพันมิติซึ่งผู้ซื้อได้ซื้อหรือไม่ซื้อสินค้าในแต่ละมิติ ดูว่าปัญหาของการรวมกลุ่มเริ่มเร็วแค่ไหนที่เกินความสามารถของ "ลูกตาของประเภทที่หนึ่ง" ตามที่เพื่อนทหารของฉันชอบพูด
ชีวิตจริง: K-Means Clustering ในการตลาดผ่านอีเมล
มาต่อกันที่กรณีที่เฉพาะเจาะจงมากขึ้น ฉันอยู่ในการตลาดผ่านอีเมล ดังนั้นฉันจะยกตัวอย่างจากชีวิตของ Mailchimp.com ที่ฉันทำงาน ตัวอย่างเดียวกันนี้จะใช้ได้กับข้อมูลค้าปลีก ข้อมูลการแปลงโฆษณา โซเชียลมีเดีย ฯลฯ ซึ่งจะโต้ตอบกับข้อมูลเกือบทุกประเภทที่เกี่ยวข้องกับการนำเสนอสื่อโฆษณาให้กับลูกค้า หลังจากนั้นพวกเขาจะเลือกคุณโดยไม่มีเงื่อนไข
ขายส่งไวน์ Empire Joey Bag O'Donuts
ลองนึกภาพสักครู่ว่าคุณอาศัยอยู่ในรัฐนิวเจอร์ซีย์ที่คุณเปิดกิจการ Joey Bag O'Donuts Wholesale Wine Empire ซึ่งเป็นธุรกิจนำเข้า-ส่งออกซึ่งมีจุดประสงค์เพื่อนำไวน์จำนวนมหาศาลจากต่างประเทศมาขายให้กับร้านเหล้าบางแห่ง ประเทศ วิธีการทำงานของธุรกิจคือ Joey เดินทางไปทั่วโลกเพื่อมองหาข้อเสนอที่น่าทึ่งพร้อมไวน์มากมาย เขาจัดส่งให้เขาใน Jersey และมันขึ้นอยู่กับคุณที่จะเก็บมันไว้ในร้านค้าและทำกำไร
คุณพบผู้ซื้อได้หลายวิธี: หน้า Facebook, บัญชี Twitter, บางครั้งแม้แต่จดหมายโดยตรง - ท้ายที่สุดแล้ว อีเมล "ส่งเสริม" ธุรกิจส่วนใหญ่ ปีที่แล้วคุณส่งจดหมายเดือนละหนึ่งฉบับ โดยปกติแต่ละตัวอักษรจะอธิบายข้อตกลงสองหรือสามข้อ เช่น ข้อตกลงหนึ่งกับแชมเปญ และอีกฉบับหนึ่งกล่าวถึงมัลเบก ข้อเสนอบางอย่างน่าทึ่งมาก - ส่วนลด 80% หรือมากกว่า ด้วยเหตุนี้ คุณทำข้อตกลงได้ประมาณ 32 ดีลในหนึ่งปี และทั้งหมดก็ดำเนินไปอย่างราบรื่นไม่มากก็น้อย
แต่เพียงเพราะทุกอย่างเป็นไปด้วยดี ไม่ได้หมายความว่ามันจะไม่ดีขึ้น การเข้าใจแรงจูงใจของลูกค้าให้ลึกซึ้งยิ่งขึ้นอีกเล็กน้อยก็จะเป็นประโยชน์ แน่นอน เมื่อคุณดูคำสั่งซื้อใดคำสั่งซื้อหนึ่ง คุณจะเห็นว่าคำสั่งซื้อหนึ่งๆ ที่ Adams ซื้อแบบมีฟองในเดือนกรกฎาคมด้วยส่วนลด 50% แต่คุณไม่สามารถระบุได้ว่าอะไรทำให้เขาซื้อ เขาชอบปริมาณการสั่งซื้อขั้นต่ำหนึ่งกล่องหกขวดหรือราคาที่ยังไม่ถึงขีดสูงสุดหรือไม่?
คงจะดีถ้าสามารถแบ่งรายชื่อลูกค้าออกเป็นกลุ่มผลประโยชน์ได้ จากนั้นคุณสามารถแก้ไขจดหมายของแต่ละกลุ่มแยกกัน และบางทีอาจส่งเสริมธุรกิจมากยิ่งขึ้น ข้อตกลงใดๆ ก็ตามที่เหมาะสมกับกลุ่มนี้อาจกลายเป็นหัวเรื่องของจดหมายและอยู่ในย่อหน้าแรกของข้อความ การส่งจดหมายแบบกำหนดเป้าหมายประเภทนี้อาจทำให้ยอดขายพุ่งกระฉูด!
เป็นไปได้ที่จะให้คอมพิวเตอร์ทำงานแทนคุณ เมื่อใช้การจัดกลุ่มแบบ k-mean คุณจะค้นหาการจัดกลุ่มที่ดีที่สุด แล้วพยายามหาสาเหตุว่าทำไมจึงดีที่สุด
ชุดข้อมูลเบื้องต้น
เอกสาร Excel ที่เราจะวิเคราะห์ในบทนี้อยู่บนเว็บไซต์ของหนังสือ ประกอบด้วยข้อมูลดั้งเดิมทั้งหมดในกรณีที่คุณต้องการใช้งาน หรือคุณสามารถทำตามข้อความโดยดูที่แผ่นงานที่เหลือในเอกสาร
ในการเริ่มต้น คุณมีแหล่งข้อมูลที่น่าสนใจสองแหล่ง:
- ข้อมูลเมตาสำหรับคำสั่งซื้อแต่ละรายการจะจัดเก็บไว้ในสเปรดชีต ซึ่งรวมถึงพันธุ์ต่างๆ ปริมาณไวน์ขั้นต่ำต่อคำสั่งซื้อ ส่วนลดการขายปลีก ผ่านขีดจำกัดราคาหรือไม่ และประเทศต้นทาง ข้อมูลนี้ถูกวางไว้ในแท็บที่เรียกว่า OfferInformation ดังแสดงในรูปที่ 7;
- เมื่อรู้ว่าลูกค้ารายใดกำลังสั่งซื้ออะไร คุณสามารถสลัดข้อมูลนั้นออกจาก MailChimp และป้อนไปยังสเปรดชีตที่มีข้อมูลเมตาของข้อเสนอในแท็บธุรกรรม เหล่านี้เป็นข้อมูลตัวแปรที่นำเสนอดังแสดงในรูปที่ 8 ง่ายมาก: ผู้ซื้อและคำสั่งซื้อของเขา
ข้าว. 7.รายละเอียด 32 ออเดอร์สุดท้าย
ข้าว. 8.รายการสั่งซื้อของลูกค้า
เรากำหนดเรื่องของการวัด
และนี่คือภารกิจ ในปัญหานาฏศิลป์ของโรงเรียน การวัดระยะห่างระหว่างปัจจุบันกับการกำหนดศูนย์กลางคลัสเตอร์นั้นไม่ยากใช่ไหม? คุณเพียงแค่ต้องหารูเล็ตที่เหมาะสม! แต่จะทำอย่างไรตอนนี้?
คุณทราบดีว่าปีที่แล้วมีข้อเสนอ 32 ข้อ และคุณมีรายการคำสั่งซื้อ 324 รายการในแท็บแยกต่างหาก แยกตามผู้ซื้อ แต่หากต้องการวัดระยะทางจากลูกค้าแต่ละรายไปยังศูนย์กลางคลัสเตอร์ คุณต้องวางพวกเขาไว้ในพื้นที่ 32 ดีลนี้ กล่าวอีกนัยหนึ่ง คุณต้องหาว่าข้อตกลงใดที่พวกเขาไม่ได้ทำ และสร้างเมทริกซ์ของข้อตกลงโดยลูกค้า โดยที่ลูกค้าแต่ละรายจะได้รับคอลัมน์ของตนเองที่มีเซลล์ข้อตกลง 32 เซลล์ ซึ่งเต็มไปด้วยเซลล์หากมีการสร้างข้อตกลง และจะมีค่าศูนย์หากไม่ใช่ .
กล่าวอีกนัยหนึ่ง คุณต้องใช้ตารางการซื้อขายเชิงแถวนี้และเปลี่ยนเป็นเมทริกซ์กับลูกค้าในแนวตั้งและข้อเสนอในแนวนอน ตาราง Pivot เป็นวิธีที่ดีที่สุดในการสร้าง
อัลกอริธึมการดำเนินการ: บนเวิร์กชีตที่มีข้อมูลตัวแปร ให้เลือกคอลัมน์ A และ B จากนั้นแทรกตารางสาระสำคัญ เมื่อใช้ตัวช่วยสร้าง PivotTable เพียงเลือกดีลเป็นส่วนหัวของแถวและผู้ซื้อเป็นส่วนหัวของคอลัมน์และเติมข้อมูลในตาราง เซลล์จะมี 1 ถ้ามีคู่ข้อตกลงลูกค้า และ 0 ถ้าไม่มี (ในกรณีนี้ 0 จะแสดงเป็นเซลล์ว่าง) ผลลัพธ์ที่ได้คือตารางที่แสดงในรูปที่ เก้า.
ข้าว. เก้า.ตารางสาระสำคัญ "ข้อตกลงลูกค้า"
เมื่อคุณมีข้อมูลการสั่งซื้อในรูปแบบเมทริกซ์แล้ว ให้คัดลอกแผ่นข้อมูลข้อเสนอและตั้งชื่อเป็นเมทริกซ์ ในชีตใหม่นี้ ให้วางค่าจากตารางเดือย (ไม่จำเป็นต้องคัดลอกและวางหมายเลขดีลเพราะอยู่ในข้อมูลคำสั่งซื้อแล้ว) เริ่มต้นด้วยคอลัมน์ H คุณควรลงเอยด้วยเมทริกซ์เวอร์ชันขยาย พร้อมข้อมูลการสั่งซื้อครบตามภาพ 10.
ข้าว. 10.รายละเอียดดีลและข้อมูลคำสั่งซื้อรวมอยู่ในเมทริกซ์เดียว
มาตรฐานข้อมูล
ในบทนี้ แต่ละมิติข้อมูลของคุณจะแสดงในลักษณะเดียวกัน เป็นข้อมูลไบนารีเกี่ยวกับคำสั่งซื้อ แต่ในสถานการณ์คลัสเตอร์หลายๆ สถานการณ์ เราไม่สามารถทำเช่นนี้ได้ ลองนึกภาพสถานการณ์ที่ผู้คนอยู่รวมกันเป็นกลุ่มตามส่วนสูง น้ำหนัก และเงินเดือน ข้อมูลทั้งสามประเภทนี้มีมิติข้อมูลต่างกัน ความสูงสามารถเปลี่ยนแปลงได้ตั้งแต่ 1.5 ถึง 2 เมตรในขณะที่น้ำหนัก - จาก 50 ถึง 150 กก.
ในบริบทนี้ การวัดระยะห่างระหว่างลูกค้า (เช่น ระหว่างนักเต้นในห้องบอลรูม) กลายเป็นเรื่องที่น่าสับสน ดังนั้นจึงเป็นเรื่องปกติที่จะสร้างมาตรฐานแต่ละคอลัมน์ของข้อมูลโดยการลบค่าเฉลี่ยแล้วหารด้วยการวัดความแปรผันที่เรียกว่าค่าเบี่ยงเบนมาตรฐาน ดังนั้น คอลัมน์ทั้งหมดจะถูกลดให้เป็นค่าเดียว โดยแตกต่างกันในเชิงปริมาณประมาณ 0
มาเริ่มกันที่สี่คลัสเตอร์
ตอนนี้ข้อมูลทั้งหมดของคุณถูกลดขนาดให้อยู่ในรูปแบบเดียวที่สะดวก ในการเริ่มต้นการทำคลัสเตอร์ คุณต้องเลือก k - จำนวนคลัสเตอร์ในอัลกอริทึม k-means มักใช้ค่า k ในลักษณะนี้: นำชุดค่า k ที่ต่างกันมาทดสอบทีละตัว (จะเลือกอย่างไร แล้วจะอธิบายทีหลัง) แต่เราเพิ่งจะเริ่มต้น - ดังนั้นเราจะเลือกเพียงค่าเดียว
คุณจะต้องมีคลัสเตอร์จำนวนหนึ่งที่เหมาะกับสิ่งที่คุณต้องการทำ เห็นได้ชัดว่าคุณไม่ได้ตั้งใจที่จะสร้าง 50 คลัสเตอร์และส่งอีเมลส่งเสริมการขายที่กำหนดเป้าหมาย 50 ฉบับไปยังผู้ชายสองคนจากแต่ละกลุ่ม สิ่งนี้กีดกันการใช้ความหมายของเราในทันที ในกรณีของเรา เราต้องการสิ่งเล็กน้อย เริ่มตัวอย่างนี้ด้วย 4 - ในโลกอุดมคติ คุณอาจแบ่งรายชื่อลูกค้าของคุณออกเป็น 4 กลุ่มที่เข้าใจได้ กลุ่มละ 25 คน (ซึ่งไม่น่าจะเกิดขึ้นจริง)
แล้วถ้าต้องแบ่งผู้ซื้อออกเป็น 4 กลุ่ม จะเลือกแบบไหนดี?
แทนที่จะทำลายแผ่นงาน Matrix ที่สวยงาม ให้คัดลอกข้อมูลไปยังแผ่นงานใหม่และตั้งชื่อเป็น 4MC ตอนนี้คุณสามารถแทรก 4 แท่งหลังจากราคาสูงในแถบ H ถึง K ซึ่งจะเป็นศูนย์กลางของคลัสเตอร์ (หากต้องการแทรกคอลัมน์ ให้คลิกขวาที่คอลัมน์ H แล้วเลือก วาง คอลัมน์จะปรากฏทางด้านซ้าย) ตั้งชื่อคลัสเตอร์เหล่านี้ คลัสเตอร์ 1 ถึง คลัสเตอร์ 4 คุณยังสามารถใช้การจัดรูปแบบตามเงื่อนไขกับคลัสเตอร์เหล่านี้ และทุกครั้งที่คุณตั้งค่า คุณจะ สามารถเห็นความแตกต่างได้
แผ่นงาน 4MC จะปรากฏขึ้นดังแสดงในรูปที่ สิบเอ็ด
ข้าว. สิบเอ็ดศูนย์คลัสเตอร์ที่ว่างเปล่าวางอยู่บนแผ่นงาน 4MC
ในกรณีนี้ ศูนย์คลัสเตอร์ทั้งหมดจะเป็นศูนย์ แต่ในทางเทคนิคแล้ว พวกเขาสามารถเป็นอะไรก็ได้ และโดยเฉพาะอย่างยิ่งคุณจะชอบ - เช่นเดียวกับการเต้นรำของโรงเรียน พวกมันถูกแจกจ่ายในลักษณะที่ลดระยะห่างระหว่างลูกค้าแต่ละรายกับศูนย์คลัสเตอร์ของเขา
เห็นได้ชัดว่าศูนย์เหล่านี้จะมีค่าตั้งแต่ 0 ถึง 1 สำหรับแต่ละธุรกรรม เนื่องจากเวกเตอร์ไคลเอ็นต์ทั้งหมดเป็นไบนารี
แต่การ "วัดระยะห่างระหว่างศูนย์กลางคลัสเตอร์กับผู้ซื้อ" หมายความว่าอย่างไร
ระยะทางแบบยุคลิด: การวัดระยะทางตรงไปข้างหน้า
สำหรับลูกค้าแต่ละราย คุณมีคอลัมน์แยกต่างหาก จะวัดระยะห่างระหว่างพวกเขาได้อย่างไร? ในเรขาคณิต นี่เรียกว่า "เส้นทางที่สั้นที่สุด" และระยะทางที่ได้คือระยะทางแบบยุคลิด
กลับไปที่ห้องประชุมกันสักครู่แล้วลองหาวิธีการแก้ปัญหาของเราที่นั่น
ให้เราวางแกนพิกัดลงบนพื้นและในรูปที่ 12 เราจะเห็นว่า ณ จุด (8,2) เรามีนักเต้น และที่ (4,4) เรามีศูนย์คลัสเตอร์ ในการคำนวณระยะทางระหว่างพวกเขาแบบยุคลิด คุณจะต้องจำทฤษฎีบทพีทาโกรัสที่คุณคุ้นเคยมาตั้งแต่สมัยเรียน
ข้าว. 12. Dancer ที่ (8,2) และคลัสเตอร์เซ็นเตอร์ที่ (4,4)
สองจุดนี้ห่างกัน 8 - 4 = 4 เมตรในแนวตั้ง และ 4 - 2 = 2 เมตรในแนวนอน ตามทฤษฎีบทพีทาโกรัส กำลังสองของระยะห่างระหว่างจุดสองจุดคือ 4L2 + 2L2 = 20 เมตร จากที่นี่ เราคำนวณระยะทางเอง ซึ่งจะเท่ากับสแควร์รูทของ 20 ซึ่งมีค่าประมาณ 4.47 เมตร (ดังในรูปที่ 13)
ข้าว. 13.ระยะทางแบบยุคลิดเท่ากับรากที่สองของผลรวมของระยะทางในแต่ละทิศทาง
ในบริบทของสมาชิกจดหมายข่าว คุณมีมิติข้อมูลมากกว่าสองมิติ แต่ใช้แนวคิดเดียวกัน ระยะห่างระหว่างผู้ซื้อและศูนย์กลางคลัสเตอร์คำนวณโดยนำความแตกต่างระหว่างจุดสองจุดสำหรับแต่ละการค้า ยกกำลังสอง บวก และหารากที่สอง ตัวอย่างเช่น ในแผ่นงาน 4MC คุณต้องการทราบระยะห่างแบบยุคลิดระหว่างจุดศูนย์กลางของคลัสเตอร์ 1 ในคอลัมน์ H และคำสั่งซื้อของลูกค้า Adams ในคอลัมน์ L
ในเซลล์ L34 ภายใต้คำสั่งของ Adams คุณสามารถคำนวณความแตกต่างระหว่างเวกเตอร์ของ Adams และศูนย์กลางคลัสเตอร์ ยกกำลังสอง บวก แล้วทำการรูทโดยใช้สูตรอาร์เรย์ต่อไปนี้ (ตรวจสอบการอ้างอิงแบบสัมบูรณ์ ช่วยให้คุณสามารถลากได้ สูตรนี้ไปทางขวาหรือลงโดยไม่เปลี่ยนการอ้างอิงไปยังศูนย์คลัสเตอร์):
(=ROOT(SUM(L$2:L$33-$H$2:$H$33)A2)))
สูตรอาร์เรย์ (พิมพ์สูตรแล้วกด Ctrl+Shift+Enter หรือ Cmd+Return บน MacOS ตามที่อธิบายไว้ในบทที่ 1) ควรใช้เพราะส่วน (L2:L33-H2:H33)^2 จำเป็นต้องรู้ว่าที่อ้างอิงถึง การคำนวณผลต่างและยกกำลังสองทีละขั้นตอน อย่างไรก็ตาม ผลลัพธ์สุดท้ายเป็นตัวเลขเดียว ในกรณีของเรา 1.732 (ดังในรูปที่ 14) มันมีความหมายดังต่อไปนี้: อดัมส์ทำการซื้อขายสามครั้ง แต่เนื่องจากศูนย์คลัสเตอร์เริ่มต้นเป็นศูนย์ คำตอบจะเท่ากับรากที่สองของ 3 คือ 1.732
ข้าว. สิบสี่ระยะทางระหว่างศูนย์คลัสเตอร์ 1 และอดัมส์
ในสเปรดชีตในรูป ในรูปที่ 2-14 ฉันเทียบชิดขอบแถวบนสุด (ดูบทที่ 1) ระหว่างคอลัมน์ G และ H และตั้งชื่อแถวที่ 34 ในเซลล์ G34 "ระยะทางไปยังคลัสเตอร์ 1" เพื่อดูว่าฉันเลื่อนลงมาที่ใด
ระยะทางและเป็นของคลัสเตอร์สำหรับทุกคน!
ตอนนี้คุณรู้วิธีคำนวณระยะห่างระหว่างเวกเตอร์คำสั่งและศูนย์กลางคลัสเตอร์แล้ว
ได้เวลาเพิ่ม Adams ในการคำนวณระยะทางไปยังศูนย์คลัสเตอร์ที่เหลือโดยลากเซลล์ L34 ลงไปที่ L37 จากนั้นจึงเปลี่ยนการอ้างอิงไปยังศูนย์กลางคลัสเตอร์ด้วยตนเองจากคอลัมน์ H เป็นคอลัมน์ I, J และ K ในเซลล์ด้านล่าง ผลลัพธ์ควรเป็น 4 สูตรต่อไปนี้ใน L34:L37:
(=SQRT(SUM((L$2:L$33-$H$2:$H$33)A2)))
(=SQRT(SUM((L$2:L$33-$I$2:$I$33)A2)))
(=SQRT(SUM((L$2:L$33-$J$2:$J$33)A2)))
(=SQRT(SUM((L$2:L$33-$K$2:$K$33)A2)))
(=ROOT(SUM((L$2:L$33-$H$2:$H$33)A2)))
(=ROOT(SUM((L$2:L$33-$I$2:$I$33)A2)))
(=ROOT(SUM((L$2:L$33-$J$2:$J$33)A2)))
(=ROOT(SUM((L$2:L$33-$K$2:$K$33)A2)))
เนื่องจากคุณใช้ลิงก์แบบสัมบูรณ์สำหรับศูนย์คลัสเตอร์ (ซึ่งคือความหมายของเครื่องหมาย $ ในสูตร ตามที่กล่าวไว้ในบทที่ 1) คุณสามารถลาก L34:L37 ไปที่ DG34:DG37 เพื่อคำนวณระยะทางจากลูกค้าแต่ละรายไปยังคลัสเตอร์ทั้งสี่ได้ ศูนย์ ติดป้ายกำกับแถวในคอลัมน์ G ในเซลล์ 35 ถึง 37 "ระยะทางไปยังคลัสเตอร์ 2" เป็นต้น ระยะทางที่คำนวณใหม่จะแสดงในรูปที่ 2 15.
ข้าว. 15.การคำนวณระยะทางจากลูกค้าแต่ละรายไปยังศูนย์คลัสเตอร์ทั้งหมด
ตอนนี้คุณทราบระยะทางของลูกค้าแต่ละรายไปยังศูนย์คลัสเตอร์ทั้งสี่แห่งแล้ว การกระจายระหว่างกระจุกตามระยะทางที่สั้นที่สุดในสองขั้นตอนดังนี้
อันดับแรก กลับไปที่ Adams ในคอลัมน์ L และคำนวณระยะทางต่ำสุดไปยังศูนย์กลางคลัสเตอร์ในเซลล์ L38 มันง่าย:
ขั้นต่ำ(L34:L37)
=นาที(L34:L37)
สำหรับการคำนวณ เราใช้สูตรการจับคู่/ค้นหา (สำหรับรายละเอียดเพิ่มเติม ดูบทที่ 1) เมื่อใส่ใน L39 คุณจะเห็นหมายเลขเซลล์จากช่วงเวลา L34:L37 (นับตามลำดับจาก 1) ซึ่งอยู่ที่ระยะทางต่ำสุด:
การแข่งขัน(L38,L34:L37,0) =การค้นหาตำแหน่ง(L38,L34:L37,0)
ในกรณีนี้ ระยะทางจะเท่ากันสำหรับคลัสเตอร์ทั้งสี่ ดังนั้นสูตรจะเลือกอันแรก (L34) และคืนค่า 1 (รูปที่ 16)
ข้าว. 16.การเพิ่ม Cluster Bindings ให้กับ Sheet
คุณยังสามารถลากสองสูตรนี้ไปที่ DG38: DG39 สำหรับการจัดระเบียบเพิ่มเติม ให้เพิ่มชื่อแถว 38 และ 39 ในเซลล์ 38 และ 39 ของคอลัมน์ G "Minimum Cluster Distance" และ "Assigned Cluster"
ค้นหาโซลูชันสำหรับศูนย์คลัสเตอร์
สเปรดชีตของคุณได้รับการอัปเดตด้วยการคำนวณระยะทางและการรวมคลัสเตอร์ ตอนนี้ เพื่อกำหนดตำแหน่งที่ดีที่สุดของศูนย์กลางคลัสเตอร์ คุณต้องค้นหาค่าดังกล่าวในคอลัมน์จาก H ถึง K ที่ลดระยะห่างทั้งหมดระหว่างลูกค้าและศูนย์กลางคลัสเตอร์ที่เกี่ยวข้อง โดยระบุไว้ในบรรทัดที่ 39 สำหรับแต่ละรายการ ลูกค้า.
เมื่อคุณได้ยินคำว่า "ย่อเล็กสุด": ขั้นตอนการปรับให้เหมาะสมจะเริ่มต้นขึ้น และการเพิ่มประสิทธิภาพจะดำเนินการโดยใช้ "ค้นหาโซลูชัน"
ในการใช้การค้นหาโซลูชัน คุณจะต้องมีเซลล์สำหรับผลลัพธ์ ดังนั้นใน A36 เราจะสรุประยะทางทั้งหมดระหว่างผู้ซื้อและศูนย์กลางคลัสเตอร์ของพวกเขา:
ผลรวม(L38:DG38)
=CMMA(L3 8:DG3 8)
ผลรวมของระยะทางจากลูกค้าไปยังศูนย์กลางคลัสเตอร์ที่ใกล้ที่สุดคือฟังก์ชันวัตถุประสงค์ที่เราพบก่อนหน้านี้ระหว่างการจัดกลุ่มหอประชุม McAcne High School แต่ระยะทางแบบยุคลิดที่มีกำลังและรากที่สองนั้นเป็นฟังก์ชันที่ไม่เชิงเส้นอย่างมหึมา ดังนั้นคุณต้องใช้อัลกอริธึมโซลูชันเชิงวิวัฒนาการแทนวิธีซิมเพล็กซ์
คุณใช้วิธีนี้ไปแล้วในบทที่ 1 อัลกอริธึมแบบซิมเพล็กซ์ ถ้าเป็นไปได้ จะทำงานได้เร็วกว่าอัลกอริธึมอื่น แต่ไม่สามารถใช้ในการคำนวณรูต สี่เหลี่ยม และฟังก์ชันอื่นที่ไม่ใช่เชิงเส้นได้ เช่นเดียวกับที่ไร้ประโยชน์คือ OpenSolver ซึ่งใช้อัลกอริธึมแบบซิมเพล็กซ์ แม้ว่าจะดูเหมือนว่าจะใช้สเตียรอยด์ก็ตาม
ในกรณีของเรา อัลกอริธึมวิวัฒนาการที่สร้างขึ้นใน Search for a Solution ใช้การผสมผสานระหว่างการค้นหาแบบสุ่มและโซลูชัน "ครอสโอเวอร์" ที่ยอดเยี่ยมเพื่อค้นหาโซลูชันที่มีประสิทธิภาพ เช่นเดียวกับวิวัฒนาการในบริบททางชีววิทยา
คุณมีทุกสิ่งที่จำเป็นในการตั้งค่างานก่อน "ค้นหาวิธีแก้ปัญหา":
- เป้าหมาย: เพื่อลดระยะทางรวมจากผู้ซื้อไปยังศูนย์กลางคลัสเตอร์ (A36);
- ตัวแปร: เวกเตอร์ของแต่ละธุรกรรมที่สัมพันธ์กับศูนย์คลัสเตอร์ (Н2:К33);
- เงื่อนไข: ศูนย์คลัสเตอร์ต้องมีค่าระหว่าง 0 ถึง 1
แนะนำให้ใช้ "ค้นหาวิธีแก้ปัญหา" และค้อน เราตั้งค่าภารกิจ "กำลังค้นหาวิธีแก้ปัญหา": เพื่อลดขนาด A36 โดยเปลี่ยนค่าของ H2:K33 ด้วยเงื่อนไข H2:K33<=1, как и все векторы сделок. Убедитесь, что переменные отмечены как положительные и выбран эволюционный алгоритм (рис. 17).
ข้าว. 17.การตั้งค่า Solver สำหรับการทำคลัสเตอร์ 4-Clustering
แต่การตั้งเป้าหมายไม่ใช่ทุกอย่าง คุณจะต้องเหนื่อยเล็กน้อยโดยเลือกตัวเลือกที่จำเป็นสำหรับอัลกอริธึมวิวัฒนาการโดยคลิกปุ่ม "พารามิเตอร์" ในหน้าต่าง "ค้นหาวิธีแก้ปัญหา" และไปที่หน้าต่างการตั้งค่า ฉันแนะนำให้คุณตั้งเวลาสูงสุดเป็นอีก 30 วินาที ขึ้นอยู่กับว่าคุณยินดีที่จะรอ "ค้นหาวิธีแก้ปัญหา" นานแค่ไหนเพื่อรับมือกับงานของมัน ในรูป 18 ฉันตั้งค่าของฉันเป็น 600 วินาที (10 นาที) ด้วยวิธีนี้ ฉันสามารถเรียกใช้ "Search for a Solution" และไปรับประทานอาหารกลางวันได้ และหากคุณรู้สึกอยากยกเลิกมันตั้งแต่เนิ่นๆ เพียงกด Escape แล้วออกด้วยทางออกที่ดีที่สุดที่จะหาได้
ข้าว. สิบแปดพารามิเตอร์อัลกอริทึมวิวัฒนาการ
คลิกเรียกใช้และดู Excel ทำสิ่งนั้นจนกว่าอัลกอริธึมวิวัฒนาการมาบรรจบกัน
ความหมายของผลลัพธ์
ทันทีที่ "ค้นหาวิธีแก้ปัญหา" ให้ศูนย์คลัสเตอร์ที่เหมาะสมที่สุด ความสนุกก็เริ่มขึ้น ไปต่อกันที่กลุ่มกันเลย! ในรูป ในรูปที่ 19 เราจะเห็นว่า Solver พบระยะทางรวมที่เหมาะสมที่สุดที่ 140.7 และศูนย์กลางคลัสเตอร์ทั้งสี่แห่ง - ด้วยการจัดรูปแบบตามเงื่อนไข! - ดูแตกต่างอย่างสิ้นเชิง
ข้าว. 19.ศูนย์คลัสเตอร์ที่ดีที่สุดสี่แห่ง
โปรดทราบว่าศูนย์คลัสเตอร์ของคุณอาจแตกต่างจากที่นำเสนอในหนังสือ เนื่องจากอัลกอริธึมวิวัฒนาการใช้ตัวเลขสุ่มและคำตอบจะแตกต่างกันในแต่ละครั้ง คลัสเตอร์อาจแตกต่างไปจากเดิมอย่างสิ้นเชิงหรือมีแนวโน้มมากกว่าในลำดับที่ต่างกัน (เช่น คลัสเตอร์ 1 ของฉันอาจอยู่ใกล้กับคลัสเตอร์ 4 ของคุณมาก เป็นต้น)
เนื่องจากคุณแทรกคำอธิบายทางการค้าในคอลัมน์ B ถึง G เมื่อคุณสร้างชีต คุณจึงสามารถอ่านรายละเอียดในรูปที่ 19 ซึ่งเป็นสิ่งสำคัญในการทำความเข้าใจแนวคิดของคลัสเตอร์เซ็นเตอร์
สำหรับคลัสเตอร์ 1 ในคอลัมน์ H การจัดรูปแบบตามเงื่อนไขจะเลือกดีล 24, 26, 17 และ 2 ในระดับที่น้อยกว่า เมื่ออ่านคำอธิบายของดีลเหล่านี้ คุณจะเห็นสิ่งที่เหมือนกันทั้งหมด: ทำทั้งหมดบน Pinot นัวร์
เมื่อดูที่คอลัมน์ I คุณจะเห็นว่าเซลล์สีเขียวทั้งหมดมีจำนวนขั้นต่ำที่ต่ำ เหล่านี้เป็นผู้ซื้อที่ไม่เต็มใจที่จะซื้อล็อตใหญ่ระหว่างการทำธุรกรรม
แต่อีกสองศูนย์คลัสเตอร์ พูดตามตรง ยากที่จะตีความ แทนที่จะตีความคลัสเตอร์เซ็นเตอร์ ให้มองที่ตัวผู้ซื้อในคลัสเตอร์และตัดสินใจว่าพวกเขาชอบดีลประเภทไหน? สิ่งนี้อาจนำมาซึ่งความชัดเจนในประเด็น
การให้คะแนนดีลโดยวิธีคลัสเตอร์
แทนที่จะค้นหาว่าศูนย์กลางคลัสเตอร์ใดอยู่ใกล้กับ 1 มากที่สุด ให้ตรวจสอบว่าใครเชื่อมโยงกับคลัสเตอร์ใดและดีลใดที่พวกเขาต้องการ
ในการดำเนินการนี้ ให้เริ่มต้นด้วยการคัดลอกเอกสารข้อมูลข้อเสนอ มาเรียกสำเนา 4MS - TopDealsByCluster นับคอลัมน์จาก H ถึง K บนแผ่นงานใหม่นี้ตั้งแต่ 1 ถึง 4 (ดังในรูปที่ 20)
ข้าว. ยี่สิบ.การสร้างตารางชีตสำหรับคำนวณความนิยมของดีลโดยใช้คลัสเตอร์
ในชีต 4MC คุณมีคลัสเตอร์แองเคอร์ตั้งแต่ 1 ถึง 4 ในแถวที่ 39 สิ่งที่คุณต้องทำเพื่อนับดีลตามคลัสเตอร์คือดูชื่อคอลัมน์จาก H ถึง K บนชีต 4MC - TopDealsByCluster ดูว่าเวิร์กชีต 4MS ใด ผูกกับคลัสเตอร์นี้ในแถวที่ 39 แล้วเพิ่มจำนวนธุรกรรมในแต่ละแถว ดังนั้น เราจะได้รับจำนวนผู้ซื้อทั้งหมดในกลุ่มนี้ที่ทำธุรกรรม
มาเริ่มกันที่เซลล์ H2 ซึ่งประกอบด้วยจำนวนผู้ซื้อคลัสเตอร์ 1 ที่ยอมรับข้อเสนอหมายเลข 1 คือ malbec มกราคม คุณต้องเพิ่มค่าของเซลล์ในช่วง L2: DG2 บนชีต 4MC แต่เฉพาะลูกค้าจาก 1 คลัสเตอร์ ซึ่งเป็นตัวอย่างคลาสสิกของการใช้สูตร sumif / sumif ดูเหมือนว่านี้:
SUMIF("4MC"!$L$39:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)
=CyMMEOra("4MC"!$L$39:$DG$39,"4MC - TopDealsByCluster"! H$1,"4MC"!$L2:$DG2)
สูตรนี้ทำงานดังนี้: คุณระบุค่าตามเงื่อนไขบางอย่าง ซึ่งจะตรวจสอบในส่วนแรกของ "4MC"!$L$39:$DG$39,"4MC แล้วเปรียบเทียบกับ 1 ในส่วนหัวของคอลัมน์ ("4MC - TopDealsByCluster"! H$1 ) จากนั้น สำหรับแต่ละคู่ที่ตรงกัน จะเพิ่มค่านั้นให้กับแถวที่ 2 ในส่วนที่สามของสูตร "4MC"!$L2:$DG2
โปรดทราบว่าคุณได้ใช้การอ้างอิงแบบสัมบูรณ์ ($ ในสูตร) ก่อนสิ่งใดก็ตามที่เกี่ยวข้องกับการรวมคลัสเตอร์ หมายเลขแถวในส่วนหัวของคอลัมน์ และตัวอักษรประจำคอลัมน์สำหรับการซื้อขายที่เสร็จสมบูรณ์ เมื่อทำให้ลิงก์เหล่านี้เป็นค่าสัมบูรณ์ คุณสามารถลากสูตรไปที่ใดก็ได้จาก H2:K33 เพื่อคำนวณจำนวนดีลสำหรับศูนย์คลัสเตอร์อื่นๆ และการรวมดีล ดังในรูปที่ 2 21. เพื่อให้คอลัมน์เหล่านี้อ่านง่ายขึ้น คุณสามารถใช้การจัดรูปแบบตามเงื่อนไขกับคอลัมน์เหล่านี้ได้
ข้าว. 21.จำนวนดีลทั้งหมดต่อข้อเสนอ แยกตามคลัสเตอร์
โดยการเลือกคอลัมน์ A ถึง K และใช้การกรองอัตโนมัติ คุณสามารถจัดเรียงข้อมูลนี้ได้ โดยการจัดเรียงคอลัมน์ H จากน้อยไปมาก คุณจะเห็นว่าธุรกรรมใดได้รับความนิยมมากที่สุดในคลัสเตอร์ 1 (รูปที่ 22)
ข้าว. 22.การเรียงลำดับคลัสเตอร์ 1. Pinot, Pinot, Pinot!
ดังที่ฉันได้กล่าวไว้ก่อนหน้านี้ การซื้อขายที่ใหญ่ที่สุดสี่รายการสำหรับคลัสเตอร์นี้คือพินอส พวกเหล่านี้กำลังดูถูกหนังไซด์เวย์อย่างชัดเจน หากคุณจัดเรียงคลัสเตอร์ 2 จะค่อนข้างชัดเจนสำหรับคุณว่าเหล่านี้เป็นผู้ซื้อขายส่งรายย่อย (รูปที่ 23)
แต่เมื่อคุณจัดเรียงคลัสเตอร์ 3 มันไม่ง่ายเลยที่จะเข้าใจอะไร ข้อตกลงขนาดใหญ่สามารถนับได้เพียงนิ้วเดียว และความแตกต่างระหว่างข้อตกลงเหล่านี้กับส่วนที่เหลือไม่ชัดเจนนัก อย่างไรก็ตาม ดีลที่ได้รับความนิยมมากที่สุดยังคงมีบางอย่างที่เหมือนกัน เช่น ส่วนลดที่ค่อนข้างดี 5 ใน 6 ดีลที่ใหญ่ที่สุดคือสปาร์กลิงไวน์ และฝรั่งเศสเป็นผู้ผลิต 3 ใน 4 ดีล อย่างไรก็ตาม ข้อสันนิษฐานเหล่านี้ไม่ชัดเจน
สำหรับคลัสเตอร์ 4 คนเหล่านี้เห็นได้ชัดว่าชอบข้อเสนอสำหรับแชมเปญในเดือนสิงหาคมด้วยเหตุผลบางอย่าง นอกจากนี้ 5 ใน 6 ธุรกรรมที่ใหญ่ที่สุดสำหรับไวน์ฝรั่งเศส และ 9 ใน 10 ดีลที่ใหญ่ที่สุดสำหรับสินค้าปริมาณมาก บางทีนี่อาจเป็นกลุ่มขายส่งขนาดใหญ่ที่มุ่งสู่ไวน์ฝรั่งเศส จุดตัดของกลุ่ม 3 และ 4 ก็น่าเป็นห่วงเช่นกัน
เป็นที่นิยม
- แผนธุรกิจ: วิธีการเปิดธุรกิจรถโดยสารประจำทาง
- เปิดฟาร์มนกกระทา
- วิธีการเปิดฟาร์มตั้งแต่เริ่มต้น
- เป็ดมัลลาร์ด: ตัวชี้วัดหลักและคุณสมบัติ
- การทดสอบทดลองในรูปแบบ OGE ในสังคมศึกษา (เกรด 9)
- แผนธุรกิจร้านขายชุดคลุมท้อง
- Ducks Indian Runner: ตัวชี้วัดหลักและลักษณะ
- เลี้ยงเป็ดที่บ้าน
- ฉันจะแก้ปัญหาจูสังคมศึกษา OGE ในสังคมศึกษา
- เป็ดพันธุ์เนื้อดีที่สุด