การวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining โดยซอฟต์แวร์ RapidMiner Studio 6

ศริญณา มาปลูก

ศริญณา มาปลูก

วันที่เขียน 5/9/2559 16:48:07 แก้ไขล่าสุดเมื่อ 28/2/2569 13:48:39

เปิดอ่าน: 11849 ครั้ง

ข้อมูลในปัจจุบันมีเป็นจำนวนมากเพื่อให้เกิดประโยชน์มากที่สุดเราจำเป็นต้องนำข้อมูลเหล่านี้มาทำการวิเคราะห์ ซึ่งเทคนิคหนึ่งที่ได้รับการนิยมอย่างสูงในปัจจุบัน คือ เทคนิค Data Mining

ข้าพเจ้า นางสาวศริญณา มาปลูก ได้ทำการเข้าร่วมอบรมเชิงปฏิบัติการหลักสูตร การวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining โดยซอฟต์แวร์ RapidMiner Studio 6 วันที่ 17 ถึง 19 มีนาคม พ.ศ. 2559 ณ เค ยู โฮม มหาวิทยาลัยเกษตรศาสตร์ วิทยาเขตบางเขน ได้ความรู้ ดังนี้

ในปัจจุบันข้อมูลมีเป็นจำนวนมากทำให้เกิดความต้องการนำข้อมูลเหล่านี้มาใช้เพื่อก่อให้เกิดประโยชน์มากที่สุด วิธีการหนึ่งที่นิยมใช้กันมากในปัจจุบันคือการวิเคราะห์หาความสัมพันธ์ที่ซ่อนอยู่ในข้อมูล วิธีการนี้คือ การทำเหมืองข้อมูล (data mining) ซึ่งโปรแกรมที่เราใช้คือ ซอฟต์แวร์ RapidMiner Studio 6 ซึ่งเป็นโปรแกรมที่ฟรี ไม่เสียค่าใช้จ่าย

การสร้างโมเดล Ensemble แบบต่างๆ

เทคนิค Ensemble เป็นเทคนิคที่ใช้โมเดล classification หลายๆ โมเดล (model) มาช่วยในการหาคำตอบ เทคนิคนี้ได้เป็นเทคนิคที่มีประสิทธิภาพสูงซึ่งพบได้จากการแข่งขันต่างๆ เช่น Netflix ที่ผู้ชนะมักจะใช้เทคนิค Ensemble นี้ หรือในงานวิจัยต่างๆ ครับ เช่น งานวิจัยเรื่อง Bagging Model with Cost Sensitive Analysis on Diabetes Data หรือ Boosting-based ensemble learning with penalty profiles for automatic Thai unknown word recognition

หลักการของเทคนิค Ensemble แบบง่ายๆ 3 เทคนิค นั่นคือ

Vote Ensemble

เป็นการใช้เทรนนิ่ง ดาต้า (training data) ชุดเดียวกันแต่สร้างโมเดลด้วยเทคนิคต่าง ๆ กัน

Bootstrap Aggregating (Bagging)

เป็นการสุ่มเทรนนิ่ง ดาต้า (training data) ให้เป็นหลายชุด แต่สร้างโมเดลด้วยเทคนิคเดียวกันทั้งหมด

Random Forest

เป็นเทคนิคที่คล้ายๆ กับ Bagging แต่แทนที่จะสุ่มข้อมูลอย่างเดียวก็ทำการสุ่มเลือกแอตทริบิวต์ (ฟีเจอร์) ต่างๆ ออกมาเป็นหลายๆ ชุดด้วย และสร้างโมเดลด้วยเทคนิค Decision Tree หลายๆ ต้น

ข้อมูลที่ใช้ในการสร้างโมเดลเราจะเรียกว่า เทรนนิ่ง ดาต้า (training data) ซึ่งจะประกอบด้วยแอตทริบิวต์ทั่วไป (หรือตัวแปรต้นในทางสถิติ) และแอตทริบิวต์ประเภทลาเบล (label) หรือ คลาส (class) คำตอบที่เราสนใจให้โมเดลทำนาย (predict) ออกมา (หรือตัวแปรตามในทางสถิติ)

การสร้างโมเดลสามารถแบ่งได้เป็น 2 ขั้นตอนย่อย คือ

การสร้างโมเดล (build model) เป็นการนำเทรนนิ่ง ดาต้า มาสร้างโมเดลซึ่งในขั้นตอนนี้ควรจะมีการวัดประสิทธิภาพของโมเดลก่อนนำไปใช้งาน

การนำโมเดลไปใช้งาน (apply model) เป็นการนำโมเดลที่สร้างได้ไปใช้ทำนายหรือหาคำตอบให้กับข้อมูลใหม่ซึ่งยังไม่รู้คลาสคำตอบ

คำสำคัญ :

data mining

กลุ่มบทความ :

กลุ่มงานตามสมรรถนะบุคลากร

หมวดหมู่ :

กลุ่มงานสายวิชาการ

แชร์ :

https://erp.mju.ac.th/acticleDetail.aspx?qid=579

ความคิดเห็นทั้งหมด (0)

ไม่มีข้อมูลตามเงื่อนไขที่ท่านกำหนด

รายการบทความการแลกเปลี่ยนเรียนรู้หมวดหมู่ : กลุ่มงานสายวิชาการ

	รายงานสรุปเนื้อหาและการนำไปใช้ประโยชน์จากการเข้าอบรม สัมมนาหรือประชุมวิชาการ » โครงการเสริมประสิทธิภาพการเรียนการสอน ประจำปีงบประมาณ 2569
	โครงการเสริมประสิทธิภาพการเรียนการสอน ประจำปีงบประมาณ 2569 กิจกรรมที่ 1 การอบรมชี้แจงความเข้าใจแบบฟอร์มรายละเอียดหลักสูตร OBE2 และการเตรียมความพร้อมในการจัดทำหลักสูตรปรับปรุง / พัฒนาใหม่ ปี 2570 ใ...
	OBE กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานสายวิชาการ
	ผู้เขียน ศิริพร สมุทรวชิรวงษ์ วันที่เขียน 26/2/2569 11:23:32 แก้ไขล่าสุดเมื่อ 28/2/2569 6:06:04 เปิดอ่าน 18 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง

	การเผยแพร่ความรู้ที่ได้จากการเข้าร่วมงานประชุมวิชาการ/อบรม/สัมมนา » ความรู้ที่ได้จากการเข้าร่วมโครงการอบรมเรื่อง การใช้งานระบบแผนพัฒนารายบุคคลออนไลน์ (IDP Online) ครั้งที่ 1
	โครงการอบรมเรื่อง การใช้งานระบบแผนพัฒนารายบุคคลออนไลน์ (IDP Online) ครั้งที่ 1 ผ่านระบบออนไลน์ MS Teams วันที่ 15 ตุลาคม 2568 เวลา 13:30 - 16:00 น.
	กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานสายวิชาการ
	ผู้เขียน เพชรลดา กันทาดี วันที่เขียน 25/2/2569 20:12:25 แก้ไขล่าสุดเมื่อ 28/2/2569 3:14:11 เปิดอ่าน 16 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง

	การเผยแพร่ความรู้ที่ได้จากการเข้าร่วมงานประชุมวิชาการ/อบรม/สัมมนา » Modern Documentation Data Modelling Beyond the AI Era
	สำหรับหัวข้อ Modern Documentation Data Modelling Beyond the AI Era จะกล่าวถึงการเปลี่ยนแปลงด้านการจัดเก็บข้อมูลในยุค AI ซึ่งจะมีการเปลี่ยนจากระบบฐานข้อมูลเชิงสัมพันธ์ไปเป็น แบบจำลองข้อมูล (Data Mo...
	AI Modern Documentation Data Modelling กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานสายวิชาการ
	ผู้เขียน วรรณวิมล นาดี วันที่เขียน 29/1/2569 13:54:08 แก้ไขล่าสุดเมื่อ 28/2/2569 3:14:11 เปิดอ่าน 69 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง

	การเผยแพร่ความรู้ที่ได้จากการเข้าร่วมงานประชุมวิชาการ/อบรม/สัมมนา » AI กับการทำงานและ Soft skill for IT guys
	AI กับการทำงานและ Soft skill for IT guys จะพูดถึงรูปแบบการจ้างงานที่เปลี่ยนไปหากพนักงานมี Al Literacy โดยนำมาเปรียบเทียบกับการจ้างงานแบบเดิมที่ต้องใช้คนในการบริหารจัดการและในยุค AI ที่มีการใช้ AI ม...
	AI Soft skill for IT guys กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานสายวิชาการ
	ผู้เขียน วรรณวิมล นาดี วันที่เขียน 29/1/2569 13:39:52 แก้ไขล่าสุดเมื่อ 28/2/2569 8:16:57 เปิดอ่าน 68 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง

	การเผยแพร่ความรู้ที่ได้จากการเข้าร่วมงานประชุมวิชาการ/อบรม/สัมมนา » ความรู้ที่ได้จากการเข้าร่วมกิจกรรม : 1. การอบรมชี้แจงทำความเข้าใจแบบฟอร์มรายละเอียดหลักสูตร OBE 2 และ การเตรียมความพร้อมในการจัดทำหลักสูตร ปรับปรุง/พัฒนาใหม่ ปี 2570
	โครงการเสริมประสิทธิภาพการเรียนการสอน ประจำปีงบประมาณ 2569 (กิจกรรม : 1. การอบรมชี้แจงทำความเข้าใจแบบฟอร์มรายละเอียดหลักสูตร OBE 2 และ การเตรียมความพร้อมในการจัดทำหลักสูตร ปรับปรุง/พัฒนาใหม่ ปี 257...
	กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานสายวิชาการ
	ผู้เขียน เพชรลดา กันทาดี วันที่เขียน 28/1/2569 18:07:30 แก้ไขล่าสุดเมื่อ 28/2/2569 3:14:19 เปิดอ่าน 64 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง