การวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining โดยซอฟต์แวร์ RapidMiner Studio 6
วันที่เขียน 5/9/2559 16:48:07     แก้ไขล่าสุดเมื่อ 16/7/2567 14:27:27
เปิดอ่าน: 11186 ครั้ง

ข้อมูลในปัจจุบันมีเป็นจำนวนมากเพื่อให้เกิดประโยชน์มากที่สุดเราจำเป็นต้องนำข้อมูลเหล่านี้มาทำการวิเคราะห์ ซึ่งเทคนิคหนึ่งที่ได้รับการนิยมอย่างสูงในปัจจุบัน คือ เทคนิค Data Mining

 ข้าพเจ้า นางสาวศริญณา มาปลูก ได้ทำการเข้าร่วมอบรมเชิงปฏิบัติการหลักสูตร การวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining โดยซอฟต์แวร์ RapidMiner Studio 6 วันที่ 17 ถึง 19 มีนาคม พ.ศ. 2559 ณ เค ยู โฮม มหาวิทยาลัยเกษตรศาสตร์ วิทยาเขตบางเขน ได้ความรู้ ดังนี้

ในปัจจุบันข้อมูลมีเป็นจำนวนมากทำให้เกิดความต้องการนำข้อมูลเหล่านี้มาใช้เพื่อก่อให้เกิดประโยชน์มากที่สุด วิธีการหนึ่งที่นิยมใช้กันมากในปัจจุบันคือการวิเคราะห์หาความสัมพันธ์ที่ซ่อนอยู่ในข้อมูล วิธีการนี้คือ การทำเหมืองข้อมูล (data mining) ซึ่งโปรแกรมที่เราใช้คือ ซอฟต์แวร์ RapidMiner Studio 6 ซึ่งเป็นโปรแกรมที่ฟรี ไม่เสียค่าใช้จ่าย

การสร้างโมเดล Ensemble แบบต่างๆ

เทคนิค Ensemble เป็นเทคนิคที่ใช้โมเดล classification หลายๆ โมเดล (model) มาช่วยในการหาคำตอบ เทคนิคนี้ได้เป็นเทคนิคที่มีประสิทธิภาพสูงซึ่งพบได้จากการแข่งขันต่างๆ เช่น Netflix ที่ผู้ชนะมักจะใช้เทคนิค Ensemble นี้  หรือในงานวิจัยต่างๆ ครับ เช่น งานวิจัยเรื่อง Bagging Model with Cost Sensitive Analysis on Diabetes Data หรือ Boosting-based ensemble learning with penalty profiles for automatic Thai unknown word recognition

หลักการของเทคนิค Ensemble แบบง่ายๆ 3 เทคนิค นั่นคือ

Vote Ensemble

เป็นการใช้เทรนนิ่ง ดาต้า (training data) ชุดเดียวกันแต่สร้างโมเดลด้วยเทคนิคต่าง ๆ กัน

Bootstrap Aggregating (Bagging)

 เป็นการสุ่มเทรนนิ่ง ดาต้า (training data) ให้เป็นหลายชุด แต่สร้างโมเดลด้วยเทคนิคเดียวกันทั้งหมด

Random Forest

เป็นเทคนิคที่คล้ายๆ กับ Bagging แต่แทนที่จะสุ่มข้อมูลอย่างเดียวก็ทำการสุ่มเลือกแอตทริบิวต์ (ฟีเจอร์) ต่างๆ ออกมาเป็นหลายๆ ชุดด้วย และสร้างโมเดลด้วยเทคนิค Decision Tree หลายๆ ต้น

ข้อมูลที่ใช้ในการสร้างโมเดลเราจะเรียกว่า เทรนนิ่ง ดาต้า (training data) ซึ่งจะประกอบด้วยแอตทริบิวต์ทั่วไป (หรือตัวแปรต้นในทางสถิติ) และแอตทริบิวต์ประเภทลาเบล (label) หรือ คลาส (class) คำตอบที่เราสนใจให้โมเดลทำนาย (predict) ออกมา (หรือตัวแปรตามในทางสถิติ)

การสร้างโมเดลสามารถแบ่งได้เป็น 2 ขั้นตอนย่อย คือ

การสร้างโมเดล (build model) เป็นการนำเทรนนิ่ง ดาต้า มาสร้างโมเดลซึ่งในขั้นตอนนี้ควรจะมีการวัดประสิทธิภาพของโมเดลก่อนนำไปใช้งาน

การนำโมเดลไปใช้งาน (apply model) เป็นการนำโมเดลที่สร้างได้ไปใช้ทำนายหรือหาคำตอบให้กับข้อมูลใหม่ซึ่งยังไม่รู้คลาสคำตอบ

คำสำคัญ :
กลุ่มบทความ :
หมวดหมู่ :
แชร์ :
https://erp.mju.ac.th/acticleDetail.aspx?qid=579
ความคิดเห็นทั้งหมด (0)
ไม่มีข้อมูลตามเงื่อนไขที่ท่านกำหนด
รายการบทความการแลกเปลี่ยนเรียนรู้หมวดหมู่ : กลุ่มงานสายวิชาการ
การจัดสอบระบบ Dugga » เรียนรู้การใช้งานระบบ Dugga - Digital Assessment Platform
Dugga - Digital Assessment Platform (https://www.dugga.com) เป็นโปรแกรมที่ช่วยในการสอบ บนโลกออนไลน์ ให้สะดวก ปลอดภัยมากขึ้น แนวทางการออกแบบประเภทคำถามมีหลากหลายกว่า 15 ประเภท แนะการจัดการระบบความปล...
AI  Dugga  Exam     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานสายวิชาการ
ผู้เขียน ฐิติพรรณ ฉิมสุข  วันที่เขียน 9/7/2567 12:31:51  แก้ไขล่าสุดเมื่อ 16/7/2567 11:47:10   เปิดอ่าน 26  ครั้ง | แสดงความคิดเห็น 0  ครั้ง
การเผยแพร่ความรู้ที่ได้จากการเข้าร่วมประชุมวิชาการ/อบรม/สัมมนา » โครงการส่งเสริมศักยภาพบุคลากรในการยื่นขอตำแหน่งทางวิชาการ เรื่อง หลักเกณฑ์การเข้าสู่ตำแหน่งวิชาการ การวิจัย จริยธรรมการวิจัย และการตีพิมพ์ผลงาน
โครงการส่งเสริมศักยภาพบุคลากรในการยื่นขอตำแหน่งทางวิชาการ เรื่อง หลักเกณฑ์การเข้าสู่ตำแหน่งวิชาการ การวิจัย จริยธรรมการวิจัย และการตีพิมพ์ผลงาน วิทยากรโดย ศาสตราจารย์ ดร.ทนงเกียรติ เกียรติศิริโรจน์...
การขอตำแหน่งทางวิชาการ  การตีพิมพ์ผลงาน  จริยธรรมการวิจัย     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานสายวิชาการ
ผู้เขียน พิกุล ศรีดารัตน์  วันที่เขียน 7/7/2567 15:01:14  แก้ไขล่าสุดเมื่อ 16/7/2567 7:01:51   เปิดอ่าน 23  ครั้ง | แสดงความคิดเห็น 0  ครั้ง
การจัดการองค์ความรู้ที่ได้จากการเข้าร่วมประชุม อบรม สัมมนา » หลักเกณฑ์การเข้าสู่ตำแหน่งวิชาการ การวิจัย จริยธรรมการวิจัย และการตีพิมพ์ผลงาน
หลักเกณฑ์การเข้าสู่ตำแหน่งวิชาการ การวิจัย จริยธรรมการวิจัย และการตีพิมพ์ผลงาน บรรยายโดย ศาสตราจารย์ ดร.ทนงเกียรติ เกียรติศิริโรจน์ กรรมการ กพว มหาวิทยาลัยแม่โจ้ ได้ให้เกียรติบรรยายเกี่ยวกับ หลักเก...
ตำแหน่งทางวิชาการ  ประกาศ ก.พ.อ.     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานสายวิชาการ
ผู้เขียน ศิรศักดิ์ ศศิวรรณพงศ์  วันที่เขียน 28/6/2567 15:15:17  แก้ไขล่าสุดเมื่อ 15/7/2567 2:37:51   เปิดอ่าน 46  ครั้ง | แสดงความคิดเห็น 0  ครั้ง
การจัดการองค์ความรู้ที่ได้จากการเข้าร่วมประชุม อบรม สัมมนา » ความเข้าใจที่อาจคลาดเคลื่อนเกี่ยวกับ OBE
เป็นประเด็นที่ผู้ประเมินอาจเกิดความเข้าใจที่คลาดเคลื่อนเกี่ยวกับ OBE โดยที่ประเด็นต่าง ๆ ที่นำมาเป็นกรณีศึกษา เพื่อใช้ในการเป็นผู้ประเมินเพื่อใช้ในการประเมินคุณภาพการศึกษาภายใน ให้เป็นไปในทิศทางเดี...
AUNQA  OBE  ประกันคุณภาพการศึกษา     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานสายวิชาการ
ผู้เขียน ศิรศักดิ์ ศศิวรรณพงศ์  วันที่เขียน 28/6/2567 15:04:09  แก้ไขล่าสุดเมื่อ 15/7/2567 4:48:37   เปิดอ่าน 42  ครั้ง | แสดงความคิดเห็น 0  ครั้ง