การทำเหมืองข้อมูลด้วย Rapidminer Studio 6
วันที่เขียน 9/9/2558 15:31:49     แก้ไขล่าสุดเมื่อ 21/5/2569 12:51:21
เปิดอ่าน: 8873 ครั้ง

โปรแกรม Rapidminer Studio ๖ เป็นเครื่องที่ใช้ในการวิเคราะห์ข้อมูลที่มีขนาดใหญ่หรือเหมืองข้อมูล และสามารถทำการวิเคราะห์ข้อมูลแบบต่างๆ ได้ เช่น - การจำแนกชนิดข้อมูล - การจัดกลุ่มข้อมูล เป็นต้น

เหมืองข้อมูล (Data mining)

เป็นกระบวนการ (Process) ที่กระทำกับข้อมูลขนาดใหญ่เพื่อค้นหารูปแบบ แนวทาง และความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อมูลนั้นโดยอาศัยหลักสถิติ การรู้จำ การเรียนรู้ของเครื่อง และหลักคณิตศาสตร์เพื่อให้ได้สารสนเทศที่เราไม่รู้ออกมา โดยสารสนเทศที่ได้จะมีเหตุผลและสามารถนำไปใช้ประโยชน์ได้

เทคนิคต่าง ๆ ของ Data Mining
 

 1. Association rule Discovery

หลักการทำงาน คือ การค้นหาความสัมพันธ์ของข้อมูลจากข้อมูลขนาดใหญ่ที่มีอยู่ เพื่อนำไปวิเคราะห์ หรือทำนายปรากฏการณ์ต่าง ๆ เช่น การวิเคราะห์การซื้อสินค้าของลูกค้าเรียกว่า “Market Basket Analysis”
 2. Classification & Prediction

เป็นการแบ่งประเภทของข้อมูล โดยจะหากฎเพื่อระบุประเภทวัตถุจากคุณสมบัติของวัตถุ

 3. Database Clustering Or Segmentation

เป็นเทคนิคการลดขนาดของข้อมูล ด้วยการรวมกลุ่มตัวแปรที่มีลักษณะเดียวกันไว้ด้วยกัน เพื่อนำข้อมูลที่ได้ไปวิเคราะห์

ส่วนประกอบที่สำคัญของระบบการทำเหมืองข้อมูล 

  • Database & Data Warehouse เป็นแหล่งที่เก็บข้อมูลอื่นๆ เช่น แฟ้มข้อมูล สเปรดชีท ซึ่งเป็นแหล่งที่เก็บข้อมูลดิบสำหรับการทำเหมืองข้อมูล
  • Database/Data Warehouse server ทำหน้าที่นำเข้าข้อมูลตามคำขอของผู้ใช้
  • Knowledge base ได้แก่

–                  ความรู้ในงานที่ทำจะเป็นประโยชน์ต่อการชี้นำทางการสืบค้น หรือการประเมินความน่าสนใจของรูปแบบผลลัพธ์ที่ได้ โดยเป็นความรู้เฉพาะด้านในงานที่ทำ เช่น ความรู้เฉพาะทางการแพทย์ หรือดาราศาสตร์ เป็นต้น

  • Data Mining Engine เป็นส่วนประกอบหลัก ประกอบด้วยโมดูล (Modules) ซึ่งรับผิดชอบงานทำเหมืองประเภทต่างๆ ได้แก่ การหากฎความสัมพันธ์ การจำแนกประเภท การจัดกลุ่ม เป็นต้น
  • Pattern Evaluation Module ทำงานร่วมกับ Data Mining Engine โดยใช้ค่าขีดแบ่งมาตรวัดความน่าสนใจในการกลั่นกรองรูปแบบผลลัพธ์ที่ได้ ซึ่งใช้ประเมินความน่าสนใจของรูปแบบการทำเหมืองที่ได้
  • Graphical User Interface ส่วนติดต่อประสานระหว่างผู้ใช้กับระบบทำเหมือง ซึ่งช่วยให้ผู้ใช้สามารถระบุงานทำเหมืองที่ต้องการ

กลยุทธ์ในการทำเหมืองข้อมูล

  1. แบบจำลองในการทำนาย (Predictive/ Supervised Modeling) เป็นผลลัพธ์ที่สร้างจากการอนุมาน (Inference) ชุดข้อมูลปัจจุบัน เพื่อใช้ในการทำนายประเภทตัวอย่างในอนาคต

    2. แบบจำลองในการบรรยาย (Descriptive/ Unsupervised Modeling) ในที่นี้ อาจเป็นการหาความสัมพันธ์ต่างๆ (Association) หรือหาการจัดกลุ่มข้อมูล (Clustering) ซึ่งไม่ได้มีจุดมุ่งหมายเพื่อการทำนาย

 

 

คำสำคัญ :
กลุ่มบทความ :
หมวดหมู่ :
แชร์ :
https://erp.mju.ac.th/acticleDetail.aspx?qid=424
ความคิดเห็นทั้งหมด (0)
ไม่มีข้อมูลตามเงื่อนไขที่ท่านกำหนด
รายการบทความการแลกเปลี่ยนเรียนรู้หมวดหมู่ : กลุ่มงานสายวิชาการ
ความรู้สำหรับพัฒนาความเป็นอาจารย์ยุคใหม่ » Green Office ไม่ใช่แค่เรื่องสิ่งแวดล้อม…แต่คือวัฒนธรรมการทำงานของมหาวิทยาลัยยุคใหม่: บทเรียนจากการอบรมทบทวนความรู้สำนักงานสีเขียว ที่ทำให้มอง “ที่ทำงาน” เปลี่ยนไป
บทความนี้เป็นการสะท้อนองค์ความรู้และประสบการณ์จากการเข้าร่วม “โครงการอบรมทบทวนความรู้สำนักงานสีเขียว (Green Office)” ซึ่งมหาวิทยาลัยแม่โจ้จัดขึ้นสำหรับบุคลากร เมื่อวันที่ 14 พฤษภาคม 2569 โดยมีเนื้อ...
Green Office  การลดก๊าซเรือนกระจก  มหาวิทยาลัยสีเขียว     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานสายวิชาการ
ผู้เขียน อัณชยารัศมิ์ เนาว์โสภา  วันที่เขียน 20/5/2569 19:07:05  แก้ไขล่าสุดเมื่อ 21/5/2569 8:33:30   เปิดอ่าน 6  ครั้ง | แสดงความคิดเห็น 0  ครั้ง
ความรู้จากการนำเสนอผลงานทางวิชาการ » หนังสือและ ตำรา การเริ่มต้นงานเขียนอย่างมีคุณภาพ
โครงการอบรมเชิงปฏิบัติการ การเขียนหนังสือและตำราเพื่อประกอบการขอตำแหน่งทางวิชาการ 30 พฤศจิกายน 2568 โดย ศาสตราจารย์ปิยะแสง จันทรวงศ์ไพศาล มหาวิทยาลัยศิลปากร ได้รับความรู้เรื่องโครงสร้าง หนังสือแ...
หนังสือ ตำรา แตกต่าง     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานสายวิชาการ
ผู้เขียน สุภาพร แสงศรีจันทร์  วันที่เขียน 6/5/2569 12:35:34  แก้ไขล่าสุดเมื่อ 20/5/2569 9:17:01   เปิดอ่าน 39  ครั้ง | แสดงความคิดเห็น 0  ครั้ง
การเผยแพร่ความรู้ที่ได้จากการเข้าร่วมประชุมวิชาการ/อบรม/สัมมนา » การประชุมวิชาการระดับชาติ วิทยาศาสตร์ เทคโนโลยี และนวัตกรรม (มหาวิทยาลัยแม่โจ้) ครั้งที่ 7
การประชุมวิชาการระดับชาติ วิทยาศาสตร์ เทคโนโลยี และนวัตกรรม (มหาวิทยาลัยแม่โจ้) ครั้งที่ 7 ในวันที่ 27 มีนาคม 2569 ณ คณะวิทยาศาสตร์ มหาวิทยาลัยแม่โจ้ ซึ่งจัดโดยคณะวิทยาศาสตร์ คณะเทคโนโลยีการประมงแ...
การประชุมวิชาการ  คณิตศาสตร์  วิทยาศาสตร์     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานสายวิชาการ
ผู้เขียน พิกุล ศรีดารัตน์  วันที่เขียน 3/5/2569 21:03:47  แก้ไขล่าสุดเมื่อ 20/5/2569 20:14:35   เปิดอ่าน 2082  ครั้ง | แสดงความคิดเห็น 0  ครั้ง
การเผยแพร่ความรู้ที่ได้จากการเข้าร่วมประชุมวิชาการ/อบรม/สัมมนา » การประชุมวิชาการระดับชาติ วิทยาศาสตร์ เทคโนโลยี และนวัตกรรม (มหาวิทยาลัยแม่โจ้) ครั้งที่ 7
การประชุมวิชาการระดับชาติ วิทยาศาสตร์ เทคโนโลยี และนวัตกรรม (มหาวิทยาลัยแม่โจ้) ครั้งที่ 7 ในวันที่ 27 มีนาคม 2569 ณ คณะวิทยาศาสตร์ มหาวิทยาลัยแม่โจ้ ซึ่งจัดโดยคณะวิทยาศาสตร์ คณะเทคโนโลยีการประมงแ...
การประชุมวิชาการ  คณิตศาสตร์  วิทยาศาสตร์     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานสายวิชาการ
ผู้เขียน พิกุล ศรีดารัตน์  วันที่เขียน 3/5/2569 21:03:45  แก้ไขล่าสุดเมื่อ 20/5/2569 18:43:01   เปิดอ่าน 53  ครั้ง | แสดงความคิดเห็น 0  ครั้ง
ความรู้สำหรับพัฒนาความเป็นอาจารย์ยุคใหม่ » เขียนผลวิจัยอย่างไร…ไม่ให้กรรมการงง: บทเรียนจากห้องอบรมที่อยากเล่าให้เพื่อนอาจารย์ฟัง
บทความนี้เป็นการสะท้อนการเรียนรู้จากการอบรมออนไลน์เรื่อง “หลักการเขียนผลการวิจัย อภิปรายผล และข้อเสนอแนะ” ซึ่งมุ่งเน้นการพัฒนาทักษะการเขียนบทความวิจัยให้มีคุณภาพและสอดคล้องกับมาตรฐานสากล โดยพบว่า ก...
การเขียนผลการวิจัย  การอภิปรายผล  อาจารย์นักวิจัย     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานสายวิชาการ
ผู้เขียน อัณชยารัศมิ์ เนาว์โสภา  วันที่เขียน 3/5/2569 14:30:22  แก้ไขล่าสุดเมื่อ 20/5/2569 18:43:06   เปิดอ่าน 50  ครั้ง | แสดงความคิดเห็น 0  ครั้ง