ถอดบทเรียน โครงการแลกเปลี่ยนเรียนรู้เพื่อพัฒนาศักยภาพบุคลากร กลุ่มผู้ปฏิบัติงานเทคโนโลยีสารสนเทศ ครั้งที่ 2 : Data Mining
วันที่เขียน 9/4/2558 11:32:36     แก้ไขล่าสุดเมื่อ 21/11/2567 21:05:28
เปิดอ่าน: 4256 ครั้ง

เนื่องด้วยปัจจุบันเป็นยุคที่ข้อมูลสารสนเทศมีความสำคัญ การเผยแพร่และสื่อสารข้อมูล ข่าวสาร ที่ตรงกับความต้องการของผู้ใช้จึงเป็นสิ่งจำเป็น การประยุกต์เทคโนโลยีสารสนเทศเพื่อช่วยในการสื่อสารข้อมูลจำนวนมากให้แก่ผู้ใช้ เช่น การให้บริการเว็บไซต์เพื่อเผยแพร่ข้อมูลข่าวสารและแลกเปลี่ยนความรู้ จึงเป็นเครื่องมือที่สำคัญในการสื่อสารข้อมูลถึงผู้ใช้จำนวนมาก ดังนั้นการศึกษาเกี่ยวกับพฤติกรรมของผู้ใช้บริการเว็บไซต์ จะช่วยให้องค์กรสามารถนำข้อมูลมาใช้ในการวางแผนพัฒนาเว็บไซต์ ให้ตรงกับความต้องการใช้งานหรือใช้ในการวางแผนกลยุทธ์ เพื่อสร้างความได้เปรียบทางการแข่งขัน โดยวิธีการที่ใช้ คือกระบวนการทําเหมืองข้อมูล (Data Mining) ซึ่งเป็นกระบวนการที่กระทํากับข้อมูลจํานวนมากเพื่อค้นหารูปแบบและความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อมูลนั้น ในปัจจุบันการทําเหมืองข้อมูลได้ถูกนําไปประยุกต์ใช้ในงานหลายประเภท ทั้งในด้านธุรกิจที่ช่วยในการตัดสินใจของผู้บริหาร ในด้านวิทยาศาสตร์และการแพทย์รวมทั้งในด้านเศรษฐกิจและสังคม การทําเหมืองข้อมูลเปรียบเสมือนวิวัฒนาการหนึ่งในการจัดเก็บและตีความหมายข้อมูล จากเดิมที่มีการจัดเก็บข้อมูลอย่างง่ายๆ มาสู่การจัดเก็บในรูปฐานข้อมูลที่สามารถดึงข้อมูลสารสนเทศมาใช้จนถึงการทําเหมืองข้อมูลที่สามารถค้นพบความรู้ที่ซ่อนอยู่ในข้อมูล

โครงการแลกเปลี่ยนเรียนรู้เพื่อพัฒนาศักยภาพบุคลากร กลุ่มผู้ปฏิบัติงานเทคโนโลยีสารสนเทศ ครั้งที่ 2 : Data Mining โดยนายสุระพล ริยะนา นักวิชาการคอมพิวเตอร์ชำนาญการพิเศษ ได้แลกเปลี่ยนเรียนรู้เกี่ยวกับ Data Mining ให้กลุ่มผู้ปฏิบัติงานเทคโนโลยีสารสนเทศ เมื่อวันที่ 16 กุมภาพันธ์ 2558 ซึ่งจากการแลกเปลี่ยนเรียนรู้ในครั้งนี้ สามารถถอดบทเรียนได้ ดังนี้
สิ่งที่ได้จากการแลกเปลี่ยนเรียนรู้
1) เครื่องมือที่ใช้ในการจัดทำ Data Mining
    - Pentaho business analysic (BI)
    - Weka สำหรับการทำ ETL Transform Data
    - R สำหรับการวิเคราะห์ค่าสถิติ
    - Data Mining
   
2) ความเป็นมา เป็นการสกัดความรู้จากข้อมูลจำนวนมาก เรียกอีกอย่างว่า Big Data อาจได้ยินด้วยศัพท์อื่นได้แก่ Machine Learning, OLAP, BI

3) ความแตกต่างจากการจัดทำฐานข้อมูลแบบ Normalization
          Normalization เป็นการออกแบบฐานข้อมูลที่เน้นลดความซ้ำซ้อนในการจัดเก็บข้อมูล มีข้อดีในด้านการ Storage ได้แก่คำสั่ง Insert Update Delete แต่ไม่รองรับการ Query Mode คำสั่ง Select ในกรณีของข้อมูลขนาดมหาศาล ซึ่งรูปแบบการทำงานของคำสั่งเป็นในลักษณะของการทำงานด้วยคำสั่ง For Loop ทำให้มีการประมวลผลนานขึ้น เมื่อมีการแยกตาราง ตามหลักการของ Normalization ทำให้ 1 Column ต้องไปเชื่อมโยงกับทุก Column ในตารางที่สัมพันธ์กัน
          Data Mining เป็นการออกแบบฐานข้อมูลที่เน้นการแยกตารางตามประโยชน์ที่ใช้งาน ไม่ได้แยกจากความซ้ำซ้อน จึงเรียกว่า Denormalization โดยจะแยกตารางเป็น 3 กลุ่ม โดยพิจารณาจาก Report และเงื่อนไขการแสดงผลดังนี้
1. Fact Table คือ กลุ่มของตารางข้อมูลที่ใช้ในการประมวลผล
2. Dimension Table คือ กลุ่มของตารางที่ใช้ในมิติของการแสดงผล
3. Measure Table คือ กลุ่มของตารางที่ใช้ในการวัดปริมาณ
        หลักการของ Data Mining คือการสกัดความหมายของข้อมูล มีชั้นตอน ดังนี้
1. Management Data
- Create Data Source แยกตามกลุ่มของตาราง Fact Table, Dimension Table, Measure Table ใช้หลักการออกแบบ Normalization แล้ว Transfer เป็น Data Mining พิจารณาจากความจำเป็น ความต้องการผู้ใช้ และเงื่อนไขการแสดงผล
- Import Data โดยใช้เครื่องมือในการทำงานได้แก่ ETL
2. Report
(ถอดบทเรียน โดยนางสาวณัฐกฤตา โกมลนาค คุณอำนวย)

คำสำคัญ :
กลุ่มบทความ :
หมวดหมู่ :
แชร์ :
https://erp.mju.ac.th/acticleDetail.aspx?qid=373
ความคิดเห็นทั้งหมด (0)
ไม่มีข้อมูลตามเงื่อนไขที่ท่านกำหนด
รายการบทความการแลกเปลี่ยนเรียนรู้หมวดหมู่ : กลุ่มงานเทคโนโลยีสารสนเทศ
กลุ่มงานเทคโนโลยีสารสนเทศ » UX/UI Design ต่างกันอย่างไร
การออกแบบเว็บไซต์ การออกแบบผลิตภัณฑ์และบริการดิจิทัล มีความสำคัญมากขึ้นเป็นอย่างมาก โดยเฉพาะอย่างยิ่งการออกแบบประสบการณ์ผู้ใช้ (User Experience Design: UX Design) และการออกแบบส่วนต่อประสานผู้ใช้ (...
UI Design  UX Design  UX UI  UX/UI  การออกแบบเว็บ     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานเทคโนโลยีสารสนเทศ
ผู้เขียน ช่อทิพย์ สิทธิ  วันที่เขียน 6/9/2567 14:14:09  แก้ไขล่าสุดเมื่อ 21/11/2567 16:01:52   เปิดอ่าน 101  ครั้ง | แสดงความคิดเห็น 0  ครั้ง
การพัฒนาโปรแกรม » การพัฒนาระบบเพื่อลดขั้นตอนการปฏิบัติงาน สำหรับการจัดเก็บและทำลายเอกสาร
การพัฒนาระบบเพื่อลดขั้นตอนการปฏิบัติงาน สำหรับการจัดเก็บและทำลายเอกสาร โดยมีวัตถุประสงค์ เพื่อเพิ่มประสิทธิภาพในการปฏิบัติงาน โดยการนำระบบจัดเก็บและทำลายเอกสารมาช่วยปรับปรุงประสิทธิผล ในกระบวนการทำ...
Re-Design Process?  ระบบจัดเก็บและทำลายเอกสาร     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานเทคโนโลยีสารสนเทศ
ผู้เขียน ณัฐกฤตา โกมลนาค  วันที่เขียน 5/9/2567 11:45:54  แก้ไขล่าสุดเมื่อ 21/11/2567 15:53:41   เปิดอ่าน 250  ครั้ง | แสดงความคิดเห็น 0  ครั้ง
การพัฒนาระบบสารสนเทศ » ข้อมูลเปิด (Open Data) เบื้องต้น
ข้อมูลเปิด (Open Data) คือ ข้อมูลที่สามารถเข้าถึง ใช้งาน แก้ไข และแบ่งปันได้โดยไม่จำกัดข้อกำหนดหรือค่าใช้จ่าย ข้อมูลเปิดมักถูกเผยแพร่ในรูปแบบที่สามารถอ่านและวิเคราะห์ได้ง่าย เช่น ไฟล์ CSV, JSON, หร...
การเข้าถึง  การใช้งาน  การแบ่งปัน  การเปิดเผย  ข้อมูลเปิด     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานเทคโนโลยีสารสนเทศ
ผู้เขียน สมนึก สินธุปวน  วันที่เขียน 2/9/2567 9:45:13  แก้ไขล่าสุดเมื่อ 21/11/2567 16:01:22   เปิดอ่าน 98  ครั้ง | แสดงความคิดเห็น 0  ครั้ง