ถอดบทเรียน โครงการแลกเปลี่ยนเรียนรู้เพื่อพัฒนาศักยภาพบุคลากร กลุ่มผู้ปฏิบัติงานเทคโนโลยีสารสนเทศ ครั้งที่ 2 : Data Mining
วันที่เขียน 9/4/2558 11:32:36     แก้ไขล่าสุดเมื่อ 11/8/2563 8:25:26
เปิดอ่าน: 2705 ครั้ง

เนื่องด้วยปัจจุบันเป็นยุคที่ข้อมูลสารสนเทศมีความสำคัญ การเผยแพร่และสื่อสารข้อมูล ข่าวสาร ที่ตรงกับความต้องการของผู้ใช้จึงเป็นสิ่งจำเป็น การประยุกต์เทคโนโลยีสารสนเทศเพื่อช่วยในการสื่อสารข้อมูลจำนวนมากให้แก่ผู้ใช้ เช่น การให้บริการเว็บไซต์เพื่อเผยแพร่ข้อมูลข่าวสารและแลกเปลี่ยนความรู้ จึงเป็นเครื่องมือที่สำคัญในการสื่อสารข้อมูลถึงผู้ใช้จำนวนมาก ดังนั้นการศึกษาเกี่ยวกับพฤติกรรมของผู้ใช้บริการเว็บไซต์ จะช่วยให้องค์กรสามารถนำข้อมูลมาใช้ในการวางแผนพัฒนาเว็บไซต์ ให้ตรงกับความต้องการใช้งานหรือใช้ในการวางแผนกลยุทธ์ เพื่อสร้างความได้เปรียบทางการแข่งขัน โดยวิธีการที่ใช้ คือกระบวนการทําเหมืองข้อมูล (Data Mining) ซึ่งเป็นกระบวนการที่กระทํากับข้อมูลจํานวนมากเพื่อค้นหารูปแบบและความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อมูลนั้น ในปัจจุบันการทําเหมืองข้อมูลได้ถูกนําไปประยุกต์ใช้ในงานหลายประเภท ทั้งในด้านธุรกิจที่ช่วยในการตัดสินใจของผู้บริหาร ในด้านวิทยาศาสตร์และการแพทย์รวมทั้งในด้านเศรษฐกิจและสังคม การทําเหมืองข้อมูลเปรียบเสมือนวิวัฒนาการหนึ่งในการจัดเก็บและตีความหมายข้อมูล จากเดิมที่มีการจัดเก็บข้อมูลอย่างง่ายๆ มาสู่การจัดเก็บในรูปฐานข้อมูลที่สามารถดึงข้อมูลสารสนเทศมาใช้จนถึงการทําเหมืองข้อมูลที่สามารถค้นพบความรู้ที่ซ่อนอยู่ในข้อมูล

โครงการแลกเปลี่ยนเรียนรู้เพื่อพัฒนาศักยภาพบุคลากร กลุ่มผู้ปฏิบัติงานเทคโนโลยีสารสนเทศ ครั้งที่ 2 : Data Mining โดยนายสุระพล ริยะนา นักวิชาการคอมพิวเตอร์ชำนาญการพิเศษ ได้แลกเปลี่ยนเรียนรู้เกี่ยวกับ Data Mining ให้กลุ่มผู้ปฏิบัติงานเทคโนโลยีสารสนเทศ เมื่อวันที่ 16 กุมภาพันธ์ 2558 ซึ่งจากการแลกเปลี่ยนเรียนรู้ในครั้งนี้ สามารถถอดบทเรียนได้ ดังนี้
สิ่งที่ได้จากการแลกเปลี่ยนเรียนรู้
1) เครื่องมือที่ใช้ในการจัดทำ Data Mining
    - Pentaho business analysic (BI)
    - Weka สำหรับการทำ ETL Transform Data
    - R สำหรับการวิเคราะห์ค่าสถิติ
    - Data Mining
   
2) ความเป็นมา เป็นการสกัดความรู้จากข้อมูลจำนวนมาก เรียกอีกอย่างว่า Big Data อาจได้ยินด้วยศัพท์อื่นได้แก่ Machine Learning, OLAP, BI

3) ความแตกต่างจากการจัดทำฐานข้อมูลแบบ Normalization
          Normalization เป็นการออกแบบฐานข้อมูลที่เน้นลดความซ้ำซ้อนในการจัดเก็บข้อมูล มีข้อดีในด้านการ Storage ได้แก่คำสั่ง Insert Update Delete แต่ไม่รองรับการ Query Mode คำสั่ง Select ในกรณีของข้อมูลขนาดมหาศาล ซึ่งรูปแบบการทำงานของคำสั่งเป็นในลักษณะของการทำงานด้วยคำสั่ง For Loop ทำให้มีการประมวลผลนานขึ้น เมื่อมีการแยกตาราง ตามหลักการของ Normalization ทำให้ 1 Column ต้องไปเชื่อมโยงกับทุก Column ในตารางที่สัมพันธ์กัน
          Data Mining เป็นการออกแบบฐานข้อมูลที่เน้นการแยกตารางตามประโยชน์ที่ใช้งาน ไม่ได้แยกจากความซ้ำซ้อน จึงเรียกว่า Denormalization โดยจะแยกตารางเป็น 3 กลุ่ม โดยพิจารณาจาก Report และเงื่อนไขการแสดงผลดังนี้
1. Fact Table คือ กลุ่มของตารางข้อมูลที่ใช้ในการประมวลผล
2. Dimension Table คือ กลุ่มของตารางที่ใช้ในมิติของการแสดงผล
3. Measure Table คือ กลุ่มของตารางที่ใช้ในการวัดปริมาณ
        หลักการของ Data Mining คือการสกัดความหมายของข้อมูล มีชั้นตอน ดังนี้
1. Management Data
- Create Data Source แยกตามกลุ่มของตาราง Fact Table, Dimension Table, Measure Table ใช้หลักการออกแบบ Normalization แล้ว Transfer เป็น Data Mining พิจารณาจากความจำเป็น ความต้องการผู้ใช้ และเงื่อนไขการแสดงผล
- Import Data โดยใช้เครื่องมือในการทำงานได้แก่ ETL
2. Report
(ถอดบทเรียน โดยนางสาวณัฐกฤตา โกมลนาค คุณอำนวย)

คำสำคัญ :
กลุ่มบทความ :
หมวดหมู่ :
แชร์ :
https://erp.mju.ac.th/acticleDetail.aspx?qid=373
ความคิดเห็นทั้งหมด (0)
ไม่มีข้อมูลตามเงื่อนไขที่ท่านกำหนด
รายการบทความการแลกเปลี่ยนเรียนรู้หมวดหมู่ : กลุ่มงานเทคโนโลยีสารสนเทศ
กลุ่มงานเทคโนโลยีสารสนเทศ » ซอฟต์แวร์ลิขสิทธิ์ มหาวิทยาลัยแม่โจ้
กองเทคโนโลยีดิจิทัล มีภารกิจดูแลการให้บริการซอฟต์แวร์ลิขสิทธิ์ที่ให้บริการภายในมหาวิทยาลัย ซึ่งผู้ใช้งานทั้งอาจารย์ นักวิจัย เจ้าหน้าที่ และนักศึกษา มีความต้องการใช้งานซอฟต์แวร์ที่หลากหลาย และซอฟต์...
ซอฟท์แวร์ลิขสิทธิ์  โปรแกรมลิขสิทธิ์  โปรแกรมสำเร็จรูป     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานเทคโนโลยีสารสนเทศ
ผู้เขียน บรรพต โตสิตารัตน์  วันที่เขียน 13/5/2563 11:03:42  แก้ไขล่าสุดเมื่อ 11/8/2563 2:50:56   เปิดอ่าน 569  ครั้ง | แสดงความคิดเห็น 0  ครั้ง
MS OFFICE » คู่มือใช้งาน Google Classroom สำหรับอาจารย์ มหาวิทยาลัยแม่โจ้
Google Classroom เป็นบริการของ Google ที่มีเครื่องมือสำหรับให้อาจารย์ผู้สอนได้ใช้ประโยชน์ในการสร้างห้องเรียนเสมือนได้ ซึ่งการใช้งานนั้น สามารถเข้าใช้งานได้ทุกอุปกรณ์ไม่ว่าจะเป็น คอมพิวเตอร์แท็ปเล็ต...
Google Classroom     กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานเทคโนโลยีสารสนเทศ
ผู้เขียน ศุภวรรณ สัจจากุล  วันที่เขียน 8/4/2563 14:42:54  แก้ไขล่าสุดเมื่อ 10/8/2563 15:52:20   เปิดอ่าน 495  ครั้ง | แสดงความคิดเห็น 0  ครั้ง
ทั่วไป » ทำงานที่บ้าน จะติดต่อระหว่างหน่วยงานอย่างไร
เดิมปกติจะใช้เบอร์โต๊ะโทรประสานงานกัน แต่ช่วงนี้เราจำเป็นต้องทำงานจากที่บ้าน หากคนที่เคยติดต่อกันทาง facebook line ก็จะไม่มีปัญหา แล้วคนอื่น หน่วยงานอื่นล่ะจะทำยังไง เรามีเครื่องมือไว้ให้พร้อมแล้ว ...
  กลุ่มงานตามสมรรถนะบุคลากร   กลุ่มงานเทคโนโลยีสารสนเทศ
ผู้เขียน วสุ ไชยศรีหา  วันที่เขียน 27/3/2563 12:21:15  แก้ไขล่าสุดเมื่อ 11/8/2563 3:55:18   เปิดอ่าน 833  ครั้ง | แสดงความคิดเห็น 0  ครั้ง