ถอดบทเรียน โครงการแลกเปลี่ยนเรียนรู้เพื่อพัฒนาศักยภาพบุคลากร กลุ่มผู้ปฏิบัติงานเทคโนโลยีสารสนเทศ ครั้งที่ 2 : Data Mining

ณัฐกฤตา โกมลนาค

ณัฐกฤตา โกมลนาค

วันที่เขียน 9/4/2558 11:32:36 แก้ไขล่าสุดเมื่อ 18/11/2568 2:34:24

เปิดอ่าน: 4440 ครั้ง

เนื่องด้วยปัจจุบันเป็นยุคที่ข้อมูลสารสนเทศมีความสำคัญ การเผยแพร่และสื่อสารข้อมูล ข่าวสาร ที่ตรงกับความต้องการของผู้ใช้จึงเป็นสิ่งจำเป็น การประยุกต์เทคโนโลยีสารสนเทศเพื่อช่วยในการสื่อสารข้อมูลจำนวนมากให้แก่ผู้ใช้ เช่น การให้บริการเว็บไซต์เพื่อเผยแพร่ข้อมูลข่าวสารและแลกเปลี่ยนความรู้ จึงเป็นเครื่องมือที่สำคัญในการสื่อสารข้อมูลถึงผู้ใช้จำนวนมาก ดังนั้นการศึกษาเกี่ยวกับพฤติกรรมของผู้ใช้บริการเว็บไซต์ จะช่วยให้องค์กรสามารถนำข้อมูลมาใช้ในการวางแผนพัฒนาเว็บไซต์ ให้ตรงกับความต้องการใช้งานหรือใช้ในการวางแผนกลยุทธ์ เพื่อสร้างความได้เปรียบทางการแข่งขัน โดยวิธีการที่ใช้ คือกระบวนการทําเหมืองข้อมูล (Data Mining) ซึ่งเป็นกระบวนการที่กระทํากับข้อมูลจํานวนมากเพื่อค้นหารูปแบบและความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อมูลนั้น ในปัจจุบันการทําเหมืองข้อมูลได้ถูกนําไปประยุกต์ใช้ในงานหลายประเภท ทั้งในด้านธุรกิจที่ช่วยในการตัดสินใจของผู้บริหาร ในด้านวิทยาศาสตร์และการแพทย์รวมทั้งในด้านเศรษฐกิจและสังคม การทําเหมืองข้อมูลเปรียบเสมือนวิวัฒนาการหนึ่งในการจัดเก็บและตีความหมายข้อมูล จากเดิมที่มีการจัดเก็บข้อมูลอย่างง่ายๆ มาสู่การจัดเก็บในรูปฐานข้อมูลที่สามารถดึงข้อมูลสารสนเทศมาใช้จนถึงการทําเหมืองข้อมูลที่สามารถค้นพบความรู้ที่ซ่อนอยู่ในข้อมูล

โครงการแลกเปลี่ยนเรียนรู้เพื่อพัฒนาศักยภาพบุคลากร กลุ่มผู้ปฏิบัติงานเทคโนโลยีสารสนเทศ ครั้งที่ 2 : Data Mining โดยนายสุระพล ริยะนา นักวิชาการคอมพิวเตอร์ชำนาญการพิเศษ ได้แลกเปลี่ยนเรียนรู้เกี่ยวกับ Data Mining ให้กลุ่มผู้ปฏิบัติงานเทคโนโลยีสารสนเทศ เมื่อวันที่ 16 กุมภาพันธ์ 2558 ซึ่งจากการแลกเปลี่ยนเรียนรู้ในครั้งนี้ สามารถถอดบทเรียนได้ ดังนี้

สิ่งที่ได้จากการแลกเปลี่ยนเรียนรู้
1) เครื่องมือที่ใช้ในการจัดทำ Data Mining
- Pentaho business analysic (BI)
- Weka สำหรับการทำ ETL Transform Data
- R สำหรับการวิเคราะห์ค่าสถิติ
- Data Mining

2) ความเป็นมา เป็นการสกัดความรู้จากข้อมูลจำนวนมาก เรียกอีกอย่างว่า Big Data อาจได้ยินด้วยศัพท์อื่นได้แก่ Machine Learning, OLAP, BI

3) ความแตกต่างจากการจัดทำฐานข้อมูลแบบ Normalization
Normalization เป็นการออกแบบฐานข้อมูลที่เน้นลดความซ้ำซ้อนในการจัดเก็บข้อมูล มีข้อดีในด้านการ Storage ได้แก่คำสั่ง Insert Update Delete แต่ไม่รองรับการ Query Mode คำสั่ง Select ในกรณีของข้อมูลขนาดมหาศาล ซึ่งรูปแบบการทำงานของคำสั่งเป็นในลักษณะของการทำงานด้วยคำสั่ง For Loop ทำให้มีการประมวลผลนานขึ้น เมื่อมีการแยกตาราง ตามหลักการของ Normalization ทำให้ 1 Column ต้องไปเชื่อมโยงกับทุก Column ในตารางที่สัมพันธ์กัน
Data Mining เป็นการออกแบบฐานข้อมูลที่เน้นการแยกตารางตามประโยชน์ที่ใช้งาน ไม่ได้แยกจากความซ้ำซ้อน จึงเรียกว่า Denormalization โดยจะแยกตารางเป็น 3 กลุ่ม โดยพิจารณาจาก Report และเงื่อนไขการแสดงผลดังนี้
1. Fact Table คือ กลุ่มของตารางข้อมูลที่ใช้ในการประมวลผล
2. Dimension Table คือ กลุ่มของตารางที่ใช้ในมิติของการแสดงผล
3. Measure Table คือ กลุ่มของตารางที่ใช้ในการวัดปริมาณ
หลักการของ Data Mining คือการสกัดความหมายของข้อมูล มีชั้นตอน ดังนี้
1. Management Data
- Create Data Source แยกตามกลุ่มของตาราง Fact Table, Dimension Table, Measure Table ใช้หลักการออกแบบ Normalization แล้ว Transfer เป็น Data Mining พิจารณาจากความจำเป็น ความต้องการผู้ใช้ และเงื่อนไขการแสดงผล
- Import Data โดยใช้เครื่องมือในการทำงานได้แก่ ETL
2. Report

(ถอดบทเรียน โดยนางสาวณัฐกฤตา โกมลนาค คุณอำนวย)

คำสำคัญ :

Data Mining Denormaliztion ETL Pentaho

กลุ่มบทความ :

กลุ่มงานตามสมรรถนะบุคลากร

หมวดหมู่ :

กลุ่มงานเทคโนโลยีสารสนเทศ

แชร์ :

https://erp.mju.ac.th/acticleDetail.aspx?qid=373

ความคิดเห็นทั้งหมด (0)

ไม่มีข้อมูลตามเงื่อนไขที่ท่านกำหนด

รายการบทความการแลกเปลี่ยนเรียนรู้หมวดหมู่ : กลุ่มงานเทคโนโลยีสารสนเทศ

	ความรู้จากการเข้าร่วมอบรม » เปรียบเทียบเครื่องมือ AI ระหว่าง ChatGPT กับ Copilot ใช้ในงานอันไหนดีกว่ากัน
	เครื่องมือ AI ใช้ในการทำงานและการเรียนการสอน
	AI ChatGPT Copilot เครื่องมือ AI กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานเทคโนโลยีสารสนเทศ
	ผู้เขียน ช่อทิพย์ สิทธิ วันที่เขียน 23/9/2568 16:26:13 แก้ไขล่าสุดเมื่อ 17/11/2568 21:15:45 เปิดอ่าน 677 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง

	การใช้ AI ในการพัฒนางานวิจัย » การใช้ AI ในการพัฒนางานวิจัย
	การประยุกต์ใช้ปัญญาประดิษฐ์ (Artificial Intelligence: AI) ในกระบวนการวิจัยมีบทบาทสำคัญในการเพิ่มประสิทธิภาพและความแม่นยำของงานวิจัยในหลากหลายสาขา AI สามารถช่วยสนับสนุนการเก็บ วิเคราะห์ และประมวลผลข...
	ปัญญาประดิษฐ์ กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานเทคโนโลยีสารสนเทศ
	ผู้เขียน ศิรินภา อ้ายเสาร์ วันที่เขียน 11/8/2568 14:41:55 แก้ไขล่าสุดเมื่อ 16/11/2568 6:34:49 เปิดอ่าน 1149 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง

	การพัฒนาระบบสารสนเทศ » Generative Ai และ Promt สำหรับการสรุปบทความวิจัย
	การสรุปบทความวิจัยโดยใช้ Generative AI ต้องอาศัยแนวทางการทำงานที่เป็นระบบและการออกแบบ Prompt ที่ชัดเจนเพื่อให้ได้ผลลัพธ์ที่มีคุณภาพ ด้านล่างนี้คือแนวทางการทำงานและตัวอย่างการออกแบบ Prompt สำหรับการ...
	Generative AI Promt การสรุป บทความวิจัย กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานเทคโนโลยีสารสนเทศ
	ผู้เขียน สมนึก สินธุปวน วันที่เขียน 8/8/2568 22:21:28 แก้ไขล่าสุดเมื่อ 15/11/2568 14:22:20 เปิดอ่าน 367 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง

	การพัฒนาโปรแกรม » ถอดบทเรียนการสร้าง แท็บเมนู (Tabs) แสดงวิดีโอ YouTube ตามปี
	การสร้าง แท็บเมนู (Tabs) แสดงวิดีโอ YouTube ตามปี @Site https://psdgreenoffice.mju.ac.th เป็นการแสดงวิดีโอหน้าเว็บไซต์ที่สร้างขึ้นภายใต้เว็บเท็มเพจกลางของมหาวิทยาลัย
	Bootstrap 5 HTML tag iframe tag ul กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานเทคโนโลยีสารสนเทศ
	ผู้เขียน ณัฐกฤตา โกมลนาค วันที่เขียน 31/7/2568 15:27:35 แก้ไขล่าสุดเมื่อ 16/11/2568 1:51:45 เปิดอ่าน 298 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง

	อบรม Solutionday 2025 " POWER OF AI FOR SECURITY " » อบรม Solutionday 2025 " POWER OF AI FOR SECURITY "

	กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานเทคโนโลยีสารสนเทศ
	ผู้เขียน เจษฎา ทรายกันคำ วันที่เขียน 3/7/2568 17:18:16 แก้ไขล่าสุดเมื่อ 13/11/2568 22:25:32 เปิดอ่าน 249 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง