การวิเคราะห์ข้อมูลเทคนิค Predictive Modeling

ภานุวัฒน์ เมฆะ

ภานุวัฒน์ เมฆะ

วันที่เขียน 25/7/2560 16:35:31 แก้ไขล่าสุดเมื่อ 2/8/2569 9:05:13

เปิดอ่าน: 14752 ครั้ง

การวิเคราะห์ข้อมูลเทคนิค Predictive Modeling เพื่อสนับสนุนการวิจัยเชิงประยุกต์โดยซอฟต์แวร์ RapidMiner Studio 7 และ R (ขั้นปานกลางและสูง)

ตัวอย่างหน้าจอโปรแกรม Rapidminer7
(ที่มา: https://docs.rapidminer.com/studio/releases/img/rm7_process.png)

ตัวอย่างหน้าจอ R-studio

(ที่มา: http://www.rstudio.com/images/screenshots/rstudio-windows.png)

ซึ่งเทคนิคการจำแนกประเภทข้อมูลหรือที่เรียกว่า Predictive Modeling เป็นเทคนิคที่นิยมใช้กันมากในการวิเคราะห์ข้อมูลและการทำงานวิจัยเชิงประยุกต์ ซึ่งกระบวนการจำแนกประเภทข้อมูลจะแบ่งเป็นสองส่วนคือ (1) การนำข้อมูลสอน (training data) มาสร้างโมเดลและวัดประสิทธิภาพของโมเดล และ (2) การนำโมเดลที่ได้ไปใช้ทำนาย (predict) เพื่อหาคำตอบให้กับข้อมูลใหม่ โดยการสร้าง โมเดลนั้นมีหลายๆ เทคนิค เช่น

1. เทคนิค Decision Tree ซึ่งสร้างโมเดลในรูปแบบของ Tree เพื่อช่วยตัดสินใจ

2. เทคนิค Naïve Bayes ซึ่งสร้างโมเดลโดยใช้การคำนวณความน่าจะเป็นจากโอกาสที่เกิดขึ้นมาแล้วใน training data

3. เทคนิค K Nearest Neighbours ซึ่งสร้างโมเดลโดยการเปรียบเทียบความคล้ายคลึงกับข้อมูล training data

4. เทคนิค Neural Network เป็นการสร้างโมเดลที่ใช้สมการคณิตศาสตร์ที่ซับซ้อนในลักษณะที่คล้ายกับการทำงานของสมองมนุษย์

5. เทคนิค Support Vector Machines มีข้อดีโดยการแปลงข้อมูลให้อยู่ในรูปแบบที่สามารถแบ่งข้อมูลด้วยโมเดลเส้นตรงได้

ทว่าในหลายๆครั้งการประยุกต์ใช้เทคนิค Predictive Modeling แบบทั่วไปอาจจะไม่ได้ให้ผลลัพธ์ที่ดีเนื่องจากข้อมูลจริงมีความท้าทายในหลายๆ เรื่อง เช่น

- ข้อมูลที่ใช้ในการเรียนรู้มีจำนวนข้อมูลในแต่ละคลาสคำตอบแตกต่างกันเป็นอย่างมาก หรือเรียกว่าเป็น Imbalanced data เช่น ข้อมูลของลูกค้าในธนาคารที่มีการฉ้อโกง (fraud) จะมีจำนวนน้อยมากเมื่อเทียบกับลูกค้าปกติ แต่สิ่งที่เราต้องการหา คือ การทำนายว่าการใช้งานของลูกค้าคนใดบ้างที่เกิดการฉ้อโกงขึ้น หรือ ข้อมูลการตอบรับโปรโมชันต่างๆ

- ข้อมูลมีจำนวนแอตทริบิวต์ที่เยอะและบางครั้งมีความซ้ำซ้อนและไม่จำเป็นอยู่ เช่น การสกัดข้อความต่างๆ เพื่อนำมาสร้างโมเดลจะมีคำแตกต่างกันมาก แต่บางคำอาจจะเกิดไม่บ่อยนักทำให้ข้อมูลส่วนใหญ่มีค่าความถี่ของค่าเป็น 0

ในหลักสูตรนี้จะเน้นการปรับปรงประสิทธิภาพของการสร้างโมเดลการจำแนกประเภทข้อมูลเพื่อให้มีประสิทธิภาพขึ้นโดยใช้ ซอฟต์แวร์ RapidMiner Studio 7 ที่เรียนรู้ได้ง่ายและเพิ่มประสิทธิภาพโดยการเชื่อมต่อกับภาษา R อีกด้วย โดยในหลักสูตรนี้ผู้เข้าร่วมอบรมจะได้เรียนรู้

- หลักการสร้างโมเดลเพื่อจำแนกประเภทข้อมูลแบบพื้นฐานต่างๆ และการวัดประสิทธิภาพของโมเดล

- การเขียนโปรแกรมภาษา R เบื้องต้นเพื่อการแสดงกราฟและการสร้างโมเดลต่างๆ

- การจัดการข้อมูลที่เป็นลักษณะ Imbalance โดยการ sampling แบบต่างๆ

- การจัดการข้อมูลที่มีแอตทริบิวต์ที่เยอะเกินความจำเป็นและซ้ำซ้อนกัน ด้วยวิธีการ Attribute Selection แบบต่างๆ

- การเพิ่มประสิทธิภาพของโมเดลด้วยการใช้หลายๆ เทคนิคร่วมกันทำงาน ด้วยวิธี Ensemble แบบต่างๆ

- การค้นหาพารามิเตอร์ (parameter) ของแต่ละเทคนิคที่เหมาะสมด้วยวิธีการ optimization

คำสำคัญ :

Predictive Modeling Rapidminer rStudio

กลุ่มบทความ :

กลุ่มงานตามสมรรถนะบุคลากร

หมวดหมู่ :

กลุ่มงานเทคโนโลยีสารสนเทศ

แชร์ :

https://erp.mju.ac.th/acticleDetail.aspx?qid=697

ความคิดเห็นทั้งหมด (0)

ไม่มีข้อมูลตามเงื่อนไขที่ท่านกำหนด

รายการบทความการแลกเปลี่ยนเรียนรู้หมวดหมู่ : กลุ่มงานเทคโนโลยีสารสนเทศ

	โครงการการใช้ ICT เพื่อเพิ่มประสิทธิภาพในการปกิบัติงาน » โครงการการใช้ ICT เพื่อเพิ่มประสิทธิภาพในการปกิบัติงาน - สายสนับสนุน
	โครงการการใช้ ICT เพื่อเพิ่มประสิทธิภาพในการปฏิบัติงาน (การใช้ AI เพื่อเพิ่มประสิทธิภาพในการปฏิบัติงาน) เป็นการพัอบรมฒนาสมรรถนะของด้าน ICT ให้มีทักษะใหม่ๆด้านดิจิทัล ด้านการใช้ AI เพื่อเพิ่มประส...
	กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานเทคโนโลยีสารสนเทศ
	ผู้เขียน ณิชากร ธิการ วันที่เขียน 26/6/2569 17:10:25 แก้ไขล่าสุดเมื่อ 2/8/2569 6:20:04 เปิดอ่าน 86 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง

	อบรม Solutionday 2026 "THE Enterprise AI Landscape 2026" » อบรม Solutionday 2026 "THE Enterprise AI Landscape 2026"

	กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานเทคโนโลยีสารสนเทศ
	ผู้เขียน เจษฎา ทรายกันคำ วันที่เขียน 24/6/2569 14:49:34 แก้ไขล่าสุดเมื่อ 2/8/2569 0:15:52 เปิดอ่าน 183 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง

	ความรู้ที่ได้รับจากการเข้าร่วมประชุม/อบรม/สัมมนา » Canva & Education
	การประยุกต์ใช้เครื่องมืออัจฉริยะ (AI) ของ Canva สามารถช่วยยกระดับทักษะการสร้างสรรค์ สื่อการสอนดิจิทัลให้มีความเป็นมืออาชีพ และน่าสนใจยิ่งขึ้น ช่วยลดระยะเวลาในการออกแบบ แต่ยังมีคุณภาพที่สูง ผู้สอนสา...
	AI CANVA Education กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานเทคโนโลยีสารสนเทศ
	ผู้เขียน สุภาพรรณ อนุตรกุล วันที่เขียน 17/3/2569 10:11:08 แก้ไขล่าสุดเมื่อ 2/8/2569 0:15:51 เปิดอ่าน 647 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง

	กลุ่มงานเทคโนโลยีสารสนเทศ » ใช้งาน AI อย่างมีจริยธรรมในการปฏิบัติงาน
	การใช้งาน AI อย่างมีจริยธรรมในการปฏิบัติงาน
	AI การปฏิบัติงาน จริยธรรม ปัญญาประดิษฐ์ กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานเทคโนโลยีสารสนเทศ
	ผู้เขียน ช่อทิพย์ สิทธิ วันที่เขียน 23/1/2569 16:19:13 แก้ไขล่าสุดเมื่อ 2/8/2569 0:15:52 เปิดอ่าน 533 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง

	ความรู้จากการเข้าร่วมอบรม » เปรียบเทียบเครื่องมือ AI ระหว่าง ChatGPT กับ Copilot ใช้ในงานอันไหนดีกว่ากัน
	เครื่องมือ AI ใช้ในการทำงานและการเรียนการสอน
	AI ChatGPT Copilot เครื่องมือ AI กลุ่มงานตามสมรรถนะบุคลากร กลุ่มงานเทคโนโลยีสารสนเทศ
	ผู้เขียน ช่อทิพย์ สิทธิ วันที่เขียน 23/9/2568 16:26:13 แก้ไขล่าสุดเมื่อ 1/8/2569 22:14:43 เปิดอ่าน 1439 ครั้ง \| แสดงความคิดเห็น 0 ครั้ง

วิทยาเขต

ลิงค์ด่วน

ที่พัก/สัมมนา