Data Science หรือ วิทยาการข้อมูล หมายถึง การนำข้อมูลมาใช้ประโยชน์ โดยครอบคลุมตั้งแต่ขั้นตอนการเก็บข้อมูล (Collect)
การจัดการข้อมูล (Manage) การวิเคราะห์ข้อมูล (Analyze) ไปจนถึงขั้นตอนการนำข้อมูลมาช่วยตัดสินใจ (Decision)
Data Science เป็นกระบวนการที่นำเอาข้อมูลมหาศาลมาใช้ให้เกิดประโยชน์และสร้างมูลค่าต่อธุรกิจ
โดยจะต้องมีผู้เชี่ยวชาญที่เรียกว่า Data Expert หรือ Data Scientistในการจัดการและนำข้อมูลที่มีอยู่มาทำ Data Cleansing
และนำมาวิเคราะห์เพื่อหาองค์ความรู้ใหม่จากชุดข้อมูลที่มีอยู่ และนำมาพัฒนาปรับปรุงการทำงานให้มีประสิทธิภาพมากขึ้น
เพื่อการนำข้อมูลมาใช้ประโยชน์ให้มีประสิทธิภาพ Data Scientist จำเป็นต้องมีความรู้พื้นฐานเกี่ยวกับสิ่งต่อไปนี้
1. กระบวนการสร้างแบบจำลองทางด้านวิทยาการข้อมูล
- การเข้าใจในเรื่องธุรกิจ
- การเข้าใจข้อมูล
- การเตรียมข้อมูล
- การเตรียมแบบจำลอง
- การประเมินประสิทธิภาพของแบบจำลอง
- การนำแบบจำลองไปใช้จริง
- การติดตามประเมินผล
2. การวัดคุณภาพของข้อมูลต้อง
- ความถูกต้อง
- ความสมบูรณ์
- ความสม่ำเสมอ
- การลำดับเวลา
- ความน่าเชื่อถือ
3. การเขียนโปรแกรมคอมพิวเตอร์
|