เพื่อการนำข้อมูลมาใช้ประโยชน์ให้มีประสิทธิภาพ Data Scientist จำเป็นต้องมีความรู้พื้นฐานเกี่ยวกับสิ่งต่อไปนี้
- กระบวนการสร้างแบบจำลองทางด้านวิทยาการข้อมูล
- การเข้าใจในเรื่องธุรกิจ
- การเข้าใจข้อมูล
- การเตรียมข้อมูล
- การเตรียมแบบจำลอง
- การประเมินประสิทธิภาพของแบบจำลอง
- การนำแบบจำลองไปใช้จริง
- การติดตามประเมินผล
- การวัดคุณภาพของข้อมูลต้อง
- ความถูกต้อง
- ความสมบูรณ์
- ความสม่ำเสมอ
- การลำดับเวลา
- ความน่าเชื่อถือ
- การเขียนโปรแกรมคอมพิวเตอร์