Business Intelligence คือ เทคโนโลยีสำหรับการรวบรวมข้อมูล จัดเก็บ วิเคราะห์ และการเข้าถึงข้อมูล รวมถึงการดูข้อมูลในหลากหลายมุมมอง (Multidimensional Model) ของแต่ละหน่วยงาน ซึ่งช่วยให้ผู้ใช้งานในองค์กรทำการตัดสินใจทางธุรกิจที่ดียิ่งขึ้น BI Application จะรวบรวมการทำงานของระบบสนับสนุนการตัดสินใจ แบบสอบถามและสร้างรายงานเพื่อการวิเคราะห์ ซึ่ง Business Intelligence จะเน้นระบบวิเคราะห์ข้อมูลขององค์กรแบบอัตโนมัติเพื่อสนับสนุนการบริหารและการตัดสินใจ ข้อมูลส่วนใหญ่มาจากฐานข้อมูลเชิงสัมพันธ์ (RDB) ที่เกิดจากธุรกรรม (transaction) ขององค์กร ที่เรียกว่า Operational Database ซึ่งเป็นข้อมูลเชิงโครงสร้าง (Structured) โดยข้อมูลที่พร้อมจะวิเคราะห์จะอยู่ในฐานข้อมูลเดียวที่เรียกว่า คลังข้อมูล (Data Warehouse) หรือคลังข้อมูลย่อย (Data Mart) และมี Business Intelligence Platform เป็นระบบปฏิบัติการ
ส่วนวิทยาศาสตร์ข้อมูล (Data Science) คือการนำข้อมูลมาใช้ประโยชน์ โดยครอบคลุมตั้งแต่ขั้นตอนการทำความเข้าใจเกี่ยวกับข้อมูลที่สนใจ เช่นข้อมูลทางธุรกิจ ควรจะมีความรู้ทางด้านธุรกิจ การเตรียมข้อมูล (Prepare) เพื่อให้พร้อมต่อการจัดการข้อมูลโดยสร้างแบบจำลองของข้อมูลที่สนใจ (Modeling) จากนั้นนำมาประเมินผล (Evaluation) โดยใช้หลักการทางคณิตศาสตร์และสถิติ สุดท้ายนำไปพัฒนาองค์กรที่สนใจข้อมูลดังกล่าว
ซึ่งในปัจจุบัน “Big Data” หรือ “ข้อมูลขนาดใหญ่” ได้กลายเป็นทรัพยากรที่มีค่า เพราะเป็นอีกหนึ่งกลไกสำคัญขององค์กรทั้งภาคธุรกิจและรัฐบาลในยุคปัจจุบัน เนื่องจาก “ข้อมูลขนาดใหญ่” เป็นสิ่งที่รวบรวมพฤติกรรม รสนิยม รวมถึงความคิดเห็นของผู้คนบนโลกต่อสิ่งรอบตัวต่างๆ แทบทุกกิจกรรมที่เราทำในหนึ่งวัน กลายเป็นข้อมูลที่นำไปใช้ต่อได้ ไม่ว่าจะเป็นการต่อยอดทางธุรกิจเพื่อสร้างสินค้าและบริการให้เข้าถึงกลุ่มผู้บริโภคเป้าหมายได้มากขึ้น หรือนำไปใช้เพื่อออกแบบนโยบายภาครัฐให้เข้ากับความต้องการของประชาชน
อย่างไรก็ตาม ข้อมูลจำนวนมหาศาลนี้ ไม่สามารถนำมาปรับใช้ได้ในทันที ด้วยขนาด ความเร็ว และความหลากหลายของข้อมูล ทำให้องค์กรต้องการคนที่สามารถทำความเข้าใจข้อมูลและดึงแก่นสำคัญออกมาใช้ได้ ซึ่ง “Data Scientist” คือ ผู้ที่จะเข้ามาจัดการกับข้อมูลเหล่านี้
กระบวนการคิดและการทำงานของ “Data Scientist” ล้วนมีพื้นฐานมาจากหลักการทางวิทยาศาสตร์ นี่จึงเป็นเหตุผลที่อาชีพนี้มีชื่อเรียกต่อท้ายเป็น นักวิทยาศาสตร์ หรือ scientist กระบวนการทำ งานหลักมีอยู่ 5 ขั้นตอนเริ่มจาก
1. การตั้งคำถามที่น่าสนใจ เป็นประโยชน์ต่อองค์กร และสามารถนำ เอาข้อมูลมาช่วยแก้ปัญหาได้
2. การค้นหาและจัดเก็บข้อมูล
3. การสำรวจข้อมูล หาแบบแผนความเชื่อมโยงระหว่างกัน
4. การสร้างแบบจำ ลองเพื่อวิเคราะห์ข้อมูล และ
5. การสื่อสารผลลัพธ์ที่ได้ให้เห็นภาพและเข้าใจง่าย