เนื้อหาในการสัมมนาในครั้งนี้ แบ่งเป็น 2 ส่วน คือ ส่วนที่ 1 การรับฟังการบรรยายจากผู้เชี่ยวชาญชาวต่างชาติ Professor Don McNeil และ ส่วนที่ 2 การฝึกปฏิบัติการ โดยใช้โปรแกรม R ในการนำข้อมูลด้านนิเวศวิทยามาวิเคราะห์ผลทางสถิติ โดยข้อมูลที่นำมาใช้ในการสัมมนาครั้งนี้คือข้อมูลของสิ่งมีชีวิต ในคลองนาทับ ในช่วงเดือนมิถุนายน 2548 – ตุลาคม 2558 โดยเก็บข้อมูลทุก ๆ 2 เดือน รวมมีข้อมูลทั้งสิ้น 62 ตัวอย่าง และเก็บทั้งหมด 10 จุด ดังนั้นจะมีข้อมูลทั้งหมด 620 ตัวอย่าง
โดยเนื้อหาที่ได้รับจากการบรรยายจะแบ่งเป็น การอธิบายลักษณะของข้อมูล (โดยใช้ข้อมูลของแพลงก์ตอน (Plankton)) โดยใช้สถิติเชิงพรรณา และหาความสัมพันธ์ของตัวแปรต่าง ๆ การสร้างตัวแบบ(โดยใช้ข้อมูลของแพลงก์ตอน (Plankton)) และการประยุกต์ใช้ข้อมูลกับสิ่งมีชีวิตอื่น ๆ โดยใช้ข้อมูลปลา และ ลูกปลา (Fish and Fish Larvae) และ สิ่งมีชีวิตหน้าดิน (Benthon and Further Issues)
ในส่วนของการอธิบายลักษณะของข้อมูล (โดยใช้ข้อมูลของแพลงก์ตอน (Plankton)) โดยใช้สถิติเชิงพรรณา
ในส่วนนี้จะศึกษาข้อมูลของแพลงก์ตอน โดยจะมีการศึกษาทั้งแพลงก์ตอนพืช จำนวน 52 ชนิดและ แพลงก์ตอนสัตว์ จำนวน 87 ชนิด รวมทั้งหมด 139 ชนิด โดยจะศึกษาความชุก (Prevalence) และ ความอุดมสมบูรณ์ (abundance) โดยในการอธิบายลักษณะข้อมูลจะประกอบด้วยหลาย ๆ ส่วน ดังนี้
- การพิจารณาการแจกแจงของจำนวนแพลงก์ตอน โดยพิจารณาจากฮิสโทแกรม
- การพิจารณาการแจกแจงของจำนวนของจำนวนแพลงก์ตอนแต่ละชนิด โดยพิจารณาจาก Quantile- Quantile(QQ) Plots
ในส่วนของหาความสัมพันธ์ของตัวแปรต่าง ๆ จะใช้ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สัน ดังนี้
- การพิจารณาความสัมพันธ์ของตัวแปรเชิงปริมาณ 2 ตัวแปร (ดูความสัมพันธ์ของความชุก ของแพลงก์ตอน 2 ชนิด) จาก Scatter Plot
2. พิจารณาความสัมพันธ์เชิงเส้นของความหนาแน่นของแพลงก์ตอน ในแต่ละคู่ (หลังจากที่แปลงข้อมูลด้วยค่า log(1+ความหนาแน่นแล้ว)) ด้วย Scatter Plot Matrix
3.พิจารณาความสัมพันธ์เชิงเส้นของความหนาแน่นของแพลงก์ตอน ในแต่ละคู่ ด้วย Bubbleplot Correlation Matrix
ในส่วนของการสร้างตัวแบบ
ในส่วนนี้จะสร้างตัวแบบ 2 ตัวแบบ คือ ตัวแบบของความชุก (Prevalence) ซึ่งจะมีคำตอบ 2 คำตอบ คือ พบ(1) / ไม่พบ(0) ซึ่งจะใช้ตัวแบบ Logistic Model และ ความอุดมสมบูรณ์ (abundance) จะนับเป็นจำนวนตัวต่อลูกบาศก์เมตร (พบมากน้อยเท่าใด) โดยใช้ตัวแบบการวิเคราะห์การถดถอยเชิงเส้น
โดยก่อนที่จะทำการสร้างตัวแบบจะทำการจัดกลุ่มแพลงก์ตอนโดยใช้ Factor Analysis เพื่อลดจำนวนตัวแบบก่อน แล้วค่อยไปสร้างตัวแบบทีละกลุ่ม
สำหรับการสร้างตัวแบบ (Models)
สำหรับการสร้างตัวแบบของความชุก (Prevalence) ของแพลงก์ตอน ด้วย Logistic Model
สำหรับการสร้างตัวแบบของความอุดมสมบูรณ์ (abundance) โดยใช้ตัวแบบการวิเคราะห์การถดถอยเชิงเส้น
โดยมีตัวแปรตามคือความชุก และ ตัวแปรอิสระคือ เดือน(Month), ปี(Year), จุดที่เก็บตัวอย่าง(Site Upstream), ความชุกของแพลงก์ตอนพืช(PhytoPlankton) และ ความเค็มของน้ำ(Salinity)
จากนั้นหาช่วงความเชื่อมั่น และ ทดสอบสมมติฐานว่าตัวแปรอิสระใดจะมีอิทธิพลต่อตัวแปรตาม
สำหรับการประยุกต์ใช้ข้อมูลกับสิ่งมีชีวิตอื่น ๆ
จะใช้ข้อมูลความชุก และความสมบูรณ์ของปลา และ ลูกปลา (Fish and Fish Larvae) และ ข้อมูลความชุก และความสมบูรณ์ของสิ่งมีชีวิตหน้าดิน (Benthon and Further Issues)
โดยจะมีการอธิบายสถิติเชิงพรรณนา การหาความสัมพันธ์ของตัวแปรต่าง ๆ และการสร้างตัวแบบเช่นเดียวกับข้อมูลแพลงก์ตอน
ด้านการนำไปใช้ประโยชน์
หลังจากการเข้าร่วมสัมมนาเชิงปฏิบัติการในครั้งนี้ สามารถนำมาใช้ในการจัดการเรียนการสอนในรายวิชา สต324 การวิเคราะห์การถดถอย ซึ่งจะมีเนื้อหาการวิเคราะห์การถดถอย และ Logistic Regression โดยใช้เป็นตัวอย่างให้นักศึกษา ในส่วนของการทำวิจัยจะใช้ความรู้ที่ได้รับตั้งแต่กระบวนการอธิบายข้อมูลด้วยสถิติเชิงพรรณนา การหาความสัมพันธ์ของตัวแปรต่าง ๆ และการสร้างตัวแบบ เพื่อให้ผลงานวิจัยมีความเหมาะสมและถูกต้องมากยิ่งขึ้น รวมทั้งการประยุกต์ใช้ความรู้จากการ ฝึกปฏิบัติการเพื่อให้การนำเสนอมีความน่าสนใจมากยิ่งขึ้น โดยใช้การนำเสนอด้วยแผนภาพทั้งหลาย เช่น Quantile- Quantile(QQ) Plots, Scatter Plot Matrix และ Bubbleplot Correlation Matrix แทนการนำเสนอด้วยค่าทางสถิติเพียงอย่างเดียว