Thursday, November 27, 2008

สถิติเชิงพรรณนา กับสถิติเชิงอนุมาน ต่างกันอย่างไร?

สถิติเชิงพรรณนาต่างจากสถิติเชิงอนุมานอย่างไร?

แตกต่างกันทั้งในส่วนวิธีการและบทบาทที่มีในชีวิตประจำวัน

สถิติเชิงพรรณนา(Descriptive Statistics) นั้น เป็นวิชาสถิติหรือศาสตร์ที่ว่าด้วยการสรุปสาระสำคัญที่มีอยู่ในข้อมูลชุดหนึ่ง และนำเสนอข้อสรุปหรือนำสาระสำคัญในข้อมูลชุดนั้นออกมารายงาน หรืออธิบายว่ามีลักษณะเป็นอย่างไร หรือใช้ประโยชน์โดยไม่ทำการอ้างอิงไปยังข้อมูลชุดอื่นหรือข้อมูลชุดที่สมบูรณ์

กล่าวคือ สถิติเชิงพรรณนาจะว่าด้วยวิธีการในการสรุปและนำเสนอข้อมูลที่อธิบายลักษณะของข้อมูลชุดนั้นให้เป็นที่เข้าใจโดยสังเขป เช่น โดยการบอกว่าข้อมูลชุดนี้มีศูนย์กลางอยู่ที่ใด โดยการใช้ค่าเฉลี่ย หรือค่ามัธยฐานเป็นค่าแสดงว่าข้อมูลชุดนี้มีค่าอยู่ตรงไหนหรือบริเวณไหน
และโดยการบอกว่าข้อมูลชุดนี้มีค่าต่างๆ ปรากฏอยู่ในช่วงใด ค่าต่างๆ เหล่านี้เกาะกลุ่มกันมากน้อยเพียงไร หรือมีการกระจายตัวมากน้อยเพียงไร ด้วยการบอกว่า ค่าต่ำสุดค่าสูงสุดเป็นเท่าไร มีพิสัยกว้างยาวแค่ไหน มีค่าแปรปรวนและค่าเบี่ยงเบนมาตรฐานเท่ากับเท่าไร

หรืออาจใช้วิธีการสรุปด้วยแผนภาพที่ทำให้มองเห็นได้ว่าข้อมูลทั้งหมดอยู่ในช่วงใด มีค่ากลางเป็นเท่าไร มีการกระจายตัวของข้อมูลในชุดมากน้อยเพียงไร ด้วยการใช้แผนภาพกระจาย แผนภาพแสดงการแจกแจงของข้อมูล เป็นต้น

หลักการสำคัญคือ เราจะสนใจเฉพาะข้อมูลชุดที่มีในมือ และพยายามอธิบายข้อมูลชุดนี้ว่ามีลักษณะอย่างไร ด้วยวิธีต่างๆ ที่ทำให้สามารถสรุปลักษณะได้อย่างเหมาะสมและสื่อความหมายที่ถูกต้องเกี่ยวกับข้อมูลชุดนั้นเท่านั้น ภายใต้หลักการเช่นนี้ จึงอาศัยเพียงทฤษฎีทางสถิติที่มาอธิบายคุณลักษณะของวิธีการที่ใช้ในการอธิบายข้อมูล เช่นคุณสมบัติของค่าเฉลี่ย หรือค่าแปรปรวน เป็นต้น

สถิติเชิงอนุมาน(Inferential Statistics) เป็นวิชาสถิติหรือศาสตร์ที่ว่าด้วยทฤษฎีและวิธีการต่างๆ ในการวิเคราะห์ข้อมูลเพื่อตอบคำถามหรือปัญหาที่สนใจ โดยอาศัยข้อมูลเพียงส่วนหนึ่งที่มีอยู่เพื่ออธิบายข้อมูลชุดที่สมบูรณ์หรือประชากร

กล่าวคือ จากข้อมูลที่มีอยู่ซึ่งไม่ใช่ข้อมูลชุดสมบูรณ์(คือมีเฉพาะข้อมูลส่วนเดียว ที่มักเรียกว่าข้อมูลตัวอย่าง) เราต้องการสรุปสาระสำคัญในข้อมูลชุดสมบูรณ์หรือลักษณะของปรากฏการณ์หนึ่งด้วยการใช้ข้อมูลตัวอย่างหรือข้อมูลเพียงส่วนหนึ่งจากชุดข้อมูลที่สมบูรณ์นั้น แล้วทำการอนุมานจากข้อมูลตัวอย่างไปสู่ข้อมูลชุดสมบูรณ์

ความแตกต่างจากสถิติเชิงพรรณนาอยู่ที่ตรงนี้ สถิติเชิงพรรณนาทำการสรุปสาระสำคัญในข้อมูลชุดที่มีอยู่ในมือหรืออธิบายลักษณะของข้อมูลชุดนี้เท่านั้น ไม่มีการอ้างอิงถึงข้อมูลชุดอื่นหรือพยายามไปอธิบายข้อมูลชุดสมบูรณ์ เรียกว่าไม่ทำการอนุมานไปสู่ข้อมูลชุดที่สมบูรณ์นั่นเอง แต่สถิติเชิงอนุมานนั้น ไม่ใช่เลย จุดหมายหลักคือต้องการอธิบายข้อมูลชุดที่สมบูรณ์หรือประชากรว่ามีหน้าตาเป็นอย่างไร แต่ในความเป็นจริงนั้น เราไม่สามารถหาข้อมูลชุดที่สมบูรณ์ได้เสมอ ด้วยสาเหตุหลายประการ เช่น ไม่สามารถเก็บรวบรวมได้ทั้งหมด ตัวอย่างเช่น ต้องการทราบว่ามีคนกรุงเทพฯ สักกี่เปอร์เซนต์ที่เห็นด้วยกับรนโยบายการเก็บภาษีป้องกันน้ำท่วม ข้อมูลชุดสมบูรณ์หรือประชากรคือข้อมูลความคิดเห็นของคนกรุงเทพฯ ทั้งหมด ซึ่งหากเก็บรวบรวมให้สมบูรณ์ย่อมต้องใช้งบประมาณ แรงงาน และเวลามากเกินกว่าที่จะได้ใช้ประโยชน์จากข้อมูลทั้งหมดนั้น เมื่อเวลาและงบประมาณมีจำกัด ก็ต้องหาวิธีในการเก็บข้อมูล เก็บไม่ได้ทั้งหมด ก็ต้องเก็บมาเพียงบางส่วน เอาข้อมูลบางส่วนนี้มาวิเคราะห์ แต่พอตอนจะสรุปผล ก็ต้องการสรุปผลในระดับประชากรอีก คือต้องการบอกว่า ประมาณการได้ว่าคนกรุงเทพฯ กี่เปอร์เซนต์เห็นด้วย ไม่ใชว่าคนกรุงเทพฯ เฉพาะในตัวอย่างเห็นด้วยกี่เปอร์เซนต์ เมื่อคุณค่าของข้อสรุปและความต้องการเป็นเช่นนี้ ก็ต้องหาวิธีการที่จะทำให้สรุปได้ แม้จะไม่ได้ครบถ้วนตามที่ต้องการ แต่ก็ต้องดีที่สุดเท่าที่จะทำได้ สถิติเชิงอนุมานคือวิธีการต่างๆ ที่มาช่วยในกรณีเช่นนี้ เพื่อหาคำตอบในระดับประชากรโดยอาศัยเพียงข้อมูลตัวอย่าง

จะเห็นได้ว่า ประโยชน์ของสถิติเชิงอนุมานมีมากมาย และเป็นเรื่องจำเป็นสำหรับการสร้างความรู้และการประยุกต์ใช้ข้อมูล ข้อสำคัญที่ต้องระมัดระวังคือ ต้องตระหนักว่า วิธีการเหล่านี้ช่วยทำให้ตอบคำถามที่ต้องการได้ แต่ด้วยคุณภาพระดับหนึ่งเท่านั้น ซึ่งระดับคุณภาพหรือความเชื่อถือได้ในข้อสรุป ก็จะขึ้นอยู่กับข้อมูลตัวอย่างที่เอามาใช้ ว่ามีขนาดและคุณภาพในการเป็นตัวแทนประชากรที่ดีเพียงใด และขึ้นอยู่กับวิธีการสรุปผลว่าเป็นวิธีที่เหมาะสมและมีคุณภาพดีมากน้อยเพียงไรนั่นเอง

ประเด็นคุณภาพนี้ จึงเป็นประเด็นสำคัญที่ทุกคนที่ใช้ประโยชน์ข้อมูลต้องตระหนัก และพินิจพิจารณาให้ดี ก่อนที่จะเชื่อสารสนเทศหรือข้อสรุปที่ได้มา ไม่ใช่ว่า อะไรที่มีการตีพิมพ์หรือประกาศจะเป็นเรื่องที่เชื่อถือได้ทั้งหมดเสมอไป โดยเฉพาะอย่างยิ่งในยุคที่ข้อมูลข่าวสารมีมากเหลือล้น จนจะท่วมทับผู้ใช้อยู่อย่างนี้ การพิจารณาเรื่องความเชื่อถือได้ของข้อมูลและข้อสรุป ยิ่งเป็นเรื่องจำเป็นและสำคัญมากยิ่งขึ้น พูดง่ายๆ คืออย่าเชื่อโดยไม่กรอง หรือตั้งคำถามที่ควรตั้งเสียก่อน

สถิติเชิงอนุมานมีประโยชน์อย่างมากในการปฏิบัติงานและกลายเป็นสิ่งจำเป็นในการสร้างความรู้ในศาสตร์ต่างๆ โดยเฉพาะศาสตร์ที่ต้องอาศัยการพิจารณาการเกิดซ้ำๆ กันของปรากฏการณ์ในศาสตร์นั้นมาอธิบายหรือสร้างความรู้ในศาสตร์นั้น ทั้งนี้ พื้นฐานสำคัญของสถิติเชิงอนุมานคือทฤษฎีทางคณิตศาสตร์และทฤษฎีความน่าจะเป็น และได้มีการพัฒนาทฤษฎีทางสถิติศาสตร์ขึ้นมาเป็นหลักสำคัญในการเก็บรวบรวมข้อมูลและการวิเคราะห์ข้อมูล โดยในส่วนของการเก็บรวบรวมข้อมูลนั้น จะครอบคลุมทฤษฎีและวิธีการในเรื่องการสำรวจตัวอย่างและการวางแผนแบบการทดลอง ส่วนการวิเคราะห์ข้อมูลนั้น มีวิธีการที่หลากหลายเพื่อใช้ประโยชน์ตามความต้องการ เช่น การวิเคราะห์ความถดถอยเพื่อวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรและเพื่อการพยากรณ์ การวิเคราะห์ความแปรปรวนเพื่อเปรียบเทียบอิทธิพลของปัจจัยต่างๆ ที่มีต่อสิ่งที่สนใจ การวิเคราะห์อนุกรมเวลาเพื่อการพยากรณ์ และการจำแนกกลุ่ม เป็นต้น

No comments: