Thursday, November 27, 2008
กระบวนการทางสถิติในการหาข้อสรุปจากข้อมูลเป็นอย่างไร??
เอาละ สมมติว่ามีคำถามหรือประเด็นปัญหาที่ต้องการคำตอบ และอยากหาคำตอบโดยใช้วิธีการทางสถิติ หลักการหรือขั้นตอนในการดำเนินงานจะต้องเป็นอย่างไรบ้าง ในที่นี้ จะให้กระบวนการหรือขั้นตอนง่ายๆ ที่สามารถนำไปประยุกต์ใช้ได้ในกรณีต่างๆ ทั่วไป ดังนี้
ขั้นตอนที่ 1. กำหนดประเด็นปัญหาในเชิงสถิติ
เราต้องเริ่มต้นด้วยการทำความเข้าใจประเด็นปัญหาหรือโจทย์ที่ต้องการคำตอบเสียก่อน ว่าเป็นอะไร แล้วจึงคิดต่อไปว่า ประเด็นปัญหาเช่นนี้เทียบเคียงกับเรื่องทางสถิติแล้วคือปัญหาอะไร เช่น สนใจเปรียบเทียบตัวยาสองตำรับว่ามีความแตกต่างกันในประสิทธิผลการรักษาโรคหรือไม่ เมื่อเทียบเคียงกับประเด็นทางสถิติก็จะกำหนดได้เป็น ปัญหาการทดสอบว่าค่าเฉลี่ยของปัจจัยที่ใช้วัดประสิทธิผลของยาทั้งสองตำรับแตกต่างกันหรือไม่ เป็นต้น ให้สังเกตด้วยว่า เราไม่ต้องการวัดความแตกต่างของตัวยาสองตำรับเฉยๆ หรือในสารเคมีที่มาทำตัวยา แต่ต้องการเปรียบเทียบประสิทธิผลของยาในการรักษาโรค จึงต้องทราบว่าจะใช้ปัจจัยอะไรมาวัดประสิทธิผลของยา ซึ่งเรื่องนี้ เจ้าของศาสตร์ที่รักษาโรคจะต้องเป็นผู้กำหนดให้ โจทย์ทางสถิติจึงออกมาชัดเจนว่าเป็นการวัดค่าแตกต่างของตัวแปรใด และใช้ค่าใดเป็นตัวเปรียบเทียบ เช่น ใช้ค่าเฉลี่ย เป็นต้น ยกตัวอย่างกรณีของยารักษาความดันโลหิตสูง ตัวแปรที่ต้องนำมาพิจารณาคือ ค่า systolic และ diastolic ซึ่งคือความดันโลหิตเมื่อหัวใจบีบตัวและคลายตัว โดยต้องวัดหลังจากรับยาแล้วเป็นเวลาหนึ่ง เช่น 20 นาที เป็นต้น
ขั้นตอนที่ 2. หาข้อมูลที่มีคุณภาพมาใช้ในการวิเคราะห์
การหาคำตอบจะต้องอาศัยข้อมูลเป็นหลักฐานในการพิจารณา เมื่อกำหนดรายการข้อมูลที่ต้องนำมาใช้ในการวิเคราะห์ได้ถูกต้องชัดเจนแล้ว จึงทำการเก็บรวบรวมข้อมูล โดยต้องใช้วิธีที่เหมาะสมกับข้อมูลนั้นด้วย ซึ่งวิธีการเก็บรวบรวมข้อมูลนั้น มีอยู่เพียง 3 วิธีคือ การจดบันทึกหรือการทะเบียน การสำรวจ และการทดลอง ข้อมูลบางรายการต้องจัดเก็บด้วยวิธีหนึ่ง ในขณะที่บางรายการต้องจัดเก็บด้วยวิธีอื่น จึงจะได้ข้อมูลที่มีคุณภาพ เช่น ถ้าเป็นข้อมูลนักท่องเที่ยวที่เดินทางเข้ามาในประเทศไทย ก็ต้องเก็บด้วยวิธีการทะเบียน ถ้าไปเก็บด้วยวิธีการสำรวจ ก็จะมีปัญหาเรื่องความครบถ้วนของข้อมูล เป็นต้น การกำหนดวิธีการเก็บรวบรวมข้อมูลจึงเป็นเรื่องสำคัญ เพื่อให้ข้อมูลที่นำมาใช้มีคุณภาพดีและสามารถนำมาวิเคราะห์เพื่อตอบคำตอบได้ มิฉะนั้น ข้อสรุปที่เกิดขึ้นย่อมผิดพลาดตามไปด้วย นอกจากนี้ ข้อมูลที่นำมาใช้มักเป็นเพียงข้อมูลส่วนหนึ่งหรือข้อมูลตัวอย่างเท่านั้น ไม่ใช่ข้อมูลสมบูรณ์หรือข้อมูลประชากร การวิเคราะห์ข้อมูลจึงมักใช้วิธีการของสถิติเชิงอนุมาน เป็นส่วนใหญ่
ขั้นตอนที่ 3. อธิบายลักษณะของข้อมูลที่มี
ก่อนทำการวิเคราะห์เพื่อหาคำตอบของปัญหาที่สนใจ เราสมควรที่จะทำความเข้าใจเกี่ยวกับข้อมูลที่จัดหามาได้เสียก่อน การทำความเข้าใจคือการพยายามหาลักษณะสำคัญที่มีในข้อมูลชุดนั้น ว่าเป็นอย่างไร เช่น มีค่าหรือลักษณะที่ดูผิดปกติหรือไม่ หากมี จะได้กลับไปตรวจสอบข้อมูลรายการนั้นให้แน่ใจ มิใช่ปล่อยให้ข้อมูลนั้นทำให้ชุดข้อมูลผิดปกติไปด้วย นอกจากนี้ ยังต้องการดูลักษณะของข้อมูลชุดนี้ ว่ามีค่าอยู่ในช่วงใด มีค่ากลางเท่าไร มีการกระจายตัวของค่าในชุดข้อมูลมากน้อยเพียงไร มีรูปแบบการแจกแจงหรือการกระจายตัวอย่างไร เป็นต้น การอธิบายว่าข้อมูลที่มีอยู่นั้นมีลักษณะเช่นไร อาจถือเป็นการวิเคราะห์ข้อมูลขั้นเบื้องต้น เพื่อให้มีความเข้าใจในข้อมูลก่อนทำการวิเคราะห์ในขั้นต่อไป
ขั้นตอนที่ 4. วิเคราะห์ข้อมูลด้วยวิธีที่เหมาะสม
ขั้นตอนนี้เป็นการวิเคราะห์ข้อมูลเพื่อตอบคำถาม โดยเลือกวิธีวิเคราะห์ที่สามารถตอบคำถามได้อย่างถูกต้องเหมาะสม การวิเคราะห์จะเป็นการวิเคราะห์เชิงสถิติที่ลึกซึ้งมากขึ้น และมักเป็นการอนุมานจากข้อมูลตัวอย่างที่มีอยู่เพื่ออธิบายค่าประชากรที่สนใจ วิธีวิเคราะห์อาจเป็นวิธีเกี่ยวกับการประมาณค่า การทดสอบสมมติฐาน การหาความสัมพันธ์ และการพยากรณ์ เช่น ในกรณีที่สนใจเปรียบเทียบความแตกต่างของประสิทธิผลของยาสองตำรับในการรักษาโรคหนึ่งนั้น การวิเคราะห์ข้อมูลจะเป็นเรื่องของการทดสอบสมมติฐานว่าค่าเฉลี่ยของปัจจัยที่ใช้วัดแตกต่างกันหรือไม่ หรือของตำรับยาหนึ่งมากกว่าของอีกตำรับยาหนึ่งหรือไม่ แต่ถ้าต้องการทราบว่าประสิทธิผลของตำรับยาหนึ่งดีกว่าของอีกตำรับยาหนึ่งเท่าไร ก็อาจตั้งคำถามเป็นการประมาณค่าแตกต่าง และใช้วิธีการประมาณค่ามาหาคำตอบได้
ขั้นตอนที่ 5. สรุปผลเพื่อตอบคำถาม
เป็นขั้นตอนการแปลผลที่ได้จากการวิเคราะห์เชิงสถิติออกมาเป็นคำตอบสำหรับคำถามที่มีในเบื้องแรก ขั้นตอนนี้ ถือเป็นขั้นตอนที่สำคัญอีกขั้นตอนหนึ่ง เพื่อออกจากกรอบแนวคิดแบบสถิติศาสตร์ กลับไปสู่ความคิดของเรื่องที่สนใจตั้งแต่เริ่มต้นนั่นเอง เช่น ถ้าผลของการวิเคราะห์ที่เป็นการทดสอบสมมติฐานออกมาเป็นว่า ปฏิเสธสมมติฐานว่าง เราก็ต้องแปลความให้เข้าใจว่า ตกลงแล้ว ยาทั้งสองตัวมีประสิทธิผลต่างกันหรือไม่ หรือตัวหนึ่งมีผลในการรักษาดีกว่าอีกตัวหนึ่งอย่างไร เป็นภาษาที่ชัดเจน
สถิติเชิงพรรณนา กับสถิติเชิงอนุมาน ต่างกันอย่างไร?
แตกต่างกันทั้งในส่วนวิธีการและบทบาทที่มีในชีวิตประจำวัน
สถิติเชิงพรรณนา(Descriptive Statistics) นั้น เป็นวิชาสถิติหรือศาสตร์ที่ว่าด้วยการสรุปสาระสำคัญที่มีอยู่ในข้อมูลชุดหนึ่ง และนำเสนอข้อสรุปหรือนำสาระสำคัญในข้อมูลชุดนั้นออกมารายงาน หรืออธิบายว่ามีลักษณะเป็นอย่างไร หรือใช้ประโยชน์โดยไม่ทำการอ้างอิงไปยังข้อมูลชุดอื่นหรือข้อมูลชุดที่สมบูรณ์
กล่าวคือ สถิติเชิงพรรณนาจะว่าด้วยวิธีการในการสรุปและนำเสนอข้อมูลที่อธิบายลักษณะของข้อมูลชุดนั้นให้เป็นที่เข้าใจโดยสังเขป เช่น โดยการบอกว่าข้อมูลชุดนี้มีศูนย์กลางอยู่ที่ใด โดยการใช้ค่าเฉลี่ย หรือค่ามัธยฐานเป็นค่าแสดงว่าข้อมูลชุดนี้มีค่าอยู่ตรงไหนหรือบริเวณไหน
และโดยการบอกว่าข้อมูลชุดนี้มีค่าต่างๆ ปรากฏอยู่ในช่วงใด ค่าต่างๆ เหล่านี้เกาะกลุ่มกันมากน้อยเพียงไร หรือมีการกระจายตัวมากน้อยเพียงไร ด้วยการบอกว่า ค่าต่ำสุดค่าสูงสุดเป็นเท่าไร มีพิสัยกว้างยาวแค่ไหน มีค่าแปรปรวนและค่าเบี่ยงเบนมาตรฐานเท่ากับเท่าไร
หรืออาจใช้วิธีการสรุปด้วยแผนภาพที่ทำให้มองเห็นได้ว่าข้อมูลทั้งหมดอยู่ในช่วงใด มีค่ากลางเป็นเท่าไร มีการกระจายตัวของข้อมูลในชุดมากน้อยเพียงไร ด้วยการใช้แผนภาพกระจาย แผนภาพแสดงการแจกแจงของข้อมูล เป็นต้น
หลักการสำคัญคือ เราจะสนใจเฉพาะข้อมูลชุดที่มีในมือ และพยายามอธิบายข้อมูลชุดนี้ว่ามีลักษณะอย่างไร ด้วยวิธีต่างๆ ที่ทำให้สามารถสรุปลักษณะได้อย่างเหมาะสมและสื่อความหมายที่ถูกต้องเกี่ยวกับข้อมูลชุดนั้นเท่านั้น ภายใต้หลักการเช่นนี้ จึงอาศัยเพียงทฤษฎีทางสถิติที่มาอธิบายคุณลักษณะของวิธีการที่ใช้ในการอธิบายข้อมูล เช่นคุณสมบัติของค่าเฉลี่ย หรือค่าแปรปรวน เป็นต้น
สถิติเชิงอนุมาน(Inferential Statistics) เป็นวิชาสถิติหรือศาสตร์ที่ว่าด้วยทฤษฎีและวิธีการต่างๆ ในการวิเคราะห์ข้อมูลเพื่อตอบคำถามหรือปัญหาที่สนใจ โดยอาศัยข้อมูลเพียงส่วนหนึ่งที่มีอยู่เพื่ออธิบายข้อมูลชุดที่สมบูรณ์หรือประชากร
กล่าวคือ จากข้อมูลที่มีอยู่ซึ่งไม่ใช่ข้อมูลชุดสมบูรณ์(คือมีเฉพาะข้อมูลส่วนเดียว ที่มักเรียกว่าข้อมูลตัวอย่าง) เราต้องการสรุปสาระสำคัญในข้อมูลชุดสมบูรณ์หรือลักษณะของปรากฏการณ์หนึ่งด้วยการใช้ข้อมูลตัวอย่างหรือข้อมูลเพียงส่วนหนึ่งจากชุดข้อมูลที่สมบูรณ์นั้น แล้วทำการอนุมานจากข้อมูลตัวอย่างไปสู่ข้อมูลชุดสมบูรณ์
ความแตกต่างจากสถิติเชิงพรรณนาอยู่ที่ตรงนี้ สถิติเชิงพรรณนาทำการสรุปสาระสำคัญในข้อมูลชุดที่มีอยู่ในมือหรืออธิบายลักษณะของข้อมูลชุดนี้เท่านั้น ไม่มีการอ้างอิงถึงข้อมูลชุดอื่นหรือพยายามไปอธิบายข้อมูลชุดสมบูรณ์ เรียกว่าไม่ทำการอนุมานไปสู่ข้อมูลชุดที่สมบูรณ์นั่นเอง แต่สถิติเชิงอนุมานนั้น ไม่ใช่เลย จุดหมายหลักคือต้องการอธิบายข้อมูลชุดที่สมบูรณ์หรือประชากรว่ามีหน้าตาเป็นอย่างไร แต่ในความเป็นจริงนั้น เราไม่สามารถหาข้อมูลชุดที่สมบูรณ์ได้เสมอ ด้วยสาเหตุหลายประการ เช่น ไม่สามารถเก็บรวบรวมได้ทั้งหมด ตัวอย่างเช่น ต้องการทราบว่ามีคนกรุงเทพฯ สักกี่เปอร์เซนต์ที่เห็นด้วยกับรนโยบายการเก็บภาษีป้องกันน้ำท่วม ข้อมูลชุดสมบูรณ์หรือประชากรคือข้อมูลความคิดเห็นของคนกรุงเทพฯ ทั้งหมด ซึ่งหากเก็บรวบรวมให้สมบูรณ์ย่อมต้องใช้งบประมาณ แรงงาน และเวลามากเกินกว่าที่จะได้ใช้ประโยชน์จากข้อมูลทั้งหมดนั้น เมื่อเวลาและงบประมาณมีจำกัด ก็ต้องหาวิธีในการเก็บข้อมูล เก็บไม่ได้ทั้งหมด ก็ต้องเก็บมาเพียงบางส่วน เอาข้อมูลบางส่วนนี้มาวิเคราะห์ แต่พอตอนจะสรุปผล ก็ต้องการสรุปผลในระดับประชากรอีก คือต้องการบอกว่า ประมาณการได้ว่าคนกรุงเทพฯ กี่เปอร์เซนต์เห็นด้วย ไม่ใชว่าคนกรุงเทพฯ เฉพาะในตัวอย่างเห็นด้วยกี่เปอร์เซนต์ เมื่อคุณค่าของข้อสรุปและความต้องการเป็นเช่นนี้ ก็ต้องหาวิธีการที่จะทำให้สรุปได้ แม้จะไม่ได้ครบถ้วนตามที่ต้องการ แต่ก็ต้องดีที่สุดเท่าที่จะทำได้ สถิติเชิงอนุมานคือวิธีการต่างๆ ที่มาช่วยในกรณีเช่นนี้ เพื่อหาคำตอบในระดับประชากรโดยอาศัยเพียงข้อมูลตัวอย่าง
จะเห็นได้ว่า ประโยชน์ของสถิติเชิงอนุมานมีมากมาย และเป็นเรื่องจำเป็นสำหรับการสร้างความรู้และการประยุกต์ใช้ข้อมูล ข้อสำคัญที่ต้องระมัดระวังคือ ต้องตระหนักว่า วิธีการเหล่านี้ช่วยทำให้ตอบคำถามที่ต้องการได้ แต่ด้วยคุณภาพระดับหนึ่งเท่านั้น ซึ่งระดับคุณภาพหรือความเชื่อถือได้ในข้อสรุป ก็จะขึ้นอยู่กับข้อมูลตัวอย่างที่เอามาใช้ ว่ามีขนาดและคุณภาพในการเป็นตัวแทนประชากรที่ดีเพียงใด และขึ้นอยู่กับวิธีการสรุปผลว่าเป็นวิธีที่เหมาะสมและมีคุณภาพดีมากน้อยเพียงไรนั่นเอง
ประเด็นคุณภาพนี้ จึงเป็นประเด็นสำคัญที่ทุกคนที่ใช้ประโยชน์ข้อมูลต้องตระหนัก และพินิจพิจารณาให้ดี ก่อนที่จะเชื่อสารสนเทศหรือข้อสรุปที่ได้มา ไม่ใช่ว่า อะไรที่มีการตีพิมพ์หรือประกาศจะเป็นเรื่องที่เชื่อถือได้ทั้งหมดเสมอไป โดยเฉพาะอย่างยิ่งในยุคที่ข้อมูลข่าวสารมีมากเหลือล้น จนจะท่วมทับผู้ใช้อยู่อย่างนี้ การพิจารณาเรื่องความเชื่อถือได้ของข้อมูลและข้อสรุป ยิ่งเป็นเรื่องจำเป็นและสำคัญมากยิ่งขึ้น พูดง่ายๆ คืออย่าเชื่อโดยไม่กรอง หรือตั้งคำถามที่ควรตั้งเสียก่อน
สถิติเชิงอนุมานมีประโยชน์อย่างมากในการปฏิบัติงานและกลายเป็นสิ่งจำเป็นในการสร้างความรู้ในศาสตร์ต่างๆ โดยเฉพาะศาสตร์ที่ต้องอาศัยการพิจารณาการเกิดซ้ำๆ กันของปรากฏการณ์ในศาสตร์นั้นมาอธิบายหรือสร้างความรู้ในศาสตร์นั้น ทั้งนี้ พื้นฐานสำคัญของสถิติเชิงอนุมานคือทฤษฎีทางคณิตศาสตร์และทฤษฎีความน่าจะเป็น และได้มีการพัฒนาทฤษฎีทางสถิติศาสตร์ขึ้นมาเป็นหลักสำคัญในการเก็บรวบรวมข้อมูลและการวิเคราะห์ข้อมูล โดยในส่วนของการเก็บรวบรวมข้อมูลนั้น จะครอบคลุมทฤษฎีและวิธีการในเรื่องการสำรวจตัวอย่างและการวางแผนแบบการทดลอง ส่วนการวิเคราะห์ข้อมูลนั้น มีวิธีการที่หลากหลายเพื่อใช้ประโยชน์ตามความต้องการ เช่น การวิเคราะห์ความถดถอยเพื่อวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรและเพื่อการพยากรณ์ การวิเคราะห์ความแปรปรวนเพื่อเปรียบเทียบอิทธิพลของปัจจัยต่างๆ ที่มีต่อสิ่งที่สนใจ การวิเคราะห์อนุกรมเวลาเพื่อการพยากรณ์ และการจำแนกกลุ่ม เป็นต้น
Thursday, October 30, 2008
สถิติคืออะไร สถิติกับสถิติศาสตร์ต่างกันหรือไม่??
ว่ากันถึงการใช้ประโยชน์สถิติในชีวิตประจำวันกันมาหลายวันแล้ว อาจมีคนถามว่า แล้วเจ้าสถิติที่พูดถึงนี้ คืออะไรกัน ที่เรียนๆ กันมาก็มีวิชาสถิติ สถิติเบื้องต้น หลักสถิติ สถิติศาสตร์ ฯลฯ หลายชื่อเต็มที่ ดังนั้น วันนี้ควรมาทำความเข้าใจกับสถิติอย่างเป็นทางการเสียหน่อย
อันที่จริง คำว่าสถิตินั้น อาจหมายถึงข้อมูลสถิติ หรือวิชาการทางสถิติที่เรียกว่าสถิติศาสตร์ก็ได้
เอาความหมายแรกก่อน สถิติที่หมายถึงข้อมูลสถิตินั้น เป็นความหมายที่จำกัดเฉพาะ โดยหมายความถึงสถิติที่เป็นข้อมูลที่มีการจัดเก็บมาและนำเสนอเพื่อให้ผู้ใช้นำไปใช้ประโยชน์ โดยอาจจะมีการวิเคราะห์ข้อมูลเบื้องต้นอยู่ด้วยได้ สถิติในความหมายนี้ จึงเป็นสถิติในลักษณะที่บอกว่าข้อมูลในเรื่องหนึ่งๆ เป็นอย่างไร เช่น สถิตินักท่องเที่ยวที่เดินทางเข้าประเทศไทยในช่วงเดือนมกราคม 2551 ถึง ตุลาคม 2551 ก็เป็นสถิติที่แสดงข้อมูลจำนวนนักท่องเที่ยวที่เดินทางเข้ามาในประเทศไทย โดยอาจแสดงรายละเอียดเป็นรายเดือน รายไตรมาส แยกตามสัญชาติ หรือตามด่านที่เดินทางเข้า หรือตามประเภทของการเดินทาง เป็นต้น สถิตินี้ ได้มาจากข้อมูลที่จัดเก็บโดยสำนักงานตรวจคนเข้าเมือง นำมารวบรวมจัดทำเป็นสถิติ หรือสถิติการส่งออกสินค้าของประเทศไทยในช่วงเวลาหนึ่ง ก็เป็นสถิติที่ประมวลได้จากข้อมูลการส่งออกสินค้าประเภทต่างๆ โดยอาจจำแนกออกตามประเภทของสินค้า วิธีการส่งสินค้า ประเทศปลายทางหรือภูมิภาคปลายทาง โดยให้รายละเอียดทั้งปริมาณและมูลค่าสินค้า เป็นต้น
ทีนี้ก็มาถึงความหมายที่สอง สถิติที่หมายถึงวิชาสถิติ หรือสถิติศาสตร์ ที่มีการเรียนการสอนกันทั่วไป สถิติศาสตร์คือศาสตร์ที่ว่าด้วยการวิเคราะห์ข้อมูลเพื่อหาข้อสรุปจากข้อมูลที่เกี่ยวข้องมาอธิบายปรากฏการณ์หนึ่ง หรือตอบคำถามหรือตอบประเด็นปัญหาที่สนใจ ในความหมายนี้ สถิติเป็นศาสตร์ที่สำคัญศาสตร์หนึ่งเชียวแหละ ต้องเรียนกันเป็นสาขาวิชา มีทั้งระดับปริญญาตรี โท เอก เรียนก็ยาก แต่น่าสนใจเพราะโลกใบนี้ ขาดสถิติก็ไม่ได้ ยังไงๆ ก็คงต้องมีคนเรียนอยู่ดี
สถิติศาสตร์ต้องอาศัยคณิตศาสตร์เป็นพื้นฐานที่จำเป็น พวกที่เน้นทางทฤษฎีก็ต้องพยายามสร้างทฤษฎีใหม่ๆ ที่ให้วิธีการวิเคราะห์ข้อมูลที่ดีขึ้น มีคุณภาพมากขึ้น หรือแก้ไขปัญหาข้อขัดข้องต่างๆ ของวิธีเดิมๆ แต่ก็มีพวกที่นำทฤษฎีมาใช้ เรียกว่า สถิติประยุกต์ด้วย
แต่พวกที่เรียนสนุกกว่า อาจเป็นพวกที่นำสถิติศาสตร์ไปใช้ในศาสตร์ของตนเองหนักๆ เช่น เศรษฐศาสตร์ที่เป็นเศรษฐมิติ ต้องเรียนสถิติศาสตร์มาก เพราะต้องนำไปใช้ในการสร้างตัวแบบและวิเคราะห์ข้อมูลทางเศรษฐศาสตร์ หรือทางการแพทย์ ทางเภสัชศาสตร์ ก็ต้องอาศัยสถิติศาสตร์ในการทดลองทั้งวิธีการรักษาพยาบาล และตัวยาที่พัฒนาขึ้น จนเป็นศาสตร์ที่เรียกกันว่า ชีวสถิติ (Biostatistics) ทางธุรกิจ ก็ใช้สถิติวิเคราะห์ขั้นลึกในการตัดสินใจแทบทุกด้าน เช่น ในการวางแผนการผลิตและการตลาด มีการพยากรณ์สภาพตลาดในช่วงเวลาต่อไป หรือการวิเคราะห์ข้อมูลลูกค้าเพื่อหาทางที่จะสนองความต้องการของลูกค้าให้ดียิ่งขึ้น เมื่อมีลูกค้าจำนวนมากๆ เข้า ก็ต้องใช้คอมพิวเตอร์เป็นตัวช่วย วิธีการที่รู้จักกันทั่วไปเรียกว่า Data Mining หรือ Information Mining และอื่นๆ อีกมากมาย
กลับมาประเด็นการวิเคราะห์ข้อมูลโดยทั่วไปอีกสักนิด คงต้องย้ำว่าการวิเคราะห์ข้อมูลเพื่อหาข้อสรุปนี้ จำเป็นต้องมีข้อมูลที่ดีมีคุณภาพ เพื่อให้ข้อสรุปหรือคำตอบมีคุณภาพเชื่อถือได้เช่นกัน สถิติศาสตร์จึงต้องเกี่ยวข้องกับศาสตร์ของการเก็บรวบรวมข้อมูลด้วย สถิติในความหมายนี้ จึงเป็นเรื่องทางวิชาการที่เกี่ยวกับการหาวิธีที่เหมาะสมในการเก็บรวบรวมข้อมูลเพื่อเป็นหลักฐานที่จะนำไปใช้ในการวิเคราะห์ และการหาวิธีที่เหมาะสมในการวิเคราะห์ข้อมูลเพื่อให้ได้ข้อสรุปที่มีความถูกต้องเชื่อถือได้ และสามารถตอบคำถามหรือเป็นคำตอบของประเด็นปัญหาที่สนใจได้นั่นเอง
ในเรื่องของข้อมูลและการเก็บรวบรวมข้อมูลนั้น มีประเด็นที่น่าสนใจหลายประการ ที่สำคัญคือ จากเรื่องหรือปัญหาที่สนใจ เราต้องใช้ข้อมูลอะไรบ้างมาตอบปัญหา ข้อมูลแต่ละรายการมีลักษณะอย่างไร วิธีการเก็บรวบรวมข้อมูลที่พึงใช้เป็นอย่างไร ข้อสังเกตเกี่ยวกับข้อมูลที่ได้มาเป็นอย่างไร ทั้งหมดนี้จะกล่าวถึงใน blog ชื่อ statsdata.blogspot.com ซึ่งกำลังพัฒนาอยู่ คอยติดตามนะคะ
ส่วนการวิเคราะห์ข้อมูลนั้น เป็นเรื่องที่ต้องอาศัยหลักการและวิธีการทางสถิติศาสตร์ที่ต้องทำความเข้าใจให้ดี และจะกล่าวถึงใน blog ที่จะสร้างขึ้นต่อไป แต่ใน blog นี้ จะขอกล่าวถึงหลักการพื้นฐานของการวิเคราะห์ข้อมูลไว้ชั้นหนึ่งก่อน เพื่อเป็นการทำความเข้าใจเกี่ยวกับการวิเคราะห์เบื้องต้นซึ่งเรียกว่า สถิติเชิงพรรณนา และการวิเคราะห์ข้อมูลขั้นสูง หรือที่เรียกว่า สถิติเชิงอนุมาน ในหัวข้อต่อไป
การพยากรณ์ยอดขายสินค้า...ตัวอย่างสถิติในชีวิตประจำวัน
ใครๆ ก็ว่าการวางแผนอนาคตเป็นเรื่องสำคัญ ยิ่งสำหรับธุรกิจด้วยแล้ว การวางแผนดำเนินธุรกิจของกิจการเป็นเรื่องที่พลาดไม่ได้ พอช่วงปลายๆ ปี ทุกองค์กรก็ต้องระดมสมองกันคิดว่าปีหน้าจะวางแผนอย่างไร โดยปกติธุรกิจจะมีแผนยุทธศาสตร์ที่กำหนดเป้าหมายของกิจการไว้ สำหรับกิจการที่ขายสินค้าหรือบริการ ก็จะกำหนดเป้าหมายการดำเนินงานในรูปของยอดขายสินค้าและ/หรือบริการ
การพยากรณ์หรือการคาดประมาณยอดขายสินค้าและบริการจึงเป็นสิ่งสำคัญประการหนึ่งที่ต้องดำเนินการให้มีความถูกต้องเชื่อถือได้ เพื่อเป็นหลักในการวางแผนดำเนินงานของกิจการต่อไป
สมมติว่าเราสนใจการพยากรณ์ยอดขายสินค้า เราก็ต้องทราบว่า อนาคตเป็นเรื่องของความไม่แน่นอน แต่ภายใต้ความไม่แน่นอนนี้ เราน่าจะสามารถจับรูปแบบบางอย่างมาช่วยเราคาดการได้ แล้วก็มองอนาคตในลักษณะการคาดประมาณที่พึงเป็นภายใต้เงื่อนไขบางประการ เช่น ภายใต้สภาพทางเศรษฐกิจที่ไม่เปลี่ยนแปลงจากเดิม และรูปแบบการขยายตัวของยอดขายสินค้าที่เป็นอยู่ในช่วงเวลาที่ผ่านมา เป็นต้น ก็จะสามารถนำข้อมูลอดีตมาเป็นข้อมูลหลักในการพยากรณ์สิ่งที่จะเกิดขึ้นในอนาคตได้ ตรงนี้แหละ คือส่วนที่สถิติจะสามารถเข้ามาช่วยได้ ด้วยการจับรูปแบบที่เกิดขึ้นมาแล้วจากการวิเคราะห์ข้อมูลอดีต และให้วิธีการในการพยากรณ์ค่าอนาคต
แต่สถิติจะทำงานโดดๆ ไม่ได้!!! สถิติเป็นเครื่องมือในการวิเคราะห์ข้อมูล แต่ต้องภายในกรอบขององค์ความรู้ในเรื่องนั้นๆ เช่น ในการพยากรณ์ยอดขายสินค้า นอกจากข้อมูลยอดขายสินค้านั้นในแต่ละช่วงเวลาที่ผ่านมา ยังอาจมีข้อมูลอื่นที่จะมาช่วยอธิบายลักษณะการเปลี่ยนแปลงของยอดขายได้ เช่น การดำเนินการส่งเสริมการขายของกิจการ ลักษณะของตลาด และเงื่อนไขอื่น ซึ่งผู้ที่มีความรู้ในเรื่องนั้นจะสามารถบอกหรือกำหนดได้ว่า ยอดขายสินค้ามีความสัมพันธ์กับปัจจัยใดบ้าง สถิติจะช่วยในการเก็บรวบรวมข้อมูล และวิเคราะห์ข้อมูลให้เห็นว่า สิ่งที่ผู้ที่เป็นเจ้าของศาสตร์คิด หรือรูปแบบความสัมพันธ์ที่คาดไว้เป็นอย่างไร และมีความน่าเชื่อถืออย่างไร
ตัวอย่าง เช่น ถ้าผู้รู้เรื่องนั้นมีความเชื่อว่า ยอดขายสินค้าในไตรมาสต่างๆ ของปีต่อไป จะขึ้นอยู่กับแนวโน้มการขยายตัวของตลาดของสินค้าชนิดนี้ โดยมีการเคลื่อนไหวตามฤดูกาล สถิติก็อาจเสนอให้ใช้วิธีการวิเคราะห์อนุกรมเวลาในการพยากรณ์ยอดขายรายไตรมาสในปีต่อไป แต่หากเชื่อว่ายอดขายรายไตรมาสในปีต่อไปจะขึ้นอยู่กับปัจจัยต่างๆ ต่อไปนี้ คือ ส่วนแบ่งตลาดของสินค้า จำนวนพนักงานขาย ค่าใช้จ่ายในการส่งเสริมการขาย และราคาสินค้า วิธีการวิเคราะห์เพื่อพยากรณ์ยอดขายรายไตรมาสในปีต่อไป อาจเป็นวิธีการวิเคราะห์ความถดถอยที่นำเอาปัจจัยข้างต้นเป็นตัวแปรอิสระมาช่วยอธิบายการเปลี่ยนแปลงในยอดขายเพื่อทำการพยากรณ์ยอดขายรายไตรมาสในปีต่อๆ ไป เป็นต้น
เห็นไหมคะ ว่าสถิติมีประโยชน์และจำเป็นในการพยากรณ์อย่างมีเหตุมีผล เพราะสถิติเป็นศาสตร์ที่เสนอวิธีการวิเคราะห์ข้อมูล เพื่อพยากรณ์ยอดขายสินค้าและบริการได้อย่างเหมาะสมและเชื่อถือได้ โดยมีทฤษฎีที่เกี่ยวข้องช่วยกำหนดคุณภาพของการพยากรณ์ด้วย หลักสำคัญคือคุณภาพการพยากรณ์ เพราะถ้าพยากรณ์อย่างไม่มีคุณภาพ ก็ย่อมสร้างปัญหาในการดำเนินธุรกิจอย่างแน่นอน
Tuesday, October 28, 2008
การพัฒนายารักษาโรค...ตัวอย่างสถิติในชีวิตประจำวัน
คนเรานั้น เรื่องการแก่ การเจ็บป่วย เป็นสิ่งที่หลีกเลี่ยงไม่พ้น ยารักษาโรคจึงเป็นปัจจัยสำคัญของชีวิต เราอยากได้ยาดี ยาที่ไม่มีผลข้างเคียง ยาที่รักษาเราให้หายจากโรคได้จริงๆ ใช่ไหม?
ใครรู้บ้างว่า การพัฒนายาตัวใหม่ ให้เป็นยาที่ดีที่อยากได้นั้น ต้องอาศัยสถิติด้วย!!!
การพัฒนายาตัวใหม่นั้น เป็นการวิจัยพัฒนาที่มีความสำคัญ และมีความยุ่งยากซับซ้อนมาก กว่าจะได้ตัวยาที่คิดว่าใช้ได้ แล้วยังต้องทำการทดลองเป็นลำดับขั้น ตั้งแต่ดูประสิทธิภาพประสิทธิผลของยาทางเภสัชวิทยา แล้วค่อยมาทำการทดลองใช้ในสัตว์ทดลอง จนแน่ใจว่าปลอดภัยและได้ผลดีแล้ว จึงนำมาทดลองในคน ค่าพัฒนายาจึงสูงมาก ทำให้ยาแพงไปด้วย ซึ่งบ่อยครั้งไม่ใช่ตัวสารที่นำมาปรุงยามีราคาแพง แต่เป็นเพราะค่าใช้จ่ายในการวิจัยเพื่อหาตัวยาที่เหมาะสมนั่นแหละที่เป็นตัวแพง
แล้วสถิติหรือสถิติศาสตร์เข้ามามีบทบาทในการพัฒนายาอย่างไร??
เริ่มต้นด้วยความต้องการข้อสรุปที่มีความเชื่อถือได้สูงและเป็นประโยชน์ต่อการรักษาหรือป้องกันโรค สถิติต้องเข้ามาจัดระบบการทดลองให้มั่นใจได้ว่า ผลสรุปที่ได้เป็นข้อสรุปที่เชื่อถือได้
การทดสอบประสิทธิผลของยาตำรับหนึ่งที่มีต่อการรักษาโรคหนึ่งนั้น โดยปกติมักเป็นการศึกษาเพื่อเปรียบเทียบประสิทธิผลของยาตำรับใหม่กับยาตำรับเดิมที่มีการใช้อยู่ในปัจจุบัน หรือกับการไม่ใช้ยาเลย ว่ายาตำรับใหม่จะมีประสิทธิผลในการรักษาดีกว่าหรือไม่ หรือมีผลข้างเคียงน้อยกว่ายาเดิมหรือไม่
สถิติศาสตร์จะเข้ามาช่วยในการวางแผนการทดลอง โดยมีทฤษฎีสถิติที่กำหนดวิธีการวางแผนการทดลองที่เหมาะสมสำหรับปัญหาแต่ละกรณี พอทดลองแล้ว ก็เก็บข้อมูลจากการทดลองไปทำการวิเคราะห์หาข้อสรุป ข้อสำคัญคือ ทำอย่างไรให้มั่นใจได้ว่าข้อมูลที่ได้จากการทดลองสามารถบอกได้จริงๆ ว่ายาตัวนี้มีผลในการรักษาอย่างไรโดยเปรียบเทียบกับตัวอื่นหรือการไม่ใช้ยา
การออกแบบแผนการทดลองจึงเป็นสิ่งสำคัญมาก เนื่องจากถ้าออกแบบไม่ถูกต้อง ข้อมูลที่เกิดขึ้นจากการทดลองจะไม่สามารถตอบปัญหาได้ เช่น อาจมีผลกระทบจากปัจจัยอื่นเข้ามาปรากฏในข้อมูล จนไม่สามารถสรุปได้ว่า ผลที่ได้นั้น เกิดจากตัวยาหรือเกิดจากปัจจัยอื่นนั้นๆ หลักการสำคัญของการออกแบบการทดลองจึงเป็นการสร้างสถานการณ์ที่สามารถแสดงผลของยาโดยไม่มีอิทธิพลของปัจจัยอื่นเข้ามาปะปน
ตัวอย่างเช่น ถ้าต้องการเปรียบเทียบผลของยารักษาโรคความดันโลหิตสูง 2 ตำรับ สถิติศาสตร์จะช่วยทำการออกแบบการทดลองเพื่อให้มั่นใจว่า ผลที่ได้จากการทดลองจะแสดงถึงผลการรักษาโรคของตัวยาทั้งสองตำรับ โดยไม่มีปัจจัยอื่น เช่น อายุ ระดับความดันโลหิต สภาพแวดล้อมในขณะวัดผล ระยะเวลาที่ให้ยาออกฤทธิ์ เป็นต้น เข้ามาปะปนอยู่ในข้อมูลที่เก็บได้ พอข้อมูลแสดงว่าแตกต่าง ก็สามารถสรุปได้ว่า ความแตกต่างนั้นมาจากตัวยา สำหรับกรณีนี้ สถิติศาสตร์จะออกแบบการทดลองว่า ให้เลือกคนไข้ที่มีลักษณะของระดับความดันโลหิตและปัจจัยต่างๆ ที่คาดว่ามีผลต่อความดันโลหิตที่เหมือนกันเป็นคู่ๆ แล้วเลือกหนึ่งคนในแต่ละคู่อย่างสุ่มให้กินยาตำรับหนึ่ง ส่วนอีกคนที่เหลือในคู่นั้นให้กินยาอีกตำรับหนึ่ง เมื่อทำการทดลอง ก็ต้องดำเนินการในสถานการณ์ที่เหมือนกันทุกประการ เช่น วัดความดันโลหิตหลังจากกินยาแล้วครึ่งชั่วโมงโดยให้ผู้ทดลองอยู่ในสิ่งแวดล้อมเดียวกัน เป็นต้น พูดง่ายๆ ก็คือ ทำให้ตัวแปรอื่นที่อาจมีผลต่อระดับความดันโลหิตมีสภาพที่เหมือนกันหมด สิ่งที่แตกต่างคือตัวยาเท่านั้น ผลที่เกิดขึ้น ถ้าแตกต่าง ก็ต้องมาจากตัวยาที่ต่างกันนั่นเอง
สถิติที่ใช้ในการพัฒนายานี้ถือได้ว่า มีคุณประโยชน์มหาศาลต่อมนุษย์ เพระทำให้เราได้ตัวยาใหม่ๆ ที่มีผลดีต่อการรักษาโรค หรือแก้ปัญหาผลข้างเคียงที่ไม่พึงประสงค์ต่างๆ ได้ นับเป็นส่วนสำคัญที่ขาดไม่ได้เลยในการพัฒนายารักษาโรค
การประกันชีวิต...อีกตัวอย่างของสถิติในชีวิตประจำวัน
คนส่วนใหญ่เมื่อถึงวัยหนึ่ง มีงานทำ มีรายได้ มีครอบครัวที่ต้องดูแล ก็มักคิดถึงการประกันชีวิต นัยว่าเป็นการเตรียมการป้องกันความเสี่ยงสำหรับครอบครัวประเภทหนึ่ง ประเทศไทยนั้น ยังมีการทำประกันชีวิตน้อยกว่าหลายๆ ประเทศในโลก และคาดกันว่าจะมีการทำประกันชีวิตเพิ่มมากขึ้น
การประกันชีวิตโดยทั่วไป ผู้ทำประกันจะตกลงเลือกกรมธรรม์ประกันชีวิตแบบหนึ่ง ซึ่งกำหนดสิทธิประโยชน์หรือจำนวนเงินเอาประกัน หรือจำนวนเงินที่ผู้รับประโยชน์จะได้รับเมื่อผู้ทำประกันเสียชีวิตภายใต้เงื่อนไขที่ตกลงกัน โดยผู้ทำประกันจะจ่ายเงินค่าเบี้ยประกันให้แก่บริษัทประกันชีวิตตามกำหนดจำนวนปีที่ตกลงไว้ในกรมธรรม์ หรือจ่ายเป็นรายปีไปจนถึงอายุหนึ่ง แต่หากผู้ทำประกันถึงแก่กรรมก่อน ผู้รับประโยชน์จะได้รับประโยชน์โดยไม่ต้องมีการจ่ายค่าเบี้ยประกันอีก
ประเด็นที่น่าคิดคือ จะกำหนดค่าเบี้ยประกันสำหรับกรมธรรม์หนึ่งๆ อย่างไร จึงจะเป็นธรรมกับทุกฝ่าย
ไม่มีผู้ใดทราบว่าบุคคลหนึ่งจะอยู่จนถึงอายุเท่าไร
การคิดค่าเบี้ยประกันจึงต้องอยู่บนหลักการว่า โดยเฉลี่ยแล้ว บุคคลหนึ่งเชื้อชาติหนึ่งที่มีอายุหนึ่งจะมีโอกาสมีชีวิตอยู่จนถึงอีกอายุหนึ่งเท่าไร หรืออัตราตายโดยเฉลี่ยก่อนถึงอายุหนึ่งสำหรับคนอายุหนึ่งเป็นเท่าไร
ตรงนี้แหละที่สถิติต้องเข้ามาเกี่ยว เพราะการคำนวณอัตราตายหรืออัตราอยู่รอดในลักษณะเช่นนี้ ต้องใช้ความรู้ทางสถิติในการรวบรวมข้อมูลจำนวนมากเพียงพอ และการสร้างตัวแบบเพื่อสร้างตารางมรณะที่เหมาะสมสำหรับคนในภูมิภาคหนึ่ง
หากอัตราตายหรืออัตราการอยู่รอดที่ใช้ไม่ถูกต้อง บริษัทประกันชีวิตก็จะจัดเก็บค่าเบี้ยประกันสูงหรือต่ำกว่าที่ควร
ถ้าต่ำไป ก็ไม่สามารถมีรายรับเพียงพอกับค่าใช้จ่าย เป็นปัญหากับผู้ทำประกันอีก
ถ้าสูงไป ก็ทำให้เบี้ยประกันสูงกว่าที่พึงเป็น เท่ากับไม่เป็นธรรมต่อผู้ซื้อประกัน
เห็นไหมคะ ว่าสถิติมีประโยชน์ในการใช้ชีวิตประจำวันของเราจริงๆ
Monday, October 27, 2008
โพล (Poll) ก็เป็นเรื่องสถิติ
การสำรวจความคิดเห็นหรือที่เรียกกันทั่วไปว่าโพล (Poll) เป็นเรื่องที่เราคุ้นเคยในชีวิตประจำวัน เนื่องจากมีการรายงานผลการทำโพลอยู่เสมอๆ โดยเฉพาะอย่างยิ่งในเรื่องเกี่ยวกับการเมืองและเศรษฐกิจ เช่น การสำรวจความคิดเห็นเกี่ยวกับผู้สมัครรับเลือกตั้ง หรือพรรคการเมืองในช่วงการเลือกตั้ง การสำรวจความคิดเห็นเกี่ยวกับสภาวะทางเศรษฐกิจเมื่อมีการเปลี่ยนแปลงบางประการเกิดขึ้น เป็นต้น ตัวอย่างเช่น
· สวนดุสิตโพล เสนอข่าวผลการจัดทำโพล “ผู้สมัครส.ส.” และ “พรรคการเมือง” แบบใด? ที่ “คนไทย” อยากเลือก เมื่อ 21 ตุลาคม 2550 ว่า
“... จากการที่จะมีการเลือกตั้ง ในวันที่ 23 ธันวาคม 2550 ความตื่นตัวของคนไทยที่มีการตอบรับการเลือกตั้งครั้งนี้ดูจะเป็นที่สนใจของทุกฝ่าย สวนดุสิตโพล มหาวิทยาลัยราชภัฏสวนดุสิต จึงได้สำรวจความคิดเห็นของผู้ที่มีสิทธิเลือกตั้งที่มีอายุตั้งแต่ 18 ปี ขึ้นไป ในหัวข้อ “ผู้สมัคร ส.ส.” แบบไหน? “พรรคการเมือง” แบบใด? ที่คนไทยอยากเลือก โดยกระจายตามจังหวัดที่เป็นตัวแทนของภูมิภาคทั่วประเทศ จำนวน 1,884 คน (กรุงเทพฯ 879 คน 46.66% ต่างจังหวัด 1,005 คน 53.34%) สำรวจระหว่างวันที่ 17-21 ตุลาคม 2550 สรุปผลได้ดังนี้
1) 5 อันดับ คุณสมบัติของ “ผู้สมัครส.ส.” ที่คนไทยอยากเลือก
อันดับที่ ร้อยละ
1 ซื่อสัตย์ สุจริต /ไม่โกงกินบ้านเมือง 41.62%
2 เป็นคนดี มีคุณธรรม 19.29%
3 ทำงานเพื่อส่วนรวม /นึกถึงประชาชนเป็นสำคัญ 17.77%
4 มีความรู้ ความสามารถ /มีความเป็นผู้นำ 12.18%
5 มีพื้นฐานทางครอบครัวที่ดี /ประวัติดี 9.14%
2) 5 อันดับ ลักษณะของ “พรรคการเมือง” ที่คนไทยอยากเลือก
อันดับที่ ร้อยละ
1 ซื่อสัตย์ ไม่คดโกง มีความโปร่งใสในการทำงาน 28.95%
2 มีวิสัยทัศน์กว้างไกล /มีนโยบายการทำงานที่ชัดเจน
และสามารถทำให้เห็นเป็นรูปธรรมได้ 23.68%
3 มีความพร้อมในการทำงานเพื่อประเทศชาติ /มีความตั้งใจจริง 21.05%
4 เข้าถึงประชาชน รับฟังปัญหา /ให้ความช่วยเหลืออย่างจริงจัง 20.85%
5 มีอุดมการณ์ที่แน่นอน มั่นคง 5.47%
.....”
(http://www.dusitpoll.dusit.ac.th/data_50.html)
· รามคำแหงโพล ศูนย์ประชามติ สถาบันวิจัยและพัฒนาเสนอโพล “โครงการหนึ่งตำบล หนึ่งผลิตภัณฑ์: ปัญหามากรอการแก้ไข” ได้จัดทำการสำรวจความคิดเห็นและเสนอรายงาน เมื่อ 21 มีนาคม 2545 ดังนี้
“...ศูนย์ประชามติ สถาบันวิจัยและพัฒนา มหาวิทยาลัยรามคำแหง จึงทำการสำรวจความคิดเห็นของคณะกรรมการบริหารส่วนตำบลซึ่งเป็นตัวแทนทุกจังหวัดทุกภาคทั่วประเทศ เพื่อจะได้เป็นประโยชน์ต่อการพัฒนาการดำเนินงานตามนโยบายของรัฐบาลต่อไป ผลการสำรวจของรามคำแหงโพลล์เกี่ยวกับความคิดเห็นของคณะกรรมการองค์การบริหารส่วนตำบลจำนวน 922 คนซึ่งเป็นกลุ่มตัวอย่างที่เป็นตัวแทนจากทุกภาคทั่วประเทศในเรื่องปัญหาการดำเนินงานโครงการหนึ่งตำบล หนึ่งผลิตภัณฑ์ของรัฐบาล พบว่ามีปัญหามากทั้งปัญหาการขาดแคลนเงินทุนของชาวบ้าน การขาดแคลนตลาดสำหรับขายผลิตภัณฑ์ การขาดความรู้ด้านการผลิตของชาวบ้าน และการขาดการดูแลจากเจ้าหน้าที่ของรัฐ ตามลำดับ ที่มีปัญหาระดับปานกลาง คือ คุณภาพของสินค้าที่ชาวบ้านผลิตไม่ได้มาตรฐาน ....... นอกจากนี้ยังมีผู้ตอบว่ามีปัญหาอื่น ๆ จำนวน 103 คน คือร้อยละ 11.2 จากจำนวนผู้ตอบแบบสอบถามทั้งหมด ปัญหาอื่น ๆ ได้แก่ พื้นที่บางพื้นที่ไม่ได้เป็นสถานที่ท่องเที่ยวทำให้ประชาชนไม่สามารถขายผลิตภัณฑ์ได้ ประชาชนไม่มีการรวมกลุ่มกันเพื่อทำการค้า ผลิตภัณฑ์ขายไม่ได้ราคา วัตถุดิบในการผลิตสินค้าไม่เพียงพอ เจ้าหน้าที่ของรัฐดูแลประชาชนเกี่ยวกับเรื่องการพัฒนาผลิตภัณฑ์ยังไม่เพียงพอ การขาดแคลนเงินทุนและบุคลากรหรือวิทยากรที่จะสอนอาชีพและพัฒนาผลิตภัณฑ์ การนำเงินมาลงทุนไม่ถูกต้อง การใช้อำนาจและอิทธิพลในทางมิชอบของประธานกรรมการบริหาร........”
(http://www.ru.ac.th/rupoll/a4.htm)
ศูนย์วิจัยเอแบค นวัตกรรมทางสังคม มหาวิทยาลัยอัสสัมชัญได้ทำการสำรวจในวันเลือกตั้ง ส.ว. กทม. และรายงานเมื่อวันที่ 3 มีนาคม 2551 ว่า
“.....ในพื้นที่กรุงเทพมหานคร มีประชาชนผู้มีสิทธิเลือกตั้งจำนวนทั้งสิ้น 4,139,894 คน คณะผู้วิจัยได้สุ่มตัวอย่างหน่วยเลือกตั้งจำนวน 397 หน่วยจากทั้งหมด 6,323 หน่วย คิดเป็นร้อยละ 6.28 ของหน่วยเลือกตั้งทั้งหมด และเก็บข้อมูลจากผู้ตอบแบบสอบถามจำนวนทั้งสิ้น 18,459 คน คิดเป็นร้อยละ 0.45 (จาก http://abacpoll.au.edu/snt51/snt51a03.html) ผลการสำรวจพบว่าคน กทม. จะไปใช้สิทธิระหว่างร้อยละ 48 – 54 ของคน กทม. ที่มีสิทธิเลือกตั้งทั้งหมดความคลาดเคลื่อนร้อยละ 3.....”
(http://www.abacpoll.au.edu./snt51/sni51a03.html)
จะเห็นว่า ในการรายงานผลการทำโพลนั้น จะกล่าวถึงการสำรวจความคิดเห็นโดยสอบถามบุคคลตัวอย่างจำนวนหนึ่ง ซึ่งเป็นสัดส่วนเล็กมากของจำนวนทั้งหมด เช่น สุ่มตัวอย่างหน่วยเลือกตั้งมาจำนวน 397 หน่วยจากทั้งหมด 6,323 หน่วยหรือ 6.28% และเก็บข้อมูลจากผู้ตอบแบบสอบถามจำนวนเพียง 0.45% ของประชากรทั้งหมด จึงต้องถามคำถามว่า ตัวอย่างขนาดเล็กมากเช่นนั้นจะเป็นตัวแทนของประชากรหรือข้อมูลทั้งหมด หรือนำมาอธิบายประชากรหรือข้อมูลทั้งหมดได้อย่างไร
ตรงนี้แหละที่สถิติต้องเข้ามาเกี่ยวด้วย คือต้องมาช่วยกำหนดขนาดตัวอย่างและวิธีการเลือกตัวอย่างที่จะสร้างความมั่นใจได้ว่าตัวอย่างที่ได้นั้นเป็นตัวแทนได้ดีเพียงพอ ของข้อมูลทั้งหมด
ข้อน่าสังเกตคือ ในรายงานผลของโพลส่วนใหญ่ มักไม่มีการกล่าวถึงวิธีการเลือกตัวอย่างบุคคลที่เป็นหน่วยตัวอย่างมาตอบคำถาม ตลอดจนไม่ได้ไขข้อสงสัยว่าขนาดตัวอย่างที่ใช้เพียงพอหรือไม่
อันที่จริง ต้องยอมรับตั้งแต่แรกว่า การสำรวจอย่างนี้ ต้องการได้ผลรวดเร็ว เพราะถ้าช้าก็ไม่มีประโยชน์อะไร เมื่อเป็นเช่นนี้ ขนาดตัวอย่างก็ต้องเล็ก พอขนาดเล็ก ก็ต้องยอมรับว่า ข้อสรุปอาจมีความผิดพลาดคลาดเคลื่อนได้ เพราะไม่ได้ใช้ข้อมูลทั้งหมด ปัญหาจึงอยู่ที่ว่า จะยอมรับความคลาดเคลื่อนในข้อสรุปได้สักแค่ไหน หรือพูดง่ายๆ ก็คือ จะต้องการคุณภาพระดับไหน คุณภาพสูง ก็ต้องใช้ตัวอย่างใหญ่ขึ้น
ในทางปฏิบัติ โพลส่วนใหญ่มักไม่มีการกล่าวถึงคุณภาพของผลสรุปที่ได้จากการสำรวจนั้น
ประเด็นที่ต้องคิดคือ ข้อสรุปจากการสำรวจความคิดเห็นนั้นๆ มีความเชื่อถือได้เพียงใด เราจึงควรมีความเข้าใจเกี่ยวกับการสำรวจความคิดเห็นเพียงพอที่จะตัดสินใจได้ว่า ควรให้ความเชื่อถือกับผลของโพลหนึ่งแค่ไหน หรือควรตั้งคำถามอะไรกับโพลนั้น ก่อนจะเชื่อผลที่ได้อย่างสนิทใจ
สรุปง่ายๆ ก็คือ สถิติ เป็นเรื่องที่นำมาใช้ในการเลือกตัวอย่างที่เป็นตัวแทนที่ดีพอ กำหนดขนาดตัวอย่างที่เพียงพอในการสรุปผลที่มีความเชื่อถือได้ระดับหนึ่ง สถิติยังเข้ามาช่วยในการวิเคราะห์สรุปผล และดูคุณภาพของวิธีการสรุปผลที่ใช้
ถ้าไม่มีการใช้สถิติล่ะ ผลก็คือ เราจะไม่สามารถอธิบายหรือมีความมั่นใจได้ว่า ข้อสรุปที่ได้จากการทำโพล นั้น เชื่อถือได้มากน้อยเพียงไร
ซึ่งเรื่องใหญ่คือ เราต้องทราบว่า ข้อมูลทุกเรื่องนั้น มีประเด็นเรื่องคุณภาพที่เราต้องใส่ใจ ไม่ใช่ว่า ใครบอกอะไรมาก็เชื่อได้หมด ถ้าเราใส่ใจคุณภาพของข้อมูล ก่อนปักใจเชื่อ เราก็จะเลือกเชื่อข้อมูลที่มีความน่าเชื่อถือ ทำให้คุณภาพการตัดสินใจของเราดีขึ้นด้วย
และสถิติก็คือเครื่องมือสำคัญ ที่ช่วยให้เราทำการกรองข้อมูลที่ดี เชื่อถือได้ ออกมาใช้นั่นแหละ
เป็นเหตุผลหนึ่งที่ต้องสนใจสถิติบ้างไงคะ