นิยามประชากรโดยย่อ ประชากรทั่วไปและกลุ่มตัวอย่าง แนวคิดเรื่องการเป็นตัวแทน

การบรรยายครั้งที่ 6 องค์ประกอบ สถิติทางคณิตศาสตร์

คำถามควบคุมความรู้และสรุปการบรรยายที่ให้

1. กำหนดตัวแปรสุ่ม

2.เขียนสูตรสำหรับความคาดหวังทางคณิตศาสตร์และความแปรปรวนของตัวแปรสุ่มแบบไม่ต่อเนื่องและต่อเนื่อง

3. กำหนดทฤษฎีบทปริพันธ์ปริพันธ์เฉพาะจุดของ Laplace

4. เขียนสูตรที่กำหนดการแจกแจงแบบทวินาม การแจกแจงแบบไฮเปอร์เรขาคณิต การแจกแจงแบบปัวซง การแจกแจงแบบสม่ำเสมอ และการแจกแจงแบบปกติ

วัตถุประสงค์: เพื่อศึกษาแนวคิดพื้นฐานของสถิติทางคณิตศาสตร์

1. ประชากรและกลุ่มตัวอย่าง

2. การกระจายตัวทางสถิติของกลุ่มตัวอย่าง รูปหลายเหลี่ยม แผนภูมิแท่ง .

3. การประมาณค่าพารามิเตอร์ของประชากรทั่วไปตามกลุ่มตัวอย่าง

4. ค่าเฉลี่ยทั่วไปและค่าเฉลี่ยตัวอย่าง วิธีการคำนวณ

5. ความแปรปรวนทั่วไปและตัวอย่าง

6. คำถามควบคุมความรู้และสรุปการบรรยายที่ให้

เราเริ่มศึกษาองค์ประกอบของสถิติทางคณิตศาสตร์ซึ่งพัฒนาวิธีการทางวิทยาศาสตร์ในการรวบรวมข้อมูลทางสถิติและประมวลผล

1. ประชากรทั่วไปและกลุ่มตัวอย่างปล่อยให้จำเป็นต้องศึกษาชุดของวัตถุที่เป็นเนื้อเดียวกัน (ชุดนี้เรียกว่า ผลรวมทางสถิติ)เกี่ยวกับคุณลักษณะเชิงคุณภาพหรือเชิงปริมาณที่กำหนดลักษณะของวัตถุเหล่านี้ ตัวอย่างเช่น หากมีชิ้นส่วนเป็นชุด มาตรฐานของชิ้นส่วนก็สามารถใช้เป็นสัญญาณเชิงคุณภาพได้ และขนาดที่ควบคุมของชิ้นส่วนก็สามารถใช้เป็นสัญญาณเชิงปริมาณได้

เป็นการดีที่สุดที่จะดำเนินการตรวจสอบให้ครบถ้วนเช่น ตรวจสอบแต่ละวัตถุ อย่างไรก็ตาม ในกรณีส่วนใหญ่ ด้วยเหตุผลหลายประการ จึงไม่สามารถทำได้ วัตถุจำนวนมากและการไม่สามารถเข้าถึงได้สามารถขัดขวางการสำรวจที่ครอบคลุมได้ ตัวอย่างเช่น หากเราจำเป็นต้องทราบความลึกเฉลี่ยของปล่องภูเขาไฟเมื่อกระสุนจากชุดทดลองระเบิด เมื่อทำการตรวจสอบอย่างสมบูรณ์ เราจะทำลายทั้งชุดได้

หากไม่สามารถสำรวจได้ครบถ้วน ส่วนหนึ่งของวัตถุจะถูกเลือกจากประชากรทั้งหมดเพื่อการศึกษา

เรียกว่าประชากรทางสถิติซึ่งเป็นส่วนหนึ่งของวัตถุที่ถูกเลือก ประชากรทั่วไปชุดของวัตถุที่สุ่มเลือกจากประชากรเรียกว่า การสุ่มตัวอย่าง

เรียกจำนวนวัตถุในประชากรและกลุ่มตัวอย่างตามลำดับ ปริมาณประชาชนทั่วไปและ ปริมาณตัวอย่าง

ตัวอย่างที่ 10.1ตรวจสอบผลของต้นไม้ต้นหนึ่ง (200 ชิ้น) ว่ามีรสชาติเฉพาะสำหรับพันธุ์นี้หรือไม่ เพื่อจุดประสงค์นี้จึงเลือก 10 ชิ้น โดยที่ 200 คือขนาดของประชากร และ 10 คือขนาดของกลุ่มตัวอย่าง

หากเลือกตัวอย่างจากวัตถุหนึ่งซึ่งมีการตรวจสอบและส่งกลับไปยังประชากร ตัวอย่างนั้นจะถูกเรียก ซ้ำแล้วซ้ำเล่าหากออบเจ็กต์ตัวอย่างไม่ได้ถูกส่งกลับไปยังประชากรอีกต่อไป ระบบจะเรียกตัวอย่าง ทำซ้ำได้



ในทางปฏิบัติมักใช้การสุ่มตัวอย่างแบบไม่ซ้ำกันมากกว่า หากขนาดตัวอย่างเป็นเพียงเศษเสี้ยวของขนาดประชากร ความแตกต่างระหว่างตัวอย่างที่ทำซ้ำกับตัวอย่างที่ไม่ทำซ้ำนั้นไม่สำคัญเลย

คุณสมบัติของวัตถุในกลุ่มตัวอย่างต้องสะท้อนคุณสมบัติของวัตถุในกลุ่มประชากรได้อย่างถูกต้องหรืออย่างที่เขาว่ากันว่ากลุ่มตัวอย่างต้องเป็น ตัวแทน(ตัวแทน). ตัวอย่างจะถือว่าเป็นตัวแทนหากวัตถุทั้งหมดในประชากรมีความน่าจะเป็นเท่ากันที่จะรวมอยู่ในตัวอย่าง กล่าวคือ การเลือกจะกระทำแบบสุ่ม ตัวอย่างเช่น เพื่อประเมินการเก็บเกี่ยวในอนาคต คุณสามารถสร้างตัวอย่างจากประชากรทั่วไปของผลไม้ที่ยังไม่สุก และตรวจสอบลักษณะของผลไม้ (น้ำหนัก คุณภาพ ฯลฯ) หากเก็บตัวอย่างทั้งหมดจากต้นไม้ต้นเดียว ตัวอย่างนั้นจะไม่เป็นตัวแทน ตัวอย่างที่เป็นตัวแทนควรประกอบด้วยผลไม้ที่สุ่มเลือกจากต้นไม้ที่สุ่มเลือก

2. การกระจายตัวทางสถิติของกลุ่มตัวอย่าง รูปหลายเหลี่ยม แผนภูมิแท่ง.ให้สุ่มตัวอย่างจากประชาชนทั่วไปและ เอ็กซ์ 1 สังเกต n 1 ครั้ง, เอ็กซ์ 2 - หมายเลข 2ครั้งหนึ่ง, ..., เอ็กซ์ เค - เอ็น k ครั้ง และ n 1 +n 2 +…+ ไม่เป็นไร= พี -ขนาดตัวอย่าง. ค่าที่สังเกตได้ x 1 , x 2 , …, เอ็กซ์ เคเรียกว่า ตัวเลือก,และลำดับตัวแปรที่เขียนตามลำดับจากน้อยไปมากคือ ซีรีย์การเปลี่ยนแปลงจำนวนการสังเกต n 1 , n 2 , …, ไม่เป็นไรเรียกว่า ความถี่และความสัมพันธ์กับขนาดตัวอย่าง , , …, - ความถี่สัมพัทธ์โปรดทราบว่าผลรวมของความถี่สัมพัทธ์เท่ากับความสามัคคี: .

การกระจายตัวอย่างทางสถิติเรียกรายการตัวเลือกและความถี่ที่สอดคล้องกันหรือความถี่สัมพัทธ์ การแจกแจงทางสถิติยังสามารถระบุเป็นลำดับของช่วงเวลาและความถี่ที่สอดคล้องกันได้ (การแจกแจงแบบต่อเนื่อง) ผลรวมของความถี่ของตัวแปรที่อยู่ภายในช่วงเวลานี้จะถูกนำมาเป็นความถี่ที่สอดคล้องกับช่วงเวลา สำหรับ ภาพกราฟิก การกระจายทางสถิติใช้ รูปหลายเหลี่ยมและ ฮิสโตแกรม

เพื่อสร้างรูปหลายเหลี่ยมบนแกน โอ้เลื่อนตัวเลือกค่า เอ็กซ์ฉันอยู่บนแกน อู๋ -ค่าความถี่ ฉัน (ความถี่สัมพัทธ์)

ตัวอย่างที่ 10.2ในรูป 10.1 แสดงรูปหลายเหลี่ยมของการแจกแจงต่อไปนี้

โดยทั่วไปรูปหลายเหลี่ยมจะใช้ในกรณีที่มีตัวเลือกจำนวนน้อย ในกรณีของตัวแปรจำนวนมากและในกรณีของการกระจายคุณลักษณะอย่างต่อเนื่อง ฮิสโตแกรมมักจะถูกสร้างขึ้น ในการทำเช่นนี้ช่วงเวลาที่มีค่าที่สังเกตได้ทั้งหมดของแอตทริบิวต์จะถูกแบ่งออกเป็นช่วงความยาวบางส่วนหลายช่วง ชม.และค้นหาแต่ละช่วงย่อย ฉัน, - ผลรวมของความถี่ของตัวแปรที่รวมอยู่ใน ฉัน-ช่วงเวลา จากนั้น ในช่วงเวลาเหล่านี้ เช่นเดียวกับบนฐาน สี่เหลี่ยมที่มีความสูงจะถูกสร้างขึ้น (หรือ โดยที่ พี -ขนาดตัวอย่าง).

สี่เหลี่ยม ฉันสี่เหลี่ยมบางส่วนเท่ากับ , (หรือ ).

ดังนั้นพื้นที่ของฮิสโตแกรมจึงเท่ากับผลรวมของความถี่ทั้งหมด (หรือความถี่สัมพัทธ์) เช่น ขนาดตัวอย่าง (หรือหน่วย)

ตัวอย่างที่ 10.3ในรูป รูปที่ 10.2 แสดงฮิสโตแกรมของการกระจายปริมาตรแบบต่อเนื่อง n= 100 ให้ไว้ในตารางต่อไปนี้

ประชากร (เป็นภาษาอังกฤษ - ประชากร) - ชุดของวัตถุทั้งหมด (หน่วย) ที่นักวิทยาศาสตร์ตั้งใจที่จะสรุปผลเมื่อศึกษาปัญหาเฉพาะ

ประชากรประกอบด้วยวัตถุทั้งหมดที่กำลังศึกษาอยู่ องค์ประกอบของประชากรขึ้นอยู่กับวัตถุประสงค์ของการศึกษา บางครั้งประชากรทั่วไปคือประชากรทั้งหมดของภูมิภาคหนึ่ง (เช่น เมื่อศึกษาทัศนคติของผู้มีสิทธิ์ลงคะแนนเสียงที่มีต่อผู้สมัคร) โดยส่วนใหญ่แล้ว มักจะมีการระบุเกณฑ์หลายข้อเพื่อกำหนดวัตถุประสงค์ของการศึกษา ตัวอย่างเช่น ผู้ชายอายุ 30-50 ปีที่ใช้มีดโกนบางยี่ห้ออย่างน้อยสัปดาห์ละครั้งและมีรายได้อย่างน้อย 100 ดอลลาร์ต่อสมาชิกในครอบครัว

ตัวอย่างหรือ ประชากรตัวอย่าง- ชุดของกรณี (วิชา วัตถุ เหตุการณ์ ตัวอย่าง) โดยใช้ขั้นตอนบางอย่าง คัดเลือกจากประชากรทั่วไปเพื่อเข้าร่วมในการศึกษา

ลักษณะตัวอย่าง:

· ลักษณะเชิงคุณภาพของกลุ่มตัวอย่าง - เราเลือกใครกันแน่และวิธีการสุ่มตัวอย่างที่เราใช้สำหรับสิ่งนี้

· ลักษณะเชิงปริมาณของกลุ่มตัวอย่าง - จำนวนกรณีที่เราเลือก กล่าวคือ ขนาดตัวอย่าง

ความจำเป็นของการสุ่มตัวอย่าง

· วัตถุประสงค์ของการศึกษานั้นกว้างขวางมาก ตัวอย่างเช่น ผู้บริโภคผลิตภัณฑ์ของบริษัทระดับโลกมีตลาดที่กระจายตัวทางภูมิศาสตร์จำนวนมาก

· มีความจำเป็นต้องรวบรวมข้อมูลเบื้องต้น

ขนาดตัวอย่าง

ขนาดตัวอย่าง- จำนวนเคสที่รวมอยู่ในประชากรตัวอย่าง ด้วยเหตุผลทางสถิติ ขอแนะนำว่าจำนวนเคสควรมีอย่างน้อย 30 ถึง 35

ตัวอย่างที่ขึ้นต่อกันและเป็นอิสระ

เมื่อเปรียบเทียบสองตัวอย่าง (หรือมากกว่า) พารามิเตอร์ที่สำคัญเป็นที่พึ่งของพวกเขา หากสามารถสร้างคู่โฮโมมอร์ฟิกได้ (นั่นคือ เมื่อกรณีหนึ่งจากตัวอย่าง X สอดคล้องกับกรณีเดียวจากตัวอย่าง Y และในทางกลับกัน) สำหรับแต่ละกรณีในสองตัวอย่าง (และความสัมพันธ์พื้นฐานนี้มีความสำคัญสำหรับลักษณะที่จะวัด ในตัวอย่าง) ตัวอย่างดังกล่าวเรียกว่า ขึ้นอยู่กับ. ตัวอย่างของกลุ่มตัวอย่างที่ต้องพึ่งพา:

· คู่แฝด

· การวัดลักษณะใดๆ สองครั้งก่อนและหลังการสัมผัสการทดลอง

· สามีและภรรยา

· และอื่น ๆ

หากไม่มีความสัมพันธ์ดังกล่าวระหว่างตัวอย่าง จะมีการพิจารณาตัวอย่างเหล่านี้ เป็นอิสระ, ตัวอย่างเช่น:

· ผู้ชายและผู้หญิง,

· นักจิตวิทยาและนักคณิตศาสตร์

ดังนั้น ตัวอย่างที่ต้องพึ่งพาจะมีขนาดเท่ากันเสมอ ในขณะที่ขนาดของตัวอย่างอิสระอาจแตกต่างกัน

การเปรียบเทียบตัวอย่างทำได้โดยใช้เกณฑ์ทางสถิติต่างๆ:

· แบบทดสอบของนักเรียน

· การทดสอบวิลคอกสัน

· การทดสอบแมนน์-วิทนีย์ยู

· เกณฑ์การลงนาม

· และอื่น ๆ.

ความเป็นตัวแทน

ตัวอย่างอาจถือได้ว่าเป็นตัวแทนหรือไม่เป็นตัวแทน

ตัวอย่างของกลุ่มตัวอย่างที่ไม่ใช่ตัวแทน

ในประเทศสหรัฐอเมริกาที่มีชื่อเสียงที่สุดแห่งหนึ่ง ตัวอย่างทางประวัติศาสตร์กลุ่มตัวอย่างที่ไม่ใช่ตัวแทนถือเป็นเหตุการณ์ที่เกิดขึ้นในระหว่างการเลือกตั้งประธานาธิบดีในปี พ.ศ. 2479 Literary Digest ซึ่งทำนายเหตุการณ์ของการเลือกตั้งครั้งก่อนได้สำเร็จ คาดการณ์ผิดเมื่อได้ส่งบัตรลงคะแนนทดสอบจำนวน 10 ล้านใบให้กับสมาชิก รวมทั้งผู้ที่ได้รับเลือกจากสมุดโทรศัพท์ทั่วประเทศและจากรายชื่อทะเบียนรถยนต์ ใน 25% ของบัตรลงคะแนนที่ได้รับคืน (เกือบ 2.5 ล้านใบ) แบ่งคะแนนเสียงดังนี้

· 57% ต้องการผู้สมัครจากพรรครีพับลิกัน Alf Landon

· 40% เลือกประธานาธิบดีแฟรงคลิน รูสเวลต์ ซึ่งเป็นพรรคเดโมแครตในขณะนั้น

ในการเลือกตั้งจริง ดังที่ทราบกันดีว่ารูสเวลต์ชนะ โดยได้รับคะแนนเสียงมากกว่า 60% ข้อผิดพลาดของ Literary Digest คือ: ต้องการเพิ่มความเป็นตัวแทนของกลุ่มตัวอย่าง - เนื่องจากพวกเขารู้ว่าสมาชิกส่วนใหญ่คิดว่าตนเองเป็นพรรครีพับลิกัน - พวกเขาจึงขยายกลุ่มตัวอย่างให้รวมผู้ที่ได้รับเลือกจากสมุดโทรศัพท์และรายชื่อการลงทะเบียน อย่างไรก็ตาม พวกเขาไม่ได้คำนึงถึงความเป็นจริงของเวลาของพวกเขาและในความเป็นจริงได้คัดเลือกพรรครีพับลิกันมากขึ้น: ในช่วงภาวะเศรษฐกิจตกต่ำครั้งใหญ่ส่วนใหญ่เป็นตัวแทนของชนชั้นกลางและชนชั้นสูงที่สามารถเป็นเจ้าของโทรศัพท์และรถยนต์ได้ (นั่นคือพรรครีพับลิกันส่วนใหญ่ ไม่ใช่พรรคเดโมแครต)

ประเภทของแผนผังการสร้างกลุ่มจากตัวอย่าง

แผนการสร้างกลุ่มมีหลายประเภทหลัก:

1. เป็นการศึกษากับกลุ่มทดลองและกลุ่มควบคุมซึ่งจัดอยู่ในสภาวะต่างๆ

2. ศึกษากับกลุ่มทดลองและกลุ่มควบคุมโดยใช้กลยุทธ์การเลือกแบบคู่

3. การศึกษาโดยใช้เพียงกลุ่มเดียว - กลุ่มทดลอง

4. การศึกษาโดยใช้การออกแบบแบบผสม (แฟคทอเรียล) ทุกกลุ่มจะถูกจัดให้อยู่ในสภาวะที่แตกต่างกัน

ประเภทการสุ่มตัวอย่าง

ตัวอย่างแบ่งออกเป็นสองประเภท:

· ความน่าจะเป็น

· ไม่น่าจะเป็น

ตัวอย่างความน่าจะเป็น

1. การสุ่มตัวอย่างความน่าจะเป็นอย่างง่าย:

โอการสุ่มตัวอย่างใหม่อย่างง่าย การใช้ตัวอย่างดังกล่าวขึ้นอยู่กับสมมติฐานว่าผู้ตอบแบบสอบถามแต่ละคนมีแนวโน้มที่จะถูกรวมไว้ในตัวอย่างเท่ากัน จากรายชื่อประชากรทั่วไป จะมีการรวบรวมบัตรที่มีหมายเลขผู้ตอบแบบสอบถาม พวกเขาจะถูกวางไว้ในสำรับ สับ และไพ่จะถูกสุ่มออกมา หมายเลขจะถูกเขียนลงไป จากนั้นจึงคืนกลับ จากนั้น ให้ทำซ้ำขั้นตอนนี้ซ้ำหลาย ๆ ครั้งตามขนาดตัวอย่างที่เราต้องการ ข้อเสีย: การทำซ้ำหน่วยการเลือก

ขั้นตอนการสร้างตัวอย่างสุ่มอย่างง่ายมีขั้นตอนต่อไปนี้:

1.ต้องได้รับ รายการทั้งหมดสมาชิกของประชากรและหมายเลขรายการนี้ รายการดังกล่าว เรียกว่า กรอบการสุ่มตัวอย่าง

2. กำหนดขนาดตัวอย่างที่คาดหวัง นั่นคือ จำนวนผู้ตอบแบบสอบถามที่คาดหวัง

3. แยกตัวเลขออกจากตารางตัวเลขสุ่มได้มากเท่าที่เราต้องการหน่วยตัวอย่าง หากในกลุ่มตัวอย่างควรมี 100 คน ระบบจะนำตัวเลขสุ่ม 100 ตัวออกจากตาราง ตัวเลขสุ่มเหล่านี้สามารถสร้างขึ้นได้โดยโปรแกรมคอมพิวเตอร์

4. เลือกจากรายการฐานของการสังเกตที่มีตัวเลขตรงกับตัวเลขสุ่มที่เขียนไว้

· มีตัวอย่างสุ่มง่ายๆ ข้อดีที่ชัดเจน. วิธีนี้เข้าใจง่ายมาก ผลการศึกษาสามารถสรุปได้ทั่วไปกับประชากรที่กำลังศึกษา แนวทางส่วนใหญ่ในการได้รับ ข้อสรุปทางสถิติเกี่ยวข้องกับการรวบรวมข้อมูลโดยใช้ตัวอย่างสุ่มง่ายๆ อย่างไรก็ตาม วิธีการสุ่มตัวอย่างอย่างง่ายมีข้อจำกัดที่สำคัญอย่างน้อยสี่ประการ:

1. มักจะเป็นเรื่องยากที่จะสร้างกรอบการสุ่มตัวอย่างที่ยอมให้สุ่มตัวอย่างแบบง่ายๆ

2. การสุ่มตัวอย่างอย่างง่ายอาจส่งผลให้มีประชากรจำนวนมาก หรือประชากรกระจายไปทั่วพื้นที่ทางภูมิศาสตร์ขนาดใหญ่ ซึ่งจะทำให้เวลาและค่าใช้จ่ายในการรวบรวมข้อมูลเพิ่มขึ้นอย่างมาก

3. ผลลัพธ์ของการใช้ตัวอย่างสุ่มอย่างง่ายมักมีลักษณะที่มีความแม่นยำต่ำและสูงกว่า มาตรฐานบกพร่องมากกว่าผลลัพธ์ของการใช้วิธีความน่าจะเป็นแบบอื่น

4. จากการใช้ SRS อาจเกิดตัวอย่างที่ไม่เป็นตัวแทนได้ แม้ว่าตัวอย่างที่ได้จากการสุ่มตัวอย่างอย่างง่าย โดยเฉลี่ยจะเป็นตัวแทนของประชากรได้อย่างเพียงพอ แต่ตัวอย่างบางส่วนก็บิดเบือนความจริงอย่างมากเกี่ยวกับประชากรที่กำลังศึกษา โดยเฉพาะอย่างยิ่งเมื่อขนาดตัวอย่างมีขนาดเล็ก

· การสุ่มตัวอย่างอย่างง่ายแบบไม่ทำซ้ำ ขั้นตอนการสุ่มตัวอย่างจะเหมือนกัน เฉพาะไพ่ที่มีหมายเลขผู้ตอบแบบสอบถามเท่านั้นที่จะไม่ส่งคืนไปที่สำรับ

1. การสุ่มตัวอย่างความน่าจะเป็นอย่างเป็นระบบ เป็นการสุ่มตัวอย่างความน่าจะเป็นอย่างง่ายเวอร์ชันที่เรียบง่าย จากรายชื่อประชากรทั่วไป ผู้ตอบแบบสอบถามจะถูกเลือกในช่วงเวลาหนึ่ง (K) ค่าของ K ถูกกำหนดแบบสุ่ม ผลลัพธ์ที่เชื่อถือได้มากที่สุดจะเกิดขึ้นเมื่อมีประชากรเป็นเนื้อเดียวกัน มิฉะนั้น ขนาดขั้นตอนและรูปแบบวงจรภายในบางอย่างของตัวอย่างอาจตรงกัน (การผสมตัวอย่าง) ข้อเสีย: เช่นเดียวกับตัวอย่างความน่าจะเป็นอย่างง่าย

2. การสุ่มตัวอย่างแบบอนุกรม (คลัสเตอร์) หน่วยการคัดเลือกเป็นชุดทางสถิติ (ครอบครัว โรงเรียน ทีม ฯลฯ) องค์ประกอบที่เลือกจะต้องได้รับการตรวจสอบอย่างสมบูรณ์ การเลือกหน่วยทางสถิติสามารถจัดเป็นการสุ่มตัวอย่างหรือสุ่มตัวอย่างเป็นระบบ ข้อเสีย: มีความเป็นไปได้ที่จะมีความเป็นเนื้อเดียวกันมากกว่าในประชากรทั่วไป

3. การสุ่มตัวอย่างในระดับภูมิภาค ในกรณีที่มีประชากรต่างกัน ก่อนที่จะใช้การสุ่มตัวอย่างความน่าจะเป็นด้วยเทคนิคการคัดเลือกใดๆ ขอแนะนำให้แบ่งประชากรออกเป็นส่วนที่เป็นเนื้อเดียวกัน ตัวอย่างดังกล่าวเรียกว่าการสุ่มตัวอย่างแบบอำเภอ กลุ่มการแบ่งเขตสามารถรวมทั้งการก่อตัวตามธรรมชาติ (เช่น เขตเมือง) และลักษณะใดๆ ที่เป็นพื้นฐานของการศึกษา ลักษณะบนพื้นฐานของการแบ่งส่วนเรียกว่าลักษณะของการแบ่งชั้นและการแบ่งเขต

4. ตัวอย่าง "ความสะดวกสบาย" ขั้นตอนการสุ่มตัวอย่าง "สะดวก" ประกอบด้วยการสร้างการติดต่อกับหน่วยสุ่มตัวอย่าง "สะดวก" - กลุ่มนักเรียน ทีมกีฬากับเพื่อนฝูงและเพื่อนบ้าน หากคุณต้องการได้รับข้อมูลเกี่ยวกับปฏิกิริยาของผู้คนต่อแนวคิดใหม่ การสุ่มตัวอย่างประเภทนี้ค่อนข้างสมเหตุสมผล การสุ่มตัวอย่างตามความสะดวกมักใช้เพื่อทดสอบแบบสอบถามล่วงหน้า

ตัวอย่างที่ไม่น่าจะเป็น

การเลือกในกลุ่มตัวอย่างดังกล่าวไม่ได้ดำเนินการตามหลักการของการสุ่ม แต่เป็นไปตามเกณฑ์ส่วนตัว - ความพร้อมใช้งาน ลักษณะทั่วไป การเป็นตัวแทนที่เท่าเทียมกัน ฯลฯ

1. การสุ่มตัวอย่างโควต้า - ตัวอย่างถูกสร้างขึ้นเพื่อเป็นแบบจำลองที่สร้างโครงสร้างของประชากรทั่วไปในรูปแบบของโควต้า (สัดส่วน) ของคุณลักษณะที่กำลังศึกษา จำนวนองค์ประกอบตัวอย่างด้วย การรวมกันต่างๆของคุณลักษณะที่ศึกษาจะถูกกำหนดในลักษณะที่สอดคล้องกับส่วนแบ่ง (สัดส่วน) ในประชากรทั่วไป ตัวอย่างเช่น หากประชากรทั่วไปของเราประกอบด้วย 5,000 คน โดยเป็นผู้หญิง 2,000 คน และผู้ชาย 3,000 คน ดังนั้นในโควต้าตัวอย่าง เราจะมีผู้หญิง 20 คน ผู้ชาย 30 คน หรือผู้หญิง 200 คน ผู้ชาย 300 คน ตัวอย่างโควต้ามักขึ้นอยู่กับเกณฑ์ทางประชากร ได้แก่ เพศ อายุ ภูมิภาค รายได้ การศึกษา และอื่นๆ ข้อเสีย: โดยทั่วไปแล้วตัวอย่างดังกล่าวจะไม่เป็นตัวแทนเพราะว่า เป็นไปไม่ได้ที่จะคำนึงถึงพารามิเตอร์ทางสังคมหลายอย่างพร้อมกัน ข้อดี: วัสดุที่หาได้ง่าย

2. วิธีสโนว์บอล ตัวอย่างถูกสร้างขึ้นดังนี้ ผู้ตอบแบบสอบถามแต่ละคน เริ่มจากคนแรก จะถูกถามถึงข้อมูลติดต่อของเพื่อน เพื่อนร่วมงาน คนรู้จักที่จะตรงกับเงื่อนไขการคัดเลือกและสามารถเข้าร่วมในการศึกษาได้ ดังนั้น ยกเว้นขั้นตอนแรก กลุ่มตัวอย่างจึงถูกสร้างขึ้นโดยการมีส่วนร่วมของอาสาสมัครวิจัยด้วยตนเอง วิธีนี้มักใช้เมื่อจำเป็นต้องค้นหาและสัมภาษณ์กลุ่มผู้ตอบแบบสอบถามที่เข้าถึงยาก (เช่น ผู้ตอบแบบสอบถามที่มีรายได้สูง ผู้ตอบแบบสอบถามที่อยู่ในกลุ่มวิชาชีพเดียวกัน ผู้ตอบแบบสอบถามที่มีงานอดิเรก/ความสนใจคล้ายกัน เป็นต้น)

3. การสุ่มตัวอย่างโดยธรรมชาติ - การสุ่มตัวอย่างจากสิ่งที่เรียกว่า "คนแรกที่คุณเจอ" มักใช้ในการเลือกตั้งทางโทรทัศน์และวิทยุ ขนาดและองค์ประกอบของตัวอย่างที่เกิดขึ้นเองไม่เป็นที่รู้จักล่วงหน้าและถูกกำหนดโดยพารามิเตอร์เดียวเท่านั้น - กิจกรรมของผู้ตอบแบบสอบถาม ข้อเสีย: ไม่สามารถระบุได้ว่าผู้ตอบแบบสอบถามเป็นตัวแทนของประชากรกลุ่มใด และด้วยเหตุนี้ จึงไม่สามารถระบุความเป็นตัวแทนได้

4. การสำรวจเส้นทาง – มักใช้เมื่อหน่วยการศึกษาคือครอบครัว บนแผนที่ การตั้งถิ่นฐานโดยที่จะดำเนินการสำรวจจะมีหมายเลขถนนทุกสาย การใช้ตาราง (เครื่องกำเนิด) ของตัวเลขสุ่ม ตัวเลขใหญ่. ตัวเลขจำนวนมากแต่ละตัวจะถือว่าประกอบด้วย 3 องค์ประกอบ: เลขที่ถนน (2-3 ตัวแรก) เลขที่บ้าน เลขที่อพาร์ตเมนต์ ตัวอย่างเช่น หมายเลข 14832: 14 คือหมายเลขถนนบนแผนที่ 8 คือหมายเลขบ้าน 32 คือหมายเลขอพาร์ตเมนต์

5. การสุ่มตัวอย่างระดับภูมิภาคพร้อมการเลือกวัตถุทั่วไป หากหลังจากการแบ่งเขตแล้ว วัตถุทั่วไปจะถูกเลือกจากแต่ละกลุ่ม เช่น วัตถุที่ใกล้เคียงกับค่าเฉลี่ยในแง่ของลักษณะส่วนใหญ่ที่ศึกษาในการศึกษาตัวอย่างดังกล่าวเรียกว่าการทำให้เป็นภูมิภาคด้วยการเลือกวัตถุทั่วไป

กลยุทธ์การสร้างกลุ่ม

การคัดเลือกกลุ่มเพื่อเข้าร่วมในการทดลองทางจิตวิทยาดำเนินการโดยใช้กลยุทธ์ต่างๆ เพื่อให้แน่ใจว่าความถูกต้องทั้งภายในและภายนอกได้รับการเก็บรักษาไว้ในขอบเขตสูงสุดที่เป็นไปได้

· การสุ่ม (การเลือกแบบสุ่ม)

· การเลือกคู่

· การเลือกสตราโตเมตริก

· การสร้างแบบจำลองโดยประมาณ

· ดึงดูดกลุ่มจริง

การสุ่ม, หรือ การเลือกแบบสุ่ม, ใช้เพื่อสร้างตัวอย่างสุ่มอย่างง่าย การใช้ตัวอย่างดังกล่าวตั้งอยู่บนสมมติฐานที่ว่าสมาชิกแต่ละคนมีแนวโน้มที่จะถูกรวมไว้ในกลุ่มตัวอย่างเท่าๆ กัน ตัวอย่างเช่น ในการสุ่มตัวอย่างนักศึกษามหาวิทยาลัย 100 คน คุณสามารถใส่กระดาษที่มีชื่อนักศึกษาทุกคนในหมวก แล้วหยิบกระดาษออกมา 100 แผ่น - นี่จะเป็นการเลือกแบบสุ่ม (Goodwin J ., หน้า 147)

การเลือกคู่- กลยุทธ์ในการสร้างกลุ่มตัวอย่าง โดยกลุ่มวิชาประกอบด้วยวิชาที่เทียบเท่ากันในแง่ของพารามิเตอร์รองที่มีนัยสำคัญต่อการทดลอง กลยุทธ์นี้มีประสิทธิภาพสำหรับการทดลองโดยใช้กลุ่มทดลองและกลุ่มควบคุมด้วย ตัวเลือกที่ดีที่สุด- ดึงดูดคู่แฝด (โมโน- และไดไซโกติก) เนื่องจากช่วยให้คุณสร้าง...

การเลือกสตราโตเมตริก - การสุ่มด้วยการจัดสรรชั้น (หรือกลุ่ม) ที่ วิธีนี้เมื่อสร้างกลุ่มตัวอย่าง ประชากรทั่วไปจะถูกแบ่งออกเป็นกลุ่ม (ชั้น) ที่มีลักษณะเฉพาะ (เพศ อายุ ความชอบทางการเมือง การศึกษา ระดับรายได้ ฯลฯ) และเลือกวิชาที่มีลักษณะสอดคล้องกัน

การสร้างแบบจำลองโดยประมาณ - ดึงตัวอย่างที่จำกัดและสรุปข้อสรุปเกี่ยวกับตัวอย่างนี้ให้กับประชากรในวงกว้าง ตัวอย่างเช่น เมื่อนักศึกษามหาวิทยาลัยชั้นปีที่ 2 มีส่วนร่วมในการศึกษาวิจัย ข้อมูลของการศึกษานี้ใช้กับ “ผู้ที่มีอายุ 17 ถึง 21 ปี” การยอมรับลักษณะทั่วไปดังกล่าวมีจำกัดอย่างมาก

การสร้างแบบจำลองโดยประมาณคือการก่อตัวของแบบจำลองซึ่งสำหรับระดับของระบบ (กระบวนการ) ที่กำหนดไว้อย่างชัดเจน อธิบายพฤติกรรมของมัน (หรือปรากฏการณ์ที่ต้องการ) ด้วยความแม่นยำที่ยอมรับได้

http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm– เว็บไซต์ที่มีประโยชน์มาก!

วิธีการสุ่มตัวอย่างการวิจัยเป็นวิธีการทางสถิติหลัก นี่เป็นเรื่องปกติ เนื่องจากปริมาตรของวัตถุที่กำลังศึกษามักจะไม่มีที่สิ้นสุด (และถึงแม้ว่ามันจะมีจำกัด ก็เป็นเรื่องยากมากที่จะจัดเรียงวัตถุทั้งหมด เราต้องพอใจกับเพียงส่วนหนึ่งของวัตถุเหล่านั้นซึ่งก็คือการเลือก)

ประชากรทั่วไปและกลุ่มตัวอย่าง

ประชากรทั่วไปคือจำนวนรวมขององค์ประกอบทั้งหมดที่ศึกษาในการทดลองที่กำหนด

ประชากรตัวอย่าง (หรือตัวอย่าง) คือกลุ่มวัตถุที่มีขอบเขตจำกัดซึ่งสุ่มเลือกจากประชากร

ปริมาตรของประชากร (ตัวอย่างหรือทั่วไป) คือจำนวนวัตถุในประชากรนี้

ตัวอย่างประชากรทั่วไปและกลุ่มตัวอย่าง

สมมติว่าเรากำลังศึกษาความโน้มเอียงทางจิตวิทยาของบุคคลในการแบ่งส่วนที่กำหนดโดยสัมพันธ์กับอัตราส่วนทองคำ เนื่องจากที่มาของแนวคิดของส่วนสีทองนั้นถูกกำหนดโดยมานุษยวิทยาของร่างกายมนุษย์จึงเป็นที่ชัดเจนว่าในกรณีนี้ประชากรทั่วไปคือสิ่งมีชีวิตใด ๆ ที่มาจากมนุษย์ซึ่งมีวุฒิภาวะทางกายภาพและได้รับสัดส่วนสุดท้ายนั่นคือทั้งหมด ส่วนหนึ่งของมนุษยชาติที่เป็นผู้ใหญ่ ปริมาณของคอลเลกชันนี้แทบจะไม่มีที่สิ้นสุด

หากศึกษาความโน้มเอียงนี้โดยเฉพาะในสภาพแวดล้อมทางศิลปะ ประชากรทั่วไปก็คือคนที่มี ความสัมพันธ์โดยตรงในการออกแบบ: ศิลปิน สถาปนิก นักออกแบบ มีคนประเภทนี้จำนวนมากเช่นกัน และเราสามารถสรุปได้ว่าปริมาณของประชากรทั่วไปในกรณีนี้ก็ไม่มีที่สิ้นสุดเช่นกัน

ในทั้งสองกรณี สำหรับการวิจัย เราถูกบังคับให้จำกัดตัวเองให้มีขนาดตัวอย่างที่เหมาะสม โดยเลือกเป็นตัวแทนของนักศึกษาที่เชี่ยวชาญด้านเทคนิค (ในฐานะคนที่อยู่ห่างไกลจากโลกศิลปะ) หรือนักศึกษาด้านการออกแบบ (ในฐานะผู้ที่เกี่ยวข้องโดยตรงกับ ภาพศิลปะโลก)

ความเป็นตัวแทน

ปัญหาหลักของวิธีการสุ่มตัวอย่างคือคำถามว่าวัตถุที่เลือกจากประชากรทั่วไปเพื่อการวิจัยแสดงถึงลักษณะเฉพาะที่ศึกษาของประชากรทั่วไปได้แม่นยำเพียงใด ซึ่งก็คือคำถามเกี่ยวกับการเป็นตัวแทนของกลุ่มตัวอย่าง

ดังนั้น ตัวอย่างจะเรียกว่าตัวแทนหากตัวอย่างนั้นแสดงถึงความสัมพันธ์เชิงปริมาณของประชากรทั่วไปได้อย่างแม่นยำเพียงพอ

แน่นอนว่าเป็นการยากที่จะพูดสิ่งที่ซ่อนอยู่เบื้องหลังถ้อยคำที่คลุมเครือ ค่อนข้างแม่นยำ. โดยทั่วไปประเด็นเรื่องการเป็นตัวแทนมักเป็นที่ถกเถียงกันมากที่สุดในการศึกษาทดลองใดๆ มีหลายคนที่กลายเป็นไปแล้ว ตัวอย่างคลาสสิกเมื่อตัวแทนของกลุ่มตัวอย่างไม่เพียงพอทำให้ผู้ทดลองได้รับผลลัพธ์ที่ไร้สาระ

ตามกฎแล้ว ปัญหาของการเป็นตัวแทนจะได้รับการแก้ไขโดยการประเมินโดยผู้เชี่ยวชาญ เมื่อชุมชนวิทยาศาสตร์ยอมรับมุมมองของกลุ่มผู้เชี่ยวชาญที่เชื่อถือได้เกี่ยวกับความถูกต้องของการศึกษา

ตัวอย่างการเป็นตัวแทน

กลับไปที่ตัวอย่างการแบ่งส่วน ประเด็นของการเป็นตัวแทนของกลุ่มตัวอย่างอยู่ที่พื้นฐานของการศึกษาที่นี่: ไม่ว่าในกรณีใด เราไม่ควรผสมกลุ่มวิชาตามสภาพแวดล้อมทางศิลปะ

การกระจายทางสถิติของลักษณะที่สังเกตได้

ความถี่ของค่าที่สังเกตได้

จากผลการทดสอบในปริมาตรตัวอย่าง ปล่อยให้คุณลักษณะที่สังเกตได้รับค่า ,, ... , และค่าถูกสังเกตหนึ่งครั้ง, ค่าถูกสังเกตหนึ่งครั้ง ฯลฯ, ค่าถูกสังเกตหนึ่งครั้ง จากนั้นความถี่ของค่าที่สังเกตได้เรียกว่าตัวเลข ค่าเป็นตัวเลข เป็นต้น

ความถี่สัมพัทธ์ของค่าที่สังเกตได้

ความถี่สัมพัทธ์ของค่าที่สังเกตได้คืออัตราส่วนของความถี่ต่อขนาดตัวอย่าง:

เห็นได้ชัดว่าผลรวมของความถี่ของคุณลักษณะที่สังเกตได้ควรให้ขนาดตัวอย่าง

และผลรวมของความถี่สัมพัทธ์ควรทำให้เกิดความสามัคคี:

ข้อควรพิจารณาเหล่านี้สามารถใช้เพื่อควบคุมเมื่อรวบรวมตารางสถิติ หากไม่เป็นไปตามความเท่าเทียมกันจะเกิดข้อผิดพลาดเมื่อบันทึกผลการทดลอง

การกระจายทางสถิติของค่าที่สังเกตได้

การกระจายทางสถิติของคุณลักษณะที่สังเกตได้คือความสอดคล้องระหว่างค่าที่สังเกตได้ของคุณลักษณะและความถี่ที่สอดคล้องกัน (หรือความถี่สัมพัทธ์)

ตามกฎแล้วการแจกแจงทางสถิติจะถูกเขียนในรูปแบบของตารางสองบรรทัดซึ่งค่าที่สังเกตได้ของคุณลักษณะจะถูกระบุในบรรทัดแรกและความถี่ที่สอดคล้องกัน (หรือความถี่สัมพัทธ์) จะถูกระบุในวินาที เส้น:

ประชากรทางสถิติ


ประชากรทางสถิติประกอบด้วยวัตถุที่มีอยู่อย่างมีนัยสำคัญ (พนักงาน วิสาหกิจ ประเทศ ภูมิภาค) เป็นวัตถุ
การวิจัยทางสถิติ ประชากรทางสถิติ
- ชุดของหน่วยที่มีลักษณะมวล ลักษณะทั่วไป ความสม่ำเสมอในเชิงคุณภาพ และการมีอยู่ของการเปลี่ยนแปลง

หน่วยของประชากร- แต่ละหน่วยเฉพาะของประชากรทางสถิติ

ประชากรทางสถิติเดียวกันสามารถมีลักษณะเป็นเนื้อเดียวกันได้ในลักษณะหนึ่งและต่างกันในลักษณะอื่นได้

ความสม่ำเสมอเชิงคุณภาพ- ความคล้ายคลึงกันของทุกหน่วยของประชากรในบางพื้นฐานและความแตกต่างจากหน่วยอื่น ๆ ทั้งหมด

ในประชากรทางสถิติ ความแตกต่างระหว่างหน่วยประชากรหนึ่งกับอีกหน่วยหนึ่งมักมีลักษณะเป็นเชิงปริมาณ การเปลี่ยนแปลงเชิงปริมาณในค่าของคุณลักษณะของหน่วยต่าง ๆ ของประชากรเรียกว่าการแปรผัน

การเปลี่ยนแปลงของลักษณะ - การเปลี่ยนแปลงเชิงปริมาณลักษณะเฉพาะ (สำหรับลักษณะเชิงปริมาณ) เมื่อย้ายจากหน่วยประชากรหนึ่งไปยังอีกหน่วยหนึ่ง

เข้าสู่ระบบ- นี่คือทรัพย์สิน ลักษณะเฉพาะหรือลักษณะอื่นของหน่วย วัตถุ และปรากฏการณ์ที่สามารถสังเกตหรือวัดได้ สัญญาณแบ่งออกเป็นเชิงปริมาณและเชิงคุณภาพ ความหลากหลายและความแปรปรวนของมูลค่าของลักษณะเฉพาะในแต่ละหน่วยของประชากรเรียกว่า การเปลี่ยนแปลง.

ลักษณะเฉพาะ (เชิงคุณภาพ) ไม่สามารถแสดงเป็นตัวเลขได้ (องค์ประกอบของประชากรตามเพศ) ลักษณะเชิงปริมาณมีการแสดงออกเป็นตัวเลข (องค์ประกอบประชากรตามอายุ)

ดัชนี- นี่เป็นลักษณะทั่วไปเชิงปริมาณและเชิงคุณภาพของทรัพย์สินใดๆ ของหน่วยหรือมวลรวมโดยรวมภายใต้เงื่อนไขเฉพาะของเวลาและสถานที่

ดัชนีชี้วัดคือชุดตัวชี้วัดที่สะท้อนปรากฏการณ์ที่กำลังศึกษาอย่างครอบคลุม

ตัวอย่างเช่น มีการศึกษาเงินเดือน:
  • เข้าสู่ระบบ - ค่าจ้าง
  • ประชากรทางสถิติ-พนักงานทุกคน
  • หน่วยประชากร - พนักงานแต่ละคน
  • ความสม่ำเสมอเชิงคุณภาพ - ค่าจ้างสะสม
  • การเปลี่ยนแปลงของเครื่องหมาย - ชุดตัวเลข

ประชากรและกลุ่มตัวอย่างจากนั้น

พื้นฐานของการวิจัยทางสถิติคือชุดของข้อมูลที่ได้รับจากการวัดคุณลักษณะตั้งแต่หนึ่งรายการขึ้นไป ชุดของวัตถุที่สังเกตได้อย่างแท้จริง ซึ่งแสดงทางสถิติด้วยการสังเกตตัวแปรสุ่มจำนวนหนึ่งคือ การสุ่มตัวอย่างและที่มีอยู่ตามสมมุติฐาน (การคาดเดา) - ประชากรทั่วไป. ประชากรอาจมีจำกัด (จำนวนการสังเกต N = ค่าคงที่) หรืออนันต์ ( ยังไม่มีข้อความ = ∞) และตัวอย่างจากประชากรจะเป็นผลมาจากการสังเกตในจำนวนที่จำกัดเสมอ เรียกว่าจำนวนการสังเกตที่ก่อตัวเป็นตัวอย่าง ขนาดตัวอย่าง. หากขนาดตัวอย่างมีขนาดใหญ่พอ ( n → ∞) พิจารณาตัวอย่างแล้ว ใหญ่มิฉะนั้นจะเรียกว่าการสุ่มตัวอย่าง ปริมาณจำกัด. โดยจะพิจารณาตัวอย่าง เล็กหากเมื่อทำการวัดตัวแปรสุ่มหนึ่งมิติขนาดตัวอย่างจะต้องไม่เกิน 30 ( n<= 30 ) และเมื่อทำการวัดหลายรายการพร้อมกัน ( เค) คุณลักษณะในปริภูมิความสัมพันธ์หลายมิติ nถึง เคไม่เกิน 10 (ไม่ระบุ< 10) . แบบฟอร์มตัวอย่าง ซีรีย์การเปลี่ยนแปลงถ้ามีสมาชิกอยู่ สถิติลำดับคือค่าตัวอย่างของตัวแปรสุ่ม เอ็กซ์ถูกเรียงลำดับจากน้อยไปมาก (จัดอันดับ) ค่าของคุณลักษณะจะถูกเรียกว่า ตัวเลือก.

ตัวอย่าง. ชุดวัตถุที่สุ่มเลือกมาเกือบจะเหมือนกัน - ธนาคารพาณิชย์ของเขตบริหารหนึ่งของมอสโก ถือได้ว่าเป็นตัวอย่างจากประชากรทั่วไปของธนาคารพาณิชย์ทั้งหมดในเขตนี้ และเป็นตัวอย่างจากประชากรทั่วไปของธนาคารพาณิชย์ทุกแห่งในมอสโก ตลอดจนตัวอย่างจากธนาคารพาณิชย์ของประเทศ เป็นต้น

วิธีการพื้นฐานในการจัดการเก็บตัวอย่าง

ความน่าเชื่อถือของข้อสรุปทางสถิติและการตีความผลลัพธ์ที่มีความหมายขึ้นอยู่กับ ความเป็นตัวแทนตัวอย่างเช่น ความสมบูรณ์และเพียงพอของการเป็นตัวแทนของคุณสมบัติของประชากรทั่วไปซึ่งสัมพันธ์กับตัวอย่างนี้สามารถถือว่าเป็นตัวแทนได้ การศึกษาคุณสมบัติทางสถิติของประชากรสามารถจัดได้สองวิธี: การใช้ อย่างต่อเนื่องและ การสังเกตอย่างต่อเนื่อง การสังเกตอย่างต่อเนื่องจัดให้มีการตรวจสอบทั้งหมด หน่วยศึกษา จำนวนทั้งสิ้น, ก การสังเกตบางส่วน (เลือก)- เพียงบางส่วนเท่านั้น

มีห้าวิธีหลักในการจัดการการสังเกตตัวอย่าง:

1. การเลือกแบบสุ่มอย่างง่ายซึ่งวัตถุจะถูกสุ่มเลือกจากประชากรของวัตถุ (เช่น การใช้ตารางหรือตัวสร้างตัวเลขสุ่ม) โดยแต่ละตัวอย่างที่เป็นไปได้มีความน่าจะเป็นเท่ากัน ตัวอย่างดังกล่าวเรียกว่า สุ่มจริงๆ;

2. การเลือกอย่างง่ายโดยใช้ขั้นตอนปกติดำเนินการโดยใช้ส่วนประกอบทางกล (เช่น วันที่ วันในสัปดาห์ หมายเลขอพาร์ตเมนต์ ตัวอักษร ฯลฯ) และตัวอย่างที่ได้รับในลักษณะนี้เรียกว่า เครื่องกล;

3. แบ่งชั้นการคัดเลือกประกอบด้วยข้อเท็จจริงที่ว่าประชากรทั่วไปของปริมาตรถูกแบ่งออกเป็นประชากรย่อยหรือชั้น (ชั้น) ของปริมาตร ดังนั้น ชั้นเป็นวัตถุที่เป็นเนื้อเดียวกันในแง่ของลักษณะทางสถิติ (เช่น ประชากรแบ่งออกเป็นชั้นตามกลุ่มอายุหรือชนชั้นทางสังคม วิสาหกิจตามอุตสาหกรรม) ในกรณีนี้จะมีการเรียกตัวอย่าง แบ่งชั้น(มิฉะนั้น, แบ่งชั้น, โดยทั่วไป, แบ่งเขต);

4.วิธีการ อนุกรมการคัดเลือกถูกนำมาใช้เพื่อสร้าง อนุกรมหรือ ตัวอย่างรัง. สะดวกหากจำเป็นต้องสำรวจ "บล็อก" หรือชุดของวัตถุในคราวเดียว (เช่น ชุดสินค้า ผลิตภัณฑ์ของชุดใดชุดหนึ่ง หรือจำนวนประชากรของเขตการปกครองและอาณาเขตของประเทศ) การเลือกซีรี่ส์สามารถทำได้แบบสุ่มหรือโดยกลไก ในกรณีนี้จะมีการตรวจสอบสินค้าบางชุดหรือหน่วยอาณาเขตทั้งหมด (อาคารที่อยู่อาศัยหรือบล็อก) โดยสมบูรณ์

5. รวมกันการเลือก (แบบขั้นบันได) สามารถรวมวิธีการเลือกได้หลายวิธีพร้อมกัน (เช่น แบบแบ่งชั้นและสุ่ม หรือสุ่มและเชิงกล) ตัวอย่างดังกล่าวเรียกว่า รวมกัน.

ประเภทของการเลือก

โดย จิตใจการคัดเลือกรายบุคคล กลุ่ม และแบบรวมมีความโดดเด่น ที่ การเลือกรายบุคคลแต่ละหน่วยของประชากรทั่วไปจะถูกเลือกให้เป็นประชากรตัวอย่างด้วย การเลือกกลุ่ม- กลุ่มหน่วยที่เป็นเนื้อเดียวกัน (อนุกรม) ในเชิงคุณภาพ และ การเลือกแบบรวมเกี่ยวข้องกับการผสมระหว่างประเภทที่หนึ่งและสอง

โดย วิธีการคัดเลือกมีความโดดเด่น ซ้ำและไม่ซ้ำซ้อนตัวอย่าง.

ทำซ้ำๆเรียกว่าการคัดเลือกโดยหน่วยที่รวมอยู่ในกลุ่มตัวอย่างจะไม่กลับคืนสู่ประชากรเดิมและไม่มีส่วนร่วมในการคัดเลือกต่อไป ในขณะที่จำนวนหน่วยของประชากรทั่วไป เอ็นจะลดลงในระหว่างกระบวนการคัดเลือก ที่ ซ้ำแล้วซ้ำเล่าการเลือก จับได้ในกลุ่มตัวอย่าง หน่วยหนึ่งหลังจากการลงทะเบียนจะถูกส่งกลับไปยังประชากรทั่วไป และด้วยเหตุนี้จึงยังคงมีโอกาสที่เท่าเทียมกันพร้อมกับหน่วยอื่น ๆ ที่จะใช้ในขั้นตอนการคัดเลือกเพิ่มเติม ในขณะที่จำนวนหน่วยของประชากรทั่วไป เอ็นยังคงไม่เปลี่ยนแปลง (วิธีนี้ไม่ค่อยมีการใช้ในการวิจัยทางเศรษฐกิจและสังคม) อย่างไรก็ตามด้วยความใหญ่โต ยังไม่มีข้อความ (N → ∞)สูตรสำหรับ ทำซ้ำได้การคัดเลือกเข้าใกล้ผู้ที่ ซ้ำแล้วซ้ำเล่าการเลือกและอันหลังนั้นมักใช้บ่อยกว่า ( N = ค่าคงที่).

ลักษณะพื้นฐานของพารามิเตอร์ของประชากรทั่วไปและประชากรตัวอย่าง

ข้อสรุปทางสถิติของการศึกษานี้ขึ้นอยู่กับการแจกแจงของตัวแปรสุ่มและค่าที่สังเกตได้ (x 1, x 2, ..., xn)เรียกว่าการรับรู้ตัวแปรสุ่ม เอ็กซ์(n - ขนาดตัวอย่าง) การแจกแจงของตัวแปรสุ่มในประชากรทั่วไปมีลักษณะทางทฤษฎีและเป็นอุดมคติ และมีลักษณะคล้ายคลึงกับตัวอย่าง เชิงประจักษ์การกระจาย. การแจกแจงทางทฤษฎีบางอย่างมีการระบุไว้ในเชิงวิเคราะห์ เช่น ของพวกเขา ตัวเลือกกำหนดค่าของฟังก์ชันการแจกแจงในแต่ละจุดในปริภูมิของค่าที่เป็นไปได้ของตัวแปรสุ่ม สำหรับตัวอย่าง ฟังก์ชันการกระจายจึงเป็นเรื่องยากและบางครั้งก็ไม่สามารถระบุได้ ตัวเลือกถูกประมาณจากข้อมูลเชิงประจักษ์ จากนั้นจึงแทนที่เป็นนิพจน์เชิงวิเคราะห์ที่อธิบายการกระจายตัวทางทฤษฎี ในกรณีนี้ สมมติฐาน (หรือ สมมติฐาน) เกี่ยวกับประเภทของการแจกแจงอาจมีความถูกต้องทางสถิติหรือผิดพลาดก็ได้ แต่ไม่ว่าในกรณีใด การกระจายตัวเชิงประจักษ์ที่สร้างขึ้นใหม่จากตัวอย่างจะแสดงลักษณะเฉพาะของจริงโดยคร่าวๆ เท่านั้น พารามิเตอร์การกระจายที่สำคัญที่สุดคือ มูลค่าที่คาดหวังและความแปรปรวน

โดยธรรมชาติแล้วจะมีการแจกแจง อย่างต่อเนื่องและ ไม่ต่อเนื่อง. การกระจายตัวต่อเนื่องที่รู้จักกันดีที่สุดคือ ปกติ. ตัวอย่างของพารามิเตอร์ที่คล้ายคลึงกันได้แก่: ค่าเฉลี่ยและความแปรปรวนเชิงประจักษ์ ในบรรดางานวิจัยที่ไม่ต่อเนื่องในการวิจัยทางเศรษฐกิจและสังคม มีการใช้บ่อยที่สุด ทางเลือก (ขั้ว)การกระจาย. พารามิเตอร์ความคาดหวังทางคณิตศาสตร์ของการแจกแจงนี้จะแสดงค่าสัมพัทธ์ (หรือ แบ่งปัน) หน่วยของประชากรที่มีลักษณะเฉพาะที่กำลังศึกษา (ระบุด้วยตัวอักษร) สัดส่วนของประชากรที่ไม่มีลักษณะนี้จะแสดงด้วยตัวอักษร คิว (คิว = 1 - พี). ความแปรปรวนของการแจกแจงแบบทางเลือกยังมีการเปรียบเทียบเชิงประจักษ์ด้วย

ขึ้นอยู่กับประเภทของการแจกแจงและวิธีการเลือกหน่วยประชากร ลักษณะของพารามิเตอร์การแจกแจงจะถูกคำนวณแตกต่างกัน หลักสำหรับการแจกแจงทางทฤษฎีและเชิงประจักษ์แสดงไว้ในตาราง 9.1.

ตัวอย่างเศษส่วน k nอัตราส่วนของจำนวนหน่วยในประชากรตัวอย่างต่อจำนวนหน่วยในประชากรทั่วไปเรียกว่า:

kn = ไม่มี/ไม่มี.

ตัวอย่างเศษส่วน w- คืออัตราส่วนของหน่วยที่มีลักษณะเฉพาะที่กำลังศึกษา xถึงขนาดตัวอย่าง n:

w = n n / n.

ตัวอย่าง.ในชุดสินค้าที่มีจำนวน 1,000 หน่วย โดยมีตัวอย่าง 5% แบ่งปันตัวอย่าง k nมูลค่าสัมบูรณ์คือ 50 หน่วย (n = น*0.05); หากพบสินค้าชำรุด 2 ชิ้นในตัวอย่างนี้แสดงว่า อัตราข้อบกพร่องตัวอย่าง wจะเป็น 0.04 (w = 2/50 = 0.04 หรือ 4%)

เนื่องจากประชากรกลุ่มตัวอย่างแตกต่างจากประชากรทั่วไปจึงมี ข้อผิดพลาดในการสุ่มตัวอย่าง.

ตารางที่ 9.1 พารามิเตอร์หลักของประชากรทั่วไปและประชากรตัวอย่าง

สถิติทางคณิตศาสตร์ เป็นสาขาวิชาคณิตศาสตร์ที่ศึกษาวิธีการโดยประมาณในการหากฎการแจกแจงและคุณลักษณะเชิงตัวเลขจากผลการทดลอง

ประชากร – นี่คือชุดของค่าที่เป็นไปได้ทั้งหมดของการสังเกต (วัตถุ) ซึ่งเป็นเนื้อเดียวกันโดยคำนึงถึงคุณลักษณะบางอย่างที่สามารถทำได้

ตัวอย่างเป็นการรวบรวมข้อสังเกต (วัตถุ) ที่ได้รับการสุ่มเลือกมาเพื่อการศึกษาโดยตรงจากประชาชนทั่วไป

การกระจายทางสถิติ คือเซตของตัวแปร x i และความถี่ที่สอดคล้องกัน n i

ฮิสโตแกรมความถี่เป็นรูปขั้นบันไดประกอบด้วยรูปสี่เหลี่ยมผืนผ้าที่อยู่ติดกันสร้างเป็นเส้นตรงเดียวกัน โดยมีฐานเท่ากันและเท่ากับความกว้างของชั้น และความสูงเท่ากับความถี่ของการตกลงไปในช่วง n i หรือความถี่สัมพัทธ์ n i / n. ความกว้างของช่วงที่ฉันสามารถกำหนดได้ ตามสูตรของสเตอร์จส์:

I=(x สูงสุด -x นาที)/(1+3.32lgn)

โดยที่ x สูงสุด – สูงสุด; x min คือค่าต่ำสุดของตัวเลือก และเรียกว่าผลต่าง ช่วงการเปลี่ยนแปลง; n – ขนาดตัวอย่าง

รูปหลายเหลี่ยมความถี่ – เส้นขาด ซึ่งเป็นส่วนที่เชื่อมต่อจุดกับพิกัด x i, n i

5. ลักษณะของตำแหน่ง (โหมด ค่ามัธยฐาน ค่าเฉลี่ยตัวอย่าง) และการกระจายตัว (ความแปรปรวนตัวอย่างและค่าเบี่ยงเบนมาตรฐานตัวอย่าง)

แฟชั่น (ม โอ ) สิ่งเหล่านี้เป็นตัวแปรของความหมายที่ว่าความหมายก่อนหน้าและต่อไปนี้มีความถี่ในการเกิดขึ้นต่ำกว่า

สำหรับการแจกแจงแบบ Unimodal รูปแบบคือรูปแบบที่เกิดขึ้นบ่อยที่สุดในประชากรที่กำหนด

หากต้องการกำหนดโหมดของอนุกรมช่วงเวลา ให้ใช้สูตร:

0 =x ด้านล่าง +i*((น 2 -n 1 )/(2น 2 -n 1 +น 3 )),

โดยที่ x lower คือขอบเขตล่างของคลาส modal เช่น คลาสที่มีความถี่สูงสุดในการเกิดขึ้น n 2; n 2 – ความถี่คลาสกิริยา; n 1 – ความถี่ของคลาสที่อยู่ก่อนหน้าโมดอล n 3 – ความถี่ของคลาสถัดจากโมดอล i คือความกว้างของช่วงชั้นเรียน

ค่ามัธยฐาน (ม )- นี่คือค่าของแอตทริบิวต์ โดยชุดการจำหน่ายจะแบ่งออกเป็น 2 ส่วนซึ่งมีปริมาตรเท่ากัน

ค่าเฉลี่ยตัวอย่าง – นี่คือค่าเฉลี่ยเลขคณิตของตัวแปรของชุดข้อมูลทางสถิติ

ความแปรปรวนตัวอย่าง– ค่าเฉลี่ยเลขคณิตของการเบี่ยงเบนกำลังสองจากค่าเฉลี่ย:

ส่วนเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวนตัวอย่าง:

วี =√( วี 2 )

6. การประมาณค่าพารามิเตอร์ของประชากรทั่วไปตามตัวอย่าง (จุดและช่วงเวลา) ช่วงความเชื่อมั่นและความน่าจะเป็นของความเชื่อมั่น

ค่าตัวเลขที่แสดงถึงลักษณะประชากรเรียกว่า พารามิเตอร์

การประมาณค่าทางสถิติสามารถทำได้สองวิธี:

1)การประมาณจุด– การประมาณการที่กำหนดสำหรับจุดใดจุดหนึ่ง

2)การประมาณช่วง– ขึ้นอยู่กับข้อมูลตัวอย่าง ช่วงเวลาที่ค่าจริงอยู่กับความน่าจะเป็นที่กำหนดจะถูกประมาณ

การประมาณจุดคือคะแนนที่กำหนดโดยตัวเลขตัวเดียว และจำนวนนี้ถูกกำหนดโดยการสุ่มตัวอย่าง

การประมาณจุดเรียกว่า ร่ำรวย, ถ้าขนาดตัวอย่างเพิ่มขึ้น ลักษณะเฉพาะของตัวอย่างก็มีแนวโน้มที่จะสอดคล้องกับลักษณะเฉพาะของประชากรทั่วไป

การประมาณจุดเรียกว่า มีประสิทธิภาพหากมีค่าความแปรปรวนการกระจายตัวอย่างน้อยที่สุดเมื่อเปรียบเทียบกับค่าประมาณอื่นๆ ที่คล้ายคลึงกัน

การประมาณจุดเรียกว่า เป็นกลางหากความคาดหวังทางคณิตศาสตร์เท่ากับพารามิเตอร์การประมาณค่าสำหรับขนาดตัวอย่างใดๆ

การประมาณค่าเฉลี่ยทั่วไปอย่างไม่เอนเอียง(ความคาดหวังทางคณิตศาสตร์) คือค่าเฉลี่ยตัวอย่างใน:

วี = ฉัน n ฉัน ,

โดยที่ x i – ตัวเลือกการสุ่มตัวอย่าง n i – ความถี่ของการเกิดตัวเลือก x i; n – ขนาดตัวอย่าง

การประมาณช่วงเป็นช่วงตัวเลขที่กำหนดโดยตัวเลขสองตัว - ขอบเขตของช่วงซึ่งมีพารามิเตอร์ที่ไม่รู้จักของประชากรทั่วไป

ช่วงความเชื่อมั่น– นี่เป็นช่วงเวลาที่ค่าพารามิเตอร์ที่ไม่รู้จักของประชากรตั้งอยู่ ด้วยความน่าจะเป็นที่กำหนดไว้ล่วงหน้าอย่างใดอย่างหนึ่งหรืออย่างอื่น

ความน่าจะเป็นของความมั่นใจพีนี่เป็นความน่าจะเป็นที่เหตุการณ์ความน่าจะเป็น (1-p) ถือได้ว่าเป็นไปไม่ได้ α=1-р คือระดับนัยสำคัญ โดยปกติแล้ว ความน่าจะเป็นที่ใกล้กับ 1 จะถูกใช้เป็นความน่าจะเป็นของความเชื่อมั่น จากนั้น เหตุการณ์ที่ช่วงครอบคลุมคุณลักษณะนั้นจะมีความน่าเชื่อถือในทางปฏิบัติ เหล่านี้คือp≥0.95, p≥0.99, p≥0.999

สำหรับขนาดตัวอย่างขนาดเล็ก (n<30) нормально распределенного количественного признака х доверительный интервал может иметь вид:

วี - t≤≤ วี + เสื้อ (р≥0.95)

ค่าเฉลี่ยทั่วไปอยู่ที่ไหน c – ค่าเฉลี่ยตัวอย่าง; t เป็นตัวบ่งชี้ปกติของการแจกแจงของนักเรียนด้วยระดับความเป็นอิสระ (n-1) ซึ่งถูกกำหนดโดยความน่าจะเป็นที่พารามิเตอร์ทั่วไปจะตกอยู่ในช่วงเวลาที่กำหนด m คือค่าคลาดเคลื่อนของค่าเฉลี่ยตัวอย่าง