ชุดการกระจายทางสถิติ แสดงถึงการจัดเรียงหน่วยประชากรที่ได้รับการศึกษาเป็นกลุ่มตามลักษณะการจัดกลุ่มอย่างเป็นระเบียบ
มีชุดการแจกแจงแบบระบุแหล่งที่มาและแบบแปรผัน
แอตทริบิวต์ เป็นชุดการจำหน่ายที่สร้างขึ้นตามคุณลักษณะเชิงคุณภาพ เป็นการกำหนดลักษณะองค์ประกอบของประชากรตามลักษณะสำคัญต่างๆ
มันถูกสร้างขึ้นตามเกณฑ์เชิงปริมาณ ชุดการกระจายแบบแปรผัน ประกอบด้วยความถี่ (จำนวน) ของแต่ละตัวแปรหรือแต่ละกลุ่ม ซีรีย์การเปลี่ยนแปลง. ตัวเลขเหล่านี้แสดงให้เห็นว่าเป็นเรื่องธรรมดาแค่ไหน ตัวเลือกต่างๆ(ค่าลักษณะเฉพาะ) ในชุดการแจกแจง ผลรวมของความถี่ทั้งหมดจะกำหนดขนาดของประชากรทั้งหมด
จำนวนของกลุ่มจะแสดงในรูปแบบสัมบูรณ์และ ค่าสัมพัทธ์โอ้. ในแง่สัมบูรณ์จะแสดงด้วยจำนวนหน่วยประชากรในแต่ละกลุ่มที่เลือกและในแง่สัมพัทธ์ - ในรูปแบบของส่วนแบ่ง แรงดึงดูดเฉพาะนำเสนอเป็นเปอร์เซ็นต์ของทั้งหมด
ขึ้นอยู่กับลักษณะของการเปลี่ยนแปลงของคุณลักษณะ ชุดการแจกแจงแบบแปรผันแบบไม่ต่อเนื่องและแบบช่วงเวลาจะแตกต่างกัน ในชุดรูปแบบแปรผันแบบแยก การแจกแจงแบบกลุ่มจะประกอบขึ้นตามคุณลักษณะที่เปลี่ยนแปลงแบบไม่ต่อเนื่องและรับเฉพาะค่าจำนวนเต็มเท่านั้น
ในอนุกรมการแจกแจงแบบแปรผันตามช่วงเวลา คุณลักษณะการจัดกลุ่มที่เป็นพื้นฐานของการจัดกลุ่มสามารถใช้กับค่าใดๆ ในช่วงเวลาหนึ่งได้
อนุกรมรูปแบบประกอบด้วยสององค์ประกอบ: ความถี่และความแปรผัน
ตัวเลือก เรียกค่าแต่ละค่าของคุณลักษณะตัวแปรที่ใช้ในอนุกรมการแจกแจง
ความถี่- นี่คือจำนวนตัวแปรแต่ละตัวหรือแต่ละกลุ่มของอนุกรมรูปแบบต่างๆ หากความถี่แสดงเป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์ของทั้งหมด จะเรียกว่าความถี่
กฎและหลักการในการสร้างอนุกรมการแจกแจงตามช่วงเวลาจะขึ้นอยู่กับกฎและหลักการที่คล้ายกันในการสร้างการจัดกลุ่มทางสถิติ ถ้าชุดการแปรผันช่วงของการแจกแจงถูกสร้างขึ้นโดยมีช่วงเท่ากัน ความถี่จะทำให้สามารถตัดสินระดับที่ช่วงนั้นเต็มไปด้วยหน่วยประชากรได้ สำหรับ การวิเคราะห์เปรียบเทียบอัตราการเข้าพักของช่วงเวลาจะกำหนดตัวบ่งชี้ที่จะระบุลักษณะความหนาแน่นของการกระจาย
ความหนาแน่นของการกระจายคืออัตราส่วนของจำนวนหน่วยประชากรต่อความกว้างของช่วง
หลากหลายเรียกว่าชุดการแจกจ่ายที่สร้างขึ้นบนพื้นฐานเชิงปริมาณ ชุดรูปแบบต่างๆ ประกอบด้วยสององค์ประกอบ: ตัวเลือกและความถี่ ตัวเลือกพิจารณาค่าแต่ละค่าของคุณลักษณะที่ใช้ในชุดรูปแบบต่างๆ เช่น ค่าเฉพาะของคุณลักษณะที่แตกต่างกัน ความถี่- นี่คือตัวเลขของตัวเลือกแต่ละตัวหรือแต่ละกลุ่มของชุดรูปแบบต่างๆ เช่น ตัวเลขเหล่านี้แสดงว่าตัวเลือกบางอย่างเกิดขึ้นในชุดการแจกจ่ายบ่อยแค่ไหน ผลรวมของความถี่ทั้งหมดจะกำหนดขนาดของประชากรทั้งหมดและปริมาตรของมัน
ความถี่เรียกว่าความถี่ที่แสดงเป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์ของทั้งหมด ดังนั้นผลรวมของความถี่จึงเท่ากับ 1 หรือ 100%
ขึ้นอยู่กับลักษณะของการแปรผันของคุณลักษณะ อนุกรมการแปรผันแบบแยกและแบบช่วงเวลามีความโดดเด่น
ดังที่ทราบกันดีว่าการแปรผันของคุณลักษณะเชิงปริมาณอาจไม่ต่อเนื่อง (ไม่ต่อเนื่อง) หรือต่อเนื่อง
ในกรณีของการแปรผันแบบไม่ต่อเนื่อง ค่าของคุณลักษณะเชิงปริมาณจะใช้เฉพาะค่าจำนวนเต็มเท่านั้น เพราะฉะนั้น, ซีรีย์รูปแบบที่ไม่ต่อเนื่องแสดงลักษณะเฉพาะการกระจายหน่วยประชากรตามลักษณะเฉพาะที่ไม่ต่อเนื่อง ตัวอย่างของชุดรูปแบบที่ไม่ต่อเนื่องกันคือการกระจายของครอบครัวตามจำนวนห้องในแต่ละอพาร์ทเมนต์ตามที่ระบุในตาราง 3.12.
คอลัมน์แรกของตารางแสดงตัวเลือกสำหรับชุดรูปแบบที่แยกจากกัน คอลัมน์ที่สองประกอบด้วยความถี่ของชุดรูปแบบต่างๆ และคอลัมน์ที่สามแสดงความถี่
ในกรณีที่มีการแปรผันอย่างต่อเนื่อง ค่าของคุณลักษณะในหน่วยประชากรอาจใช้ค่าใด ๆ ที่แตกต่างกันในจำนวนเล็กน้อยภายในขอบเขตที่กำหนด การก่อสร้าง อนุกรมการเปลี่ยนแปลงช่วงเวลาประการแรกขอแนะนำสำหรับการแปรผันของคุณลักษณะอย่างต่อเนื่อง และหากการแปรผันแบบแยกส่วนปรากฏขึ้นในวงกว้าง กล่าวคือ จำนวนรูปแบบที่แตกต่างกันของลักษณะแบบแยกส่วนนั้นค่อนข้างมาก ในตาราง 3.3 แสดงชุดการเปลี่ยนแปลงช่วงเวลา
การแสดงกราฟิกของซีรีย์การจัดจำหน่าย
การวิเคราะห์ชุดการจัดจำหน่ายสามารถดำเนินการได้ตามความเหมาะสม ภาพกราฟิก. แผนภูมิแท่งและแผนภูมิวงกลมสร้างขึ้นเพื่อแสดงโครงสร้างของประชากร
เส้นต่างๆ เช่น รูปหลายเหลี่ยม สะสม โอจิฟ และฮิสโตแกรม ยังใช้ร่วมกับไดอะแกรมอีกด้วย เมื่อแสดงชุดรูปแบบที่แยกจากกัน จะใช้รูปหลายเหลี่ยม
รูปหลายเหลี่ยม- เส้นโค้งหักซึ่งสร้างขึ้นบนพื้นฐานของระบบพิกัดสี่เหลี่ยมเมื่อค่าของคุณลักษณะถูกพล็อตตามแกน X และความถี่ถูกพล็อตไปตามแกน Y
จุดเชื่อมต่อโค้งเรียบคือความหนาแน่นของการกระจายเชิงประจักษ์
สะสม- เส้นโค้งหักซึ่งสร้างขึ้นบนพื้นฐานของระบบพิกัดสี่เหลี่ยมเมื่อค่าของคุณลักษณะถูกพล็อตตามแกน X และความถี่สะสมถูกพล็อตไปตามแกน Y
สำหรับอนุกรมที่ไม่ต่อเนื่อง ค่าแอตทริบิวต์จะถูกพล็อตบนแกน และสำหรับอนุกรมช่วงเวลา ค่ากึ่งกลางของช่วงเวลา
จากฮิสโตแกรม คุณสามารถสร้างไดอะแกรมของความถี่สะสมด้วยการสร้างฟังก์ชันการกระจายเชิงประจักษ์เชิงประจักษ์ในภายหลัง
บทเรียนภาคปฏิบัติ 1
ชุดการกระจายที่หลากหลาย
ซีรี่ส์รูปแบบต่างๆหรือ ใกล้กระจายเรียกการกระจายคำสั่งของหน่วยประชากรตามค่าคุณลักษณะที่เพิ่มขึ้น (บ่อยขึ้น) หรือลดลง (น้อยลง) และนับจำนวนหน่วยด้วยค่าเฉพาะของลักษณะเฉพาะ
มี 3 ใจดีแถวการกระจายสินค้า:
1) ซีรีส์จัดอันดับ– นี่คือรายการของแต่ละหน่วยของประชากรโดยเรียงลำดับตามลักษณะที่กำลังศึกษาจากน้อยไปมาก หากจำนวนหน่วยประชากรมากเพียงพอ อนุกรมอันดับจะยุ่งยาก และในกรณีเช่นนี้ อนุกรมการแจกแจงจะถูกสร้างขึ้นโดยการจัดกลุ่มหน่วยประชากรตามค่าคุณลักษณะที่กำลังศึกษา (หากลักษณะเฉพาะมีจำนวนน้อย ค่า จากนั้นจะมีการสร้างอนุกรมแบบแยกส่วน มิฉะนั้น จะเป็นอนุกรมช่วงเวลา)
2) ซีรีส์ไม่ต่อเนื่อง- นี่คือตารางที่ประกอบด้วยสองคอลัมน์ (แถว) - ค่าเฉพาะของคุณลักษณะที่แตกต่างกัน เอ็กซ์ ฉันและจำนวนหน่วยประชากรที่มีค่าคุณลักษณะที่กำหนด ฉ ฉัน– ความถี่; จำนวนกลุ่มในชุดข้อมูลแยกจะถูกกำหนดโดยจำนวนค่าที่มีอยู่จริงของคุณลักษณะที่แตกต่างกัน
3) ซีรีย์ช่วงเวลา- นี่คือตารางที่ประกอบด้วยสองคอลัมน์ (แถว) - ช่วงเวลาของลักษณะที่แตกต่างกัน เอ็กซ์ ฉันและจำนวนหน่วยประชากรที่อยู่ในช่วงที่กำหนด (ความถี่) หรือสัดส่วนของจำนวนนี้ต่อจำนวนประชากรทั้งหมด (ความถี่)
ตัวเลขแสดงจำนวนครั้งที่แต่ละตัวเลือกเกิดขึ้นในประชากรที่กำหนด ความถี่หรือ ตาชั่งตัวเลือกและกำหนดด้วยอักษรตัวพิมพ์เล็กของอักษรละติน ฉ. ผลรวมของความถี่ของอนุกรมการแปรผันเท่ากับปริมาตรของประชากรที่กำหนด เช่น
ที่ไหน เค– จำนวนกลุ่ม n– จำนวนการสังเกตทั้งหมด หรือขนาดของประชากร
ความถี่ (น้ำหนัก) ไม่เพียงแต่แสดงในรูปแบบสัมบูรณ์เท่านั้น แต่ยังแสดงเป็นจำนวนสัมพัทธ์ด้วย - เป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์ของจำนวนตัวแปรทั้งหมดที่ประกอบเป็นประชากรที่กำหนด ในกรณีเช่นนี้จะมีการเรียกตุ้มน้ำหนัก ความถี่สัมพัทธ์หรือ ความถี่ผลรวมของชิ้นส่วนมีค่าเท่ากับหนึ่ง
หรือ
,
ถ้าความถี่แสดงเป็นเปอร์เซ็นต์ของจำนวนการสังเกตทั้งหมด ป.ไม่จำเป็นต้องแทนที่ความถี่ด้วยความถี่ แต่บางครั้งก็มีประโยชน์และจำเป็นในกรณีที่จำเป็นต้องเปรียบเทียบซีรีย์รูปแบบต่างๆ กันซึ่งมีปริมาตรต่างกันมาก
ขึ้นอยู่กับลักษณะการเปลี่ยนแปลง - แบบไม่ต่อเนื่องหรือต่อเนื่อง ในช่วงกว้างหรือแคบ - ประชากรทางสถิติจะถูกกระจายใน ไม่ใช่ช่วงเวลาหรือ ช่วงเวลาซีรีย์การเปลี่ยนแปลง ในกรณีแรกความถี่จะเกี่ยวข้องโดยตรงกับค่าอันดับของคุณลักษณะซึ่งได้รับตำแหน่งของแต่ละกลุ่มหรือคลาสของชุดรูปแบบต่างๆ ในส่วนที่สอง - จะนับความถี่ที่เกี่ยวข้องกับแต่ละช่วงเวลาหรือช่วงเวลา (จาก - ถึง) โดยแบ่งความแปรผันทั้งหมดของลักษณะเฉพาะออก ตั้งแต่ตัวเลือกขั้นต่ำไปจนถึงสูงสุดสำหรับประชากรที่กำหนด ช่องว่างเหล่านี้หรือช่วงชั้นเรียนอาจมีความกว้างเท่ากันหรือไม่ก็ได้ ดังนั้นพวกเขาจึงแยกแยะ อนุกรมการแปรผันช่วงเท่ากันและไม่เท่ากันในอนุกรมช่วงเวลาที่ไม่เท่ากัน ธรรมชาติของการแจกแจงความถี่จะเปลี่ยนไปตามความกว้างของช่วงคลาสที่เปลี่ยนแปลง การจัดกลุ่มช่วงเวลาที่ไม่เท่ากันนั้นไม่ค่อยมีใครใช้ในทางชีววิทยา ตามกฎแล้ว ข้อมูลไบโอเมตริกซ์จะถูกกระจายออกเป็นชุดข้อมูลที่มีช่วงระยะเวลาเท่ากัน ซึ่งไม่เพียงแต่ช่วยให้ระบุรูปแบบของความแปรผันเท่านั้น แต่ยังอำนวยความสะดวกในการคำนวณลักษณะตัวเลขสรุปของชุดข้อมูลรูปแบบต่างๆ และการเปรียบเทียบชุดข้อมูลการกระจายระหว่างกันอีกด้วย
เมื่อเริ่มสร้างอนุกรมรูปแบบที่มีช่วงเท่ากัน สิ่งสำคัญคือต้องจัดเค้าร่างความกว้างของช่วงชั้นเรียนให้ถูกต้อง ความจริงก็คือการจัดกลุ่มคร่าวๆ (เมื่อมีการกำหนดช่วงคลาสที่กว้างมาก) จะบิดเบือนคุณลักษณะทั่วไปของการแปรผัน และทำให้ความแม่นยำของคุณลักษณะเชิงตัวเลขของอนุกรมลดลง เมื่อเลือกช่วงเวลาที่แคบเกินไป ความแม่นยำของลักษณะตัวเลขโดยทั่วไปจะเพิ่มขึ้น แต่อนุกรมนั้นยืดเกินไปและไม่ได้ให้ภาพการเปลี่ยนแปลงที่ชัดเจน
เพื่อให้ได้ซีรีย์รูปแบบที่มองเห็นได้ชัดเจนและ เพื่อให้มั่นใจถึงความแม่นยำที่เพียงพอของคุณลักษณะเชิงตัวเลขที่คำนวณจากนั้น ความแปรผันของคุณลักษณะ (ตั้งแต่ตัวเลือกขั้นต่ำไปจนถึงสูงสุด) ควรแบ่งออกเป็นกลุ่มหรือคลาสจำนวนหนึ่งที่จะตรงตามข้อกำหนดทั้งสอง ปัญหานี้แก้ไขได้โดยการหารช่วงของการแปรผันของคุณลักษณะตามจำนวนกลุ่มหรือคลาสที่ระบุไว้เมื่อสร้างชุดรูปแบบ:
,
ที่ไหน ชม.– ขนาดช่วง; เอ็กซ์ม ก x และ เอ็กซ์นาที – รวมค่าสูงสุดและต่ำสุด เค– จำนวนกลุ่ม
เมื่อสร้างอนุกรมการแจกแจงตามช่วงเวลา จำเป็นต้องเลือกจำนวนกลุ่มที่เหมาะสมที่สุด (ช่วงแอตทริบิวต์) และตั้งค่าความยาว (ช่วง) ของช่วงเวลา เนื่องจากการวิเคราะห์อนุกรมการแจกแจงจะเปรียบเทียบความถี่ในช่วงเวลาที่ต่างกัน ความยาวของช่วงการแจกแจงจึงจำเป็นที่คงที่ หากคุณต้องจัดการกับชุดการแจกแจงช่วงเวลาที่มีช่วงเวลาที่ไม่เท่ากันดังนั้นเพื่อการเปรียบเทียบคุณต้องลดความถี่หรือความถี่ให้เป็นหน่วยของช่วงเวลาค่าผลลัพธ์จะถูกเรียกว่า ความหนาแน่น
ρ
, นั่นคือ
.
เลือกจำนวนกลุ่มที่เหมาะสมที่สุดเพื่อให้สะท้อนถึงความหลากหลายของค่าคุณลักษณะโดยรวมอย่างเพียงพอ และในขณะเดียวกัน รูปแบบการกระจายจะไม่ถูกบิดเบือนจากความผันผวนของความถี่แบบสุ่ม หากมีกลุ่มน้อยเกินไป รูปแบบของการแปรผันจะไม่ปรากฏ หากมีกลุ่มมากเกินไป การกระโดดความถี่แบบสุ่มจะทำให้รูปร่างของการแจกแจงผิดเพี้ยนไป
บ่อยครั้งที่จำนวนกลุ่มในชุดการแจกจ่ายถูกกำหนดโดยใช้สูตร Sturgess:
ที่ไหน n– ขนาดประชากร
การแสดงแบบกราฟิกให้ความช่วยเหลือที่สำคัญในการวิเคราะห์อนุกรมการแจกแจงและคุณสมบัติของชุดข้อมูล อนุกรมช่วงเวลาแสดงด้วยแผนภูมิแท่งซึ่งฐานของแท่งที่อยู่ตามแนวแกน Abscissa คือช่วงเวลาของค่าของลักษณะที่แตกต่างกันและความสูงของแท่งคือความถี่ที่สอดคล้องกับมาตราส่วนตามพิกัด แกน. ไดอะแกรมประเภทนี้เรียกว่า ฮิสโตแกรม
หากมีอนุกรมการแจกแจงแบบแยกส่วนหรือใช้จุดกึ่งกลางของช่วงเวลา การแสดงแบบกราฟิกของอนุกรมดังกล่าวจะถูกเรียกว่า รูปหลายเหลี่ยมซึ่งได้มาจากการเชื่อมต่อเส้นตรงกับจุดที่มีพิกัด เอ็กซ์ ฉันและ ฉ ฉัน .
หากค่าของคลาสถูกพล็อตตามแกน abscissa และความถี่สะสมถูกพล็อตไปตามแกนกำหนดตามด้วยการเชื่อมต่อจุดด้วยเส้นตรงกราฟที่เรียกว่า สะสมความถี่สะสมจะพบได้จากผลรวมตามลำดับหรือ การสะสมความถี่ในทิศทางจากคลาสแรกไปจนถึงจุดสิ้นสุดของซีรีย์รูปแบบต่างๆ
ตัวอย่าง. มีข้อมูลเกี่ยวกับการผลิตไข่ของแม่ไก่ไข่ 50 ตัวใน 1 ปีเลี้ยงในฟาร์มสัตว์ปีก (ตารางที่ 1.1)
ตารางที่ 1.1
การผลิตไข่ของแม่ไก่ไข่
ไก่ไข่หมายเลข |
การผลิตไข่ ชิ้น |
ไก่ไข่หมายเลข |
การผลิตไข่ ชิ้น |
ไก่ไข่หมายเลข |
การผลิตไข่ ชิ้น |
ไก่ไข่หมายเลข |
การผลิตไข่ ชิ้น |
ไก่ไข่หมายเลข |
การผลิตไข่ ชิ้น |
จำเป็นต้องสร้างอนุกรมการแจกแจงตามช่วงเวลาและแสดงเป็นกราฟในรูปแบบของฮิสโตแกรม รูปหลายเหลี่ยม และสะสม
จะเห็นได้ว่าลักษณะนี้แตกต่างกันไปตั้งแต่ 212 ถึง 245 ฟองที่ได้จากแม่ไก่ไข่ใน 1 ปี
ในตัวอย่างของเรา โดยใช้สูตร Sturgess เรากำหนดจำนวนกลุ่ม:
เค = 1 + 3,322แอลจี 50 = 6,643 ≈ 7.
ลองคำนวณความยาว (ช่วง) ของช่วงเวลาโดยใช้สูตร:
.
มาสร้างอนุกรมช่วงเวลาด้วย 7 กลุ่มและช่วงเวลา 5 ส่วนกัน ไข่ (ตารางที่ 1.2) ในการสร้างกราฟในตาราง เราจะคำนวณจุดกึ่งกลางของช่วงเวลาและความถี่สะสม
ตารางที่ 1.2
การกระจายการผลิตไข่แบบช่วง
กลุ่มแม่ไก่ไข่โดยการผลิตไข่ เอ็กซ์ ฉัน |
จำนวนแม่ไก่ไข่ ฉ ฉัน |
ตรงกลางของช่วง เอ็กซ์ฉัน' |
ความถี่สะสม ฉ ฉัน ’ |
|
เรามาสร้างฮิสโตแกรมการกระจายการผลิตไข่กันเถอะ (รูปที่ 1.1)
ข้าว. 1.1. ฮิสโตแกรมการกระจายการผลิตไข่
ฮิสโตแกรมเหล่านี้แสดงลักษณะรูปร่างการกระจายของลักษณะต่างๆ มากมาย: ค่าของช่วงเวลาเฉลี่ยของลักษณะนั้นพบได้บ่อยกว่า และค่าสุดขีด (เล็กและใหญ่) ของลักษณะนั้นพบน้อยกว่า รูปร่างของการแจกแจงนี้ใกล้เคียงกับกฎการแจกแจงแบบปกติ ซึ่งเกิดขึ้นหากตัวแปรที่แตกต่างกันได้รับอิทธิพลจากปัจจัยจำนวนมาก ซึ่งไม่มีปัจจัยใดที่มีนัยสำคัญเหนือกว่า
รูปหลายเหลี่ยมและการกระจายสะสมของการผลิตไข่มีลักษณะดังนี้ (รูปที่ 1.2 และ 1.3)
ข้าว. 1.2. พื้นที่จำหน่ายการผลิตไข่
ข้าว. 1.3. การกระจายการผลิตไข่สะสม
เทคโนโลยีในการแก้ปัญหาใน โปรเซสเซอร์ตาราง ไมโครซอฟต์ เอ็กเซล ต่อไป.
1. ป้อนข้อมูลเบื้องต้นตามรูป 1.4.
2. จัดอันดับซีรีส์
2.1. เลือกเซลล์ A2:A51
2.2. คลิกซ้ายบนแถบเครื่องมือบนปุ่ม<Сортировка по возрастанию > .
3. กำหนดขนาดของช่วงเวลาในการสร้างอนุกรมการแจกแจงช่วงเวลา
3.1. คัดลอกเซลล์ A2 ไปยังเซลล์ E53
3.2. คัดลอกเซลล์ A51 ไปยังเซลล์ E54
3.3. คำนวณช่วงของการเปลี่ยนแปลง เมื่อต้องการทำเช่นนี้ ให้ป้อนสูตรในเซลล์ E55 =E54-E53.
3.4. คำนวณจำนวนกลุ่มรูปแบบ เมื่อต้องการทำเช่นนี้ ให้ป้อนสูตรในเซลล์ E56 =1+3.322*ล็อก10(50).
3.5. ป้อนจำนวนกลุ่มที่ปัดเศษในเซลล์ E57
3.6. คำนวณความยาวของช่วงเวลา เมื่อต้องการทำเช่นนี้ ให้ป้อนสูตรในเซลล์ E58 =E55/E57.
3.7. ป้อนความยาวช่วงการปัดเศษในเซลล์ E59
4. สร้างอนุกรมช่วงเวลา
4.1. คัดลอกเซลล์ E53 ไปยังเซลล์ B64
4.2. ป้อนสูตรในเซลล์ B65 =B64+$E$59.
4.3. คัดลอกเซลล์ B65 ไปยังเซลล์ B66:B70
4.4. ป้อนสูตรในเซลล์ C64 =B65.
4.5. ป้อนสูตรในเซลล์ C65 =C64+$E$59.
4.6. คัดลอกเซลล์ C65 ไปยังเซลล์ C66:C70
ผลลัพธ์ของการแก้ปัญหาจะแสดงบนหน้าจอแสดงผลในรูปแบบต่อไปนี้ (รูปที่ 1.5)
5. คำนวณความถี่ช่วงเวลา
5.1. รันคำสั่ง บริการ,การวิเคราะห์ข้อมูลโดยคลิกสลับกันด้วยปุ่มซ้ายของเมาส์
5.2. ในกล่องโต้ตอบ การวิเคราะห์ข้อมูลใช้ปุ่มซ้ายของเมาส์เพื่อติดตั้ง: เครื่องมือวิเคราะห์ <Гистограмма>(รูปที่ 1.6)
5.3. คลิกซ้ายที่ปุ่ม<ОК>.
5.4. บนแท็บ แผนภูมิแท่งตั้งค่าพารามิเตอร์ตามรูป 1.7.
5.5. คลิกซ้ายที่ปุ่ม<ОК>.
ผลลัพธ์ของการแก้ปัญหาจะแสดงบนหน้าจอแสดงผลในรูปแบบต่อไปนี้ (รูปที่ 1.8)
6. กรอกตาราง “อนุกรมการแจกแจงช่วง”
6.1. คัดลอกเซลล์ B74:B80 ไปยังเซลล์ D64:D70
6.2. คำนวณผลรวมของความถี่ เมื่อต้องการทำเช่นนี้ ให้เลือกเซลล์ D64:D70 แล้วคลิกซ้ายที่ปุ่มในแถบเครื่องมือ<Автосумма > .
6.3. คำนวณจุดกึ่งกลางของช่วงเวลา เมื่อต้องการทำเช่นนี้ ให้ป้อนสูตรในเซลล์ E64 =(B64+C64)/2และคัดลอกไปยังเซลล์ E65:E70
6.4. คำนวณความถี่สะสม เมื่อต้องการทำเช่นนี้ ให้คัดลอกเซลล์ D64 ไปยังเซลล์ F64 ในเซลล์ F65 ให้ใส่สูตร =F64+D65 แล้วคัดลอกไปยังเซลล์ F66:F70
ผลลัพธ์ของการแก้ปัญหาจะแสดงบนหน้าจอแสดงผลในรูปแบบต่อไปนี้ (รูปที่ 1.9)
7. แก้ไขฮิสโตแกรม
7.1. คลิกขวาที่ไดอะแกรมชื่อ "พ็อกเก็ต" และบนแท็บที่ปรากฏขึ้นให้คลิกปุ่ม<Очистить>.
7.2. คลิกขวาที่แผนภูมิ และในแท็บที่ปรากฏขึ้น ให้คลิก<Исходные данные>.
7.3. ในกล่องโต้ตอบ ข้อมูลเบื้องต้นเปลี่ยนป้ายกำกับแกน X โดยเลือกเซลล์ B64:C70 (รูปที่ 1.10)
7.5. กดปุ่ม
ผลลัพธ์จะแสดงบนหน้าจอแสดงผลในรูปแบบต่อไปนี้ (รูปที่ 1.11)
8. สร้างรูปหลายเหลี่ยมเพื่อกระจายการผลิตไข่
8.1. คลิกซ้ายบนแถบเครื่องมือบนปุ่ม<Мастер диаграмм > .
8.2. ในกล่องโต้ตอบ ตัวช่วยสร้างแผนภูมิ (ขั้นตอนที่ 1 จาก 4)โดยใช้ชุดปุ่มซ้ายของเมาส์: Standard <График>(รูปที่ 1.12)
8.3. คลิกซ้ายที่ปุ่ม<Далее>.
8.4. ในกล่องโต้ตอบ ตัวช่วยสร้างแผนภูมิ (ขั้นตอนที่ 2 จาก 4)ตั้งค่าพารามิเตอร์ตามรูป 1.13.
8.5. คลิกซ้ายที่ปุ่ม<Далее>.
8.6. ในกล่องโต้ตอบ ตัวช่วยสร้างแผนภูมิ (ขั้นตอนที่ 3 จาก 4)ป้อนชื่อของไดอะแกรมและแกน Y (รูปที่ 1.14)
8.7. คลิกซ้ายที่ปุ่ม<Далее>.
8.8. ในกล่องโต้ตอบ ตัวช่วยสร้างแผนภูมิ (ขั้นตอนที่ 4 จาก 4)ตั้งค่าพารามิเตอร์ตามรูป 1.15.
8.9. คลิกซ้ายที่ปุ่ม<Готово>.
ผลลัพธ์จะแสดงบนหน้าจอแสดงผลในรูปแบบต่อไปนี้ (รูปที่ 1.16)
9. แทรกป้ายกำกับข้อมูลลงในกราฟ
9.1. คลิกขวาที่แผนภูมิ และในแท็บที่ปรากฏขึ้น ให้คลิก<Исходные данные>.
9.2. ในกล่องโต้ตอบ ข้อมูลเบื้องต้นเปลี่ยนป้ายกำกับแกน X โดยเลือกเซลล์ E64:E70 (รูปที่ 1.17)
9.3. กดปุ่ม
ผลลัพธ์จะแสดงบนหน้าจอแสดงผลในรูปแบบต่อไปนี้ (รูปที่ 1.18)
การสะสมการแจกแจงถูกสร้างขึ้นคล้ายกับรูปหลายเหลี่ยมการแจกแจงตามความถี่ที่สะสม
มูลค่าทั้งหมดของทรัพย์สินภายใต้การศึกษาที่เกิดขึ้นในกลุ่มประชากรที่ศึกษาเรียกว่ามูลค่าของคุณลักษณะ (ตัวเลือก ตัวเลือก) และการเปลี่ยนแปลงของค่านี้ โดยการเปลี่ยนแปลง. ตัวเลือกจะแสดงด้วยตัวอักษรละตินตัวเล็กพร้อมดัชนีที่สอดคล้องกับหมายเลขซีเรียลของกลุ่ม - x ฉัน .
ตัวเลขที่แสดงจำนวนครั้งที่ค่าคุณลักษณะแต่ละค่าเกิดขึ้นในประชากรที่กำลังศึกษา ความถี่ และแสดงถึง f ฉัน . ผลรวมของความถี่ทั้งหมดของอนุกรมนี้เท่ากับปริมาตรของประชากรที่กำลังศึกษา
บ่อยครั้งคุณต้องนับ ความถี่สะสม (ส). ความถี่สะสมสำหรับค่าลักษณะเฉพาะแต่ละค่าจะแสดงจำนวนหน่วยประชากรที่มีค่าลักษณะเฉพาะไม่เกิน มูลค่าที่กำหนด. ความถี่สะสมคำนวณโดยการเพิ่มค่าคุณลักษณะต่อไปนี้ตามลำดับในความถี่ของค่าแรกของเครื่องหมายความถี่:
ความถี่สะสมเริ่มคำนวณจากค่าแรกของแอตทริบิวต์
ผลรวมของความถี่จะเท่ากับหนึ่งหรือ 100% เสมอ การแทนที่ความถี่ด้วยความถี่ทำให้สามารถเปรียบเทียบอนุกรมความแปรผันกับจำนวนการสังเกตที่ต่างกันได้
ในบางกรณีความถี่ของอนุกรม (f i) สามารถถูกแทนที่ด้วยความถี่ (ω i)
หากชุดรูปแบบได้รับในช่วงเวลาไม่เท่ากันเพื่อให้เข้าใจถึงธรรมชาติของการแจกแจงที่ถูกต้องจำเป็นต้องคำนวณความหนาแน่นสัมบูรณ์หรือสัมพัทธ์ของการแจกแจง
ความหนาแน่นของการกระจายสัมบูรณ์ (หน้า ฉ ) หมายถึงค่าความถี่ต่อขนาดหน่วยของช่วงเวลาของกลุ่มแยกอนุกรม:
ร ฉ = ฉ/ ฉัน.
ความหนาแน่นของการกระจายสัมพัทธ์ (หน้า ω ) หมายถึงค่าความถี่ต่อขนาดหน่วยของช่วงเวลาของกลุ่มแยกอนุกรม:
ร ω = ω / ฉัน.
สำหรับอนุกรมที่มีช่วงเวลาไม่เท่ากัน เฉพาะคุณลักษณะเหล่านี้เท่านั้นที่ให้แนวคิดที่ถูกต้องเกี่ยวกับธรรมชาติของการแจกแจงมากกว่าความถี่และความถี่
การกระจายตัวอย่างทางสถิติ เรียกรายการตัวเลือก (ค่าแอตทริบิวต์) และความถี่หรือความหนาแน่นของการแจกแจงที่สอดคล้องกัน ความถี่สัมพัทธ์ หรือความหนาแน่นของการแจกแจงสัมพันธ์
อนุกรมการกระจายที่แตกต่างกันมีลักษณะเฉพาะด้วยชุดลักษณะความถี่ที่แตกต่างกัน:
น้อยที่สุด - ชุดคุณลักษณะ (ความถี่, ความถี่)
สำหรับสิ่งที่ไม่ต่อเนื่องจะใช้คุณสมบัติสี่ประการ (ความถี่, ความถี่, ความถี่สะสม, ความถี่สะสม)
สำหรับช่วงเวลา – ทั้งห้า (ความถี่ ความถี่ ความถี่สะสม ความถี่สะสม ความหนาแน่นของการแจกแจงแบบสัมบูรณ์และสัมพัทธ์)
กฎสำหรับการสร้างอนุกรมความแปรผันตามช่วงเวลา
การแสดงกราฟิกของซีรีย์รูปแบบต่างๆ
ขั้นตอนแรกของการศึกษาชุดรูปแบบคือการสร้างการแสดงภาพกราฟิก การแสดงชุดรูปแบบต่างๆ แบบกราฟิกช่วยอำนวยความสะดวกในการวิเคราะห์ และช่วยให้สามารถตัดสินรูปร่างของการแจกแจงได้ ในการแสดงชุดความแปรผันในสถิติในรูปแบบกราฟิก จะมีการสร้างฮิสโตแกรม รูปหลายเหลี่ยม และการกระจายแบบสะสม
อนุกรมความแปรผันที่แยกจากกันจะถูกแสดงเป็นสิ่งที่เรียกว่ารูปหลายเหลี่ยมความถี่
ในการแสดงอนุกรมช่วงเวลา จะใช้รูปหลายเหลี่ยมการกระจายความถี่และฮิสโตแกรมความถี่
กราฟถูกสร้างขึ้นในระบบพิกัดสี่เหลี่ยม
แถวที่สร้าง บนพื้นฐานเชิงปริมาณเรียกว่า แปรผัน.
ชุดการจัดจำหน่ายประกอบด้วย ตัวเลือก(ค่าลักษณะเฉพาะ) และ ความถี่(จำนวนกลุ่ม) ความถี่ที่แสดงเป็นค่าสัมพัทธ์ (เศษส่วน, เปอร์เซ็นต์) เรียกว่า ความถี่. ผลรวมของความถี่ทั้งหมดเรียกว่าปริมาตรของอนุกรมการแจกแจง
โดยแบ่งตามประเภทชุดการจำหน่ายออกเป็น ไม่ต่อเนื่อง(สร้างตามค่าที่ไม่ต่อเนื่องของคุณลักษณะ) และ ช่วงเวลา(ขึ้นอยู่กับค่าต่อเนื่องของคุณลักษณะ)
ซีรี่ส์รูปแบบต่างๆแสดงถึงสองคอลัมน์ (หรือแถว) หนึ่งในนั้นให้ค่าแต่ละค่าของคุณลักษณะที่แตกต่างกันเรียกว่าตัวแปรและเขียนแทนด้วย X; และอีกอันหนึ่ง - ตัวเลขสัมบูรณ์โดยแสดงจำนวนครั้ง (บ่อยแค่ไหน) ที่แต่ละตัวเลือกเกิดขึ้น ตัวบ่งชี้ในคอลัมน์ที่สองเรียกว่าความถี่และเขียนแทนด้วย f ตามอัตภาพ ให้เราทราบอีกครั้งว่าในคอลัมน์ที่สองสามารถใช้ตัวบ่งชี้สัมพัทธ์ได้โดยระบุส่วนแบ่งความถี่ของแต่ละตัวเลือกในผลรวมของความถี่ ตัวบ่งชี้สัมพัทธ์เหล่านี้เรียกว่าความถี่และแสดงตามอัตภาพด้วย ω ผลรวมของความถี่ทั้งหมดในกรณีนี้เท่ากับหนึ่ง อย่างไรก็ตาม ความถี่สามารถแสดงเป็นเปอร์เซ็นต์ได้ จากนั้นผลรวมของความถี่ทั้งหมดจะเป็น 100%
ถ้าตัวแปรของอนุกรมความแปรผันแสดงในรูปของปริมาณที่แยกจากกัน ก็จะเรียกว่าอนุกรมความแปรผันดังกล่าว ไม่ต่อเนื่อง
สำหรับคุณลักษณะต่อเนื่อง อนุกรมของรูปแบบจะถูกสร้างขึ้นเป็น ช่วงเวลานั่นคือค่าของแอตทริบิวต์จะแสดงเป็น "จาก... ถึง..." ในกรณีนี้ค่าต่ำสุดของคุณลักษณะในช่วงเวลาดังกล่าวเรียกว่าขีด จำกัด ล่างของช่วงเวลาและค่าสูงสุด - ขีด จำกัด บน
ซีรีย์ความแปรผันของช่วงยังถูกสร้างขึ้นสำหรับคุณลักษณะที่ไม่ต่อเนื่องซึ่งแตกต่างกันไปในช่วงขนาดใหญ่ ซีรีย์ช่วงเวลาสามารถอยู่กับ เท่ากันและ ไม่เท่ากันเป็นระยะ
ลองพิจารณาว่าค่าของช่วงเวลาที่เท่ากันถูกกำหนดอย่างไร ให้เราแนะนำสัญกรณ์ต่อไปนี้:
ฉัน– ขนาดช่วง;
- ค่าสูงสุดของคุณลักษณะสำหรับหน่วยประชากร
– ค่าต่ำสุดของคุณลักษณะสำหรับหน่วยประชากร
ไม่มี –จำนวนกลุ่มที่ได้รับการจัดสรร
ถ้าทราบ n
หากยากต่อการกำหนดจำนวนกลุ่มที่จะแยกแยะล่วงหน้า ดังนั้นเพื่อคำนวณค่าที่เหมาะสมที่สุดของช่วงเวลาที่มีขนาดประชากรเพียงพอ สามารถแนะนำสูตรที่เสนอโดย Sturgess ในปี 1926 ได้:
n = 1+ 3.322 log N โดยที่ N คือจำนวนหน่วยในการรวม
ขนาดของช่วงเวลาที่ไม่เท่ากันจะถูกกำหนดในแต่ละกรณี โดยคำนึงถึงลักษณะของวัตถุประสงค์ของการศึกษา
การกระจายตัวอย่างทางสถิติเรียกรายการตัวเลือกและความถี่ที่เกี่ยวข้อง (หรือความถี่สัมพัทธ์)
การกระจายทางสถิติของตัวอย่างสามารถระบุได้ในรูปแบบของตารางในคอลัมน์แรกซึ่งมีตัวเลือกอยู่และในคอลัมน์ที่สอง - ความถี่ที่สอดคล้องกับตัวเลือกเหล่านี้ พรรณีหรือความถี่สัมพัทธ์ พาย .
การกระจายตัวทางสถิติของกลุ่มตัวอย่าง
อนุกรมช่วงเป็นอนุกรมการเปลี่ยนแปลงซึ่งค่าของคุณลักษณะที่เป็นรากฐานของการก่อตัวจะแสดงภายในขอบเขตที่กำหนด (ช่วงเวลา) ความถี่ในกรณีนี้ไม่ได้อ้างอิงถึงค่าแต่ละค่าของแอตทริบิวต์ แต่รวมถึงช่วงเวลาทั้งหมด
อนุกรมการแจกแจงแบบช่วงเวลาถูกสร้างขึ้นตามคุณลักษณะเชิงปริมาณที่ต่อเนื่อง เช่นเดียวกับคุณลักษณะแบบแยกส่วนที่แตกต่างกันภายในขีดจำกัดที่มีนัยสำคัญ
อนุกรมช่วงเวลาสามารถแสดงได้ด้วยการกระจายทางสถิติของกลุ่มตัวอย่างที่ระบุช่วงเวลาและความถี่ที่สอดคล้องกัน ในกรณีนี้ ผลรวมของความถี่ของตัวแปรที่อยู่ภายในช่วงเวลานี้จะถือเป็นความถี่ของช่วงเวลา
เมื่อจัดกลุ่มตามคุณลักษณะต่อเนื่องเชิงปริมาณ การกำหนดขนาดของช่วงเวลาเป็นสิ่งสำคัญ
นอกจากค่าเฉลี่ยตัวอย่างและความแปรปรวนของตัวอย่างแล้ว ยังใช้คุณลักษณะอื่นๆ ของชุดรูปแบบต่างๆ อีกด้วย
แฟชั่นเรียกว่าตัวแปรที่มีความถี่สูงสุด
Variation series - ซีรีส์ที่มีการเปรียบเทียบ (ตามระดับการเพิ่มขึ้นหรือลดลง) ตัวเลือกและสอดคล้องกัน ความถี่
ตัวเลือกคือการแสดงออกเชิงปริมาณส่วนบุคคลของคุณลักษณะ ระบุด้วยตัวอักษรละติน วี . ความเข้าใจแบบดั้งเดิมของคำว่า "ตัวแปร" ถือว่าแต่ละค่าที่ไม่ซ้ำกันของคุณลักษณะเรียกว่าตัวแปร โดยไม่คำนึงถึงจำนวนการทำซ้ำ
ตัวอย่างเช่น ในชุดการเปลี่ยนแปลงของตัวบ่งชี้ซิสโตลิก ความดันโลหิตวัดในผู้ป่วยสิบราย:
110, 120, 120, 130, 130, 130, 140, 140, 160, 170;
มีเพียง 6 ค่าเท่านั้น:
110, 120, 130, 140, 160, 170.
ความถี่คือตัวเลขที่ระบุจำนวนครั้งที่ตัวเลือกนั้นถูกทำซ้ำ เขียนแทนด้วยอักษรละติน ป . ผลรวมของความถี่ทั้งหมด (ซึ่งแน่นอนว่าเท่ากับจำนวนความถี่ทั้งหมดที่ศึกษา) แสดงว่า n.
- ในตัวอย่างของเรา ความถี่จะใช้ค่าต่อไปนี้:
- สำหรับตัวเลือก 110 ความถี่ P = 1 (ค่า 110 เกิดขึ้นในผู้ป่วยรายหนึ่ง)
- สำหรับตัวเลือก 120 ความถี่ P = 2 (ค่า 120 เกิดขึ้นในผู้ป่วยสองราย)
- สำหรับตัวเลือก 130 ความถี่ P = 3 (ค่า 130 เกิดขึ้นในผู้ป่วย 3 ราย)
- สำหรับตัวเลือก 140 ความถี่ P = 2 (ค่า 140 เกิดขึ้นในผู้ป่วยสองราย)
- สำหรับตัวเลือก 160 ความถี่ P = 1 (ค่า 160 เกิดขึ้นในผู้ป่วยรายหนึ่ง)
- สำหรับตัวเลือก 170 ความถี่ P = 1 (ค่า 170 เกิดขึ้นในผู้ป่วยรายหนึ่ง)
ประเภทของซีรี่ส์รูปแบบ:
- เรียบง่าย- นี่คืออนุกรมที่แต่ละตัวเลือกเกิดขึ้นเพียงครั้งเดียว (ความถี่ทั้งหมดเท่ากับ 1)
- ถูกระงับ- ซีรีส์ที่มีตัวเลือกตั้งแต่หนึ่งรายการขึ้นไปปรากฏขึ้นมากกว่าหนึ่งครั้ง
ซีรีส์รูปแบบต่างๆ ใช้เพื่ออธิบายอาร์เรย์จำนวนมาก ในรูปแบบนี้ ข้อมูลที่รวบรวมได้จากการศึกษาทางการแพทย์ส่วนใหญ่จะถูกนำเสนอในขั้นต้น เพื่อกำหนดลักษณะเฉพาะของชุดรูปแบบต่างๆ จะมีการคำนวณตัวบ่งชี้พิเศษ ซึ่งรวมถึงค่าเฉลี่ย ตัวบ่งชี้ความแปรปรวน (ที่เรียกว่าการกระจายตัว) และตัวบ่งชี้ความเป็นตัวแทนของข้อมูลตัวอย่าง
ตัวบ่งชี้ชุดรูปแบบต่างๆ
1) ค่าเฉลี่ยเลขคณิตเป็นตัวบ่งชี้ทั่วไปที่แสดงลักษณะของขนาดของคุณลักษณะที่กำลังศึกษา ค่าเฉลี่ยเลขคณิตแสดงเป็น ม เป็นค่าเฉลี่ยประเภทหนึ่งที่พบบ่อยที่สุด ค่าเฉลี่ยเลขคณิตคำนวณเป็นอัตราส่วนของผลรวมของค่าตัวบ่งชี้ของหน่วยการสังเกตทั้งหมดต่อจำนวนวิชาทั้งหมดที่ศึกษา วิธีการคำนวณค่าเฉลี่ยเลขคณิตจะแตกต่างกันไปสำหรับอนุกรมการแปรผันแบบง่ายและแบบถ่วงน้ำหนัก
สูตรการคำนวณ ค่าเฉลี่ยเลขคณิตอย่างง่าย:
สูตรการคำนวณ ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก:
M = Σ(V * P)/n
2) โหมดเป็นค่าเฉลี่ยอีกค่าหนึ่งของอนุกรมรูปแบบ ซึ่งสอดคล้องกับตัวเลือกที่เกิดซ้ำบ่อยที่สุด หรือพูดอีกอย่างคือนี่คือตัวเลือกที่สอดคล้องกับความถี่สูงสุด แสดงว่า โม . โหมดนี้คำนวณสำหรับอนุกรมแบบถ่วงน้ำหนักเท่านั้น เนื่องจากในชุดแบบธรรมดาไม่มีตัวเลือกใดซ้ำกันและความถี่ทั้งหมดจะเท่ากับหนึ่ง
ตัวอย่างเช่น ในชุดรูปแบบต่างๆ ของค่าอัตราการเต้นของหัวใจ:
80, 84, 84, 86, 86, 86, 90, 94;
ค่าโหมดคือ 86 เนื่องจากตัวเลือกนี้เกิดขึ้น 3 ครั้ง ดังนั้นความถี่จึงสูงที่สุด
3) ค่ามัธยฐาน - ค่าของตัวเลือกที่แบ่งซีรี่ส์รูปแบบออกเป็นครึ่งหนึ่ง: ทั้งสองด้านมีตัวเลือกจำนวนเท่ากัน ค่ามัธยฐาน เช่นเดียวกับค่าเฉลี่ยเลขคณิตและโหมด หมายถึงค่าเฉลี่ย แสดงว่า ฉัน
4) ส่วนเบี่ยงเบนมาตรฐาน (คำพ้องความหมาย: ส่วนเบี่ยงเบนมาตรฐาน ส่วนเบี่ยงเบนซิกมา ซิกมา) - การวัดความแปรปรวนของอนุกรมความแปรผัน เป็นตัวบ่งชี้สำคัญที่รวมทุกกรณีของการเบี่ยงเบนจากค่าเฉลี่ย ในความเป็นจริง มันตอบคำถามว่าตัวแปรต่างๆ กระจายจากค่าเฉลี่ยเลขคณิตไปไกลแค่ไหนและบ่อยแค่ไหน เขียนแทนด้วยอักษรกรีก σ ("ซิกมา").
หากขนาดประชากรมากกว่า 30 หน่วย ค่าเบี่ยงเบนมาตรฐานจะคำนวณตาม สูตรต่อไปนี้:
สำหรับประชากรขนาดเล็ก - 30 หน่วยการสังเกตหรือน้อยกว่า - ค่าเบี่ยงเบนมาตรฐานจะคำนวณโดยใช้สูตรอื่น:
![](https://i0.wp.com/medstatistic.ru/formulas/sigmasmall.png)