คณิตศาสตร์และภาษาศาสตร์คอมพิวเตอร์ ภาษาศาสตร์เชิงคำนวณ: วิธีการ ทรัพยากร การประยุกต์

คำว่า "ภาษาศาสตร์เชิงคำนวณ" มักหมายถึงการใช้เครื่องมือคอมพิวเตอร์ในวงกว้าง - โปรแกรม เทคโนโลยีคอมพิวเตอร์การจัดระเบียบและการประมวลผลข้อมูล - เพื่อจำลองการทำงานของภาษาในบางเงื่อนไข สถานการณ์ ปัญหา รวมถึงขอบเขตของการใช้แบบจำลองคอมพิวเตอร์ของภาษา ไม่เพียงแต่ในภาษาศาสตร์เท่านั้น แต่ยังรวมถึงสาขาวิชาที่เกี่ยวข้องด้วย ที่จริงแล้ว เฉพาะในกรณีหลังนี้เท่านั้นที่เรากำลังพูดถึงภาษาศาสตร์ประยุกต์ในความหมายที่เข้มงวด เนื่องจากการสร้างแบบจำลองภาษาด้วยคอมพิวเตอร์ถือได้ว่าเป็นสาขาการประยุกต์ใช้ทฤษฎีวิทยาการคอมพิวเตอร์ในสาขาภาษาศาสตร์ด้วย อย่างไรก็ตาม แนวปฏิบัติทั่วไปคือสาขาภาษาศาสตร์คอมพิวเตอร์ครอบคลุมเกือบทุกอย่างที่เกี่ยวข้องกับการใช้คอมพิวเตอร์ในภาษาศาสตร์: “คำว่า “ภาษาศาสตร์คอมพิวเตอร์” ให้คำจำกัดความว่า ปฐมนิเทศทั่วไปการใช้คอมพิวเตอร์ในการแก้ปัญหาทางวิทยาศาสตร์และการปฏิบัติที่เกี่ยวข้องกับภาษาต่างๆ โดยไม่เป็นการจำกัดวิธีการแก้ไขปัญหาเหล่านี้แต่อย่างใด"

ลักษณะเชิงสถาบันของภาษาศาสตร์เชิงคำนวณ. ภาษาศาสตร์เชิงคำนวณกลายเป็นสาขาวิทยาศาสตร์พิเศษในยุค 60 กระแสของสิ่งพิมพ์ในพื้นที่นี้มีขนาดใหญ่มาก นอกจากคอลเลกชันเฉพาะเรื่องแล้ว นิตยสาร " ภาษาศาสตร์เชิงคำนวณ“. องค์กรมากขึ้นและ งานทางวิทยาศาสตร์ดำเนินการโดยสมาคมภาษาศาสตร์คอมพิวเตอร์ซึ่งมีโครงสร้างระดับภูมิภาคทั่วโลก (โดยเฉพาะสาขายุโรป) ทุก ๆ สองปีจะมีการประชุมนานาชาติเกี่ยวกับภาษาศาสตร์เชิงคำนวณ - COLING ประเด็นที่เกี่ยวข้องยังแสดงอย่างกว้างขวางในการประชุมนานาชาติเกี่ยวกับปัญญาประดิษฐ์ในระดับต่างๆ

เครื่องมือทางปัญญาสำหรับภาษาศาสตร์เชิงคำนวณ

ภาษาศาสตร์เชิงคำนวณเป็นสาขาวิชาประยุกต์พิเศษที่มีความโดดเด่นด้วยเครื่องมือเป็นหลัก กล่าวคือ การใช้เครื่องมือคอมพิวเตอร์ในการประมวลผลข้อมูลภาษา เพราะว่า โปรแกรมคอมพิวเตอร์ซึ่งจำลองลักษณะการทำงานของภาษาบางอย่างสามารถใช้เครื่องมือการเขียนโปรแกรมที่หลากหลาย ดูเหมือนว่าไม่จำเป็นต้องพูดถึงภาษาโลหะทั่วไป อย่างไรก็ตามมันไม่ใช่ มีหลักการทั่วไปของการสร้างแบบจำลองการคิดทางคอมพิวเตอร์ที่นำไปใช้ในทางใดทางหนึ่ง รุ่นคอมพิวเตอร์. ภาษานี้มีพื้นฐานอยู่บนทฤษฎีความรู้ที่พัฒนาในด้านปัญญาประดิษฐ์และเป็นสาขาสำคัญของวิทยาศาสตร์เกี่ยวกับความรู้ความเข้าใจ

วิทยานิพนธ์หลักของทฤษฎีความรู้ระบุว่าการคิดเป็นกระบวนการในการประมวลผลและสร้างความรู้ “ความรู้” หรือ “ความรู้” ถือเป็นประเภทที่ไม่สามารถกำหนดได้ ระบบการรับรู้ของมนุษย์ทำหน้าที่เป็น "ตัวประมวลผล" ที่ประมวลผลความรู้ ในญาณวิทยาและวิทยาศาสตร์ความรู้ความเข้าใจ ความรู้สองประเภทหลักมีความโดดเด่น - การประกาศ (“การรู้ว่าอะไร”) และขั้นตอน (“การรู้ว่า”2)) ความรู้ที่เปิดเผยมักจะนำเสนอในรูปแบบของชุดข้อเสนอ ข้อความเกี่ยวกับบางสิ่งบางอย่าง ตัวอย่างทั่วไปของความรู้ที่เปิดเผยสามารถพิจารณาการตีความคำในพจนานุกรมอธิบายทั่วไป เช่น ถ้วย] - "ภาชนะเล็กๆ สำหรับดื่ม ทรงกลมมักมีด้ามจับ ทำด้วยพอร์ซเลน เครื่องปั้นดินเผา ฯลฯ " ความรู้ที่เปิดเผยนั้นคล้อยตามขั้นตอนการตรวจสอบในแง่ของ "จริง - เท็จ" ความรู้เชิงขั้นตอนถูกนำเสนอเป็นลำดับ (รายการ) ของการดำเนินการการกระทำที่ควรดำเนินการ นี่คือบางส่วน คำแนะนำทั่วไปเกี่ยวกับการกระทำในบางสถานการณ์ ตัวอย่างความรู้ทั่วไปเกี่ยวกับขั้นตอนคือคำแนะนำในการใช้เครื่องใช้ในครัวเรือน

ต่างจากความรู้ที่เปิดเผย ความรู้เชิงขั้นตอนไม่สามารถตรวจสอบได้ว่าจริงหรือเท็จ สามารถประเมินได้จากความสำเร็จหรือความล้มเหลวของอัลกอริทึมเท่านั้น

แนวคิดส่วนใหญ่เกี่ยวกับเครื่องมือการรับรู้ของภาษาศาสตร์เชิงคำนวณมีลักษณะเหมือนกัน กล่าวคือ แนวคิดเหล่านี้ระบุถึงตัวตนที่แท้จริงของระบบการรับรู้ของมนุษย์ และวิธีการแสดงตัวตนเหล่านี้ในภาษาโลหะบางภาษาไปพร้อมๆ กัน กล่าวอีกนัยหนึ่ง องค์ประกอบของภาษาโลหะมีลักษณะทางภววิทยาและเครื่องมือ ในทางภววิทยา การแบ่งความรู้เชิงประกาศและขั้นตอนสอดคล้องกัน หลากหลายชนิดความรู้เกี่ยวกับระบบการรับรู้ของมนุษย์ ดังนั้นความรู้เกี่ยวกับ วิชาเฉพาะวัตถุแห่งความเป็นจริงนั้นได้รับการประกาศอย่างเด่นชัด และความสามารถในการเดิน วิ่ง และขับรถของบุคคลนั้นถูกรับรู้ในระบบการรับรู้ว่าเป็นความรู้เชิงขั้นตอน ในเชิงเครื่องมือ ความรู้ (ทั้งขั้นตอนทางภววิทยาและการประกาศ) สามารถแสดงเป็นชุดของคำอธิบาย คำอธิบาย และเป็นอัลกอริทึมหรือคำสั่งได้ กล่าวอีกนัยหนึ่ง ความรู้ที่ประกาศทางภววิทยาเกี่ยวกับวัตถุของความเป็นจริง "ตาราง" สามารถแสดงเป็นขั้นตอนเป็นชุดคำสั่ง อัลกอริธึมสำหรับการสร้าง การประกอบ (= ด้านความคิดสร้างสรรค์ของความรู้ขั้นตอน) หรือเป็นอัลกอริธึมสำหรับการใช้งานทั่วไป (= ฟังก์ชั่น ด้านความรู้เชิงปฏิบัติ) ในกรณีแรก นี่อาจเป็นแนวทางสำหรับช่างไม้มือใหม่ และในกรณีที่สอง เป็นการอธิบายความเป็นไปได้ โต๊ะทำงาน. สิ่งที่ตรงกันข้ามก็เป็นจริงเช่นกัน: ความรู้เกี่ยวกับขั้นตอนทางภววิทยาสามารถแสดงได้อย่างเปิดเผย

มันต้องมีการอภิปรายแยกต่างหากว่าความรู้ใด ๆ ที่ประกาศเกี่ยวกับ Ontologically สามารถแสดงเป็นขั้นตอนได้หรือไม่ และความรู้เกี่ยวกับขั้นตอน Ontologically ใด ๆ สามารถแสดงเป็นประกาศได้ นักวิจัยเห็นพ้องกันว่าความรู้ที่เปิดเผยใดๆ ตามหลักการแล้ว สามารถแสดงเป็นขั้นตอนได้ แม้ว่าสิ่งนี้อาจกลายเป็นการสิ้นเปลืองอย่างมากต่อระบบการรับรู้ก็ตาม กลับไม่น่าจะเป็นจริง ความจริงก็คือความรู้ที่เปิดเผยนั้นมีความชัดเจนมากกว่ามาก บุคคลจะเข้าใจได้ง่ายกว่าความรู้เชิงขั้นตอน ตรงกันข้ามกับความรู้ที่เปิดเผย ความรู้เชิงขั้นตอนส่วนใหญ่เป็นนัย ดังนั้นความสามารถทางภาษาซึ่งเป็นความรู้เชิงขั้นตอนจึงถูกซ่อนไว้จากบุคคลและเขาไม่ได้ตระหนักรู้ ความพยายามที่จะอธิบายกลไกการทำงานของภาษาทำให้เกิดความผิดปกติ ผู้เชี่ยวชาญในสาขาความหมายของคำศัพท์รู้ดีว่าการวิปัสสนาความหมายระยะยาวซึ่งจำเป็นต่อการศึกษาเนื้อหาของคำทำให้ผู้วิจัยสูญเสียความสามารถในการแยกแยะความแตกต่างระหว่างการใช้คำที่ถูกวิเคราะห์อย่างถูกต้องและไม่ถูกต้องบางส่วน สามารถยกตัวอย่างอื่นได้ เป็นที่ทราบกันว่าจากมุมมองของกลศาสตร์ ร่างกายมนุษย์เป็นระบบที่ซับซ้อนของลูกตุ้มสองตัวที่มีปฏิสัมพันธ์กัน

ในทฤษฎีความรู้ โครงสร้างความรู้ต่างๆ ถูกนำมาใช้ในการศึกษาและเป็นตัวแทนของกรอบความรู้ สถานการณ์ แผนงาน ตามคำกล่าวของ M. Minsky “เฟรมคือโครงสร้างข้อมูลที่ออกแบบมาเพื่อนำเสนอสถานการณ์แบบเหมารวม” [Minsky 1978, p.254] ในรายละเอียดเพิ่มเติม เราสามารถพูดได้ว่าเฟรมเป็นโครงสร้างแนวความคิดสำหรับการนำเสนอความรู้ที่เปิดเผยเกี่ยวกับสถานการณ์ที่เป็นหนึ่งเดียวตามธีมที่พิมพ์ไว้ ซึ่งมีช่องที่เชื่อมต่อถึงกันด้วยความสัมพันธ์เชิงความหมายบางอย่าง เพื่อความชัดเจน เฟรมมักแสดงเป็นตาราง ซึ่งแถวของฟอร์มจะเป็นช่อง แต่ละช่องมีชื่อและเนื้อหาของตัวเอง (ดูตารางที่ 1)

ตารางที่ 1

ส่วนของกรอบ "ตาราง" ในมุมมองตาราง

โครงสร้างเฟรมอาจมีความซับซ้อนมากขึ้นทั้งนี้ขึ้นอยู่กับงานเฉพาะ เฟรมอาจมีเฟรมย่อยที่ซ้อนกันและการอ้างอิงไปยังเฟรมอื่น

แทนที่จะใช้ตาราง มักใช้รูปแบบการแสดงภาคแสดง ในกรณีนี้ เฟรมจะอยู่ในรูปแบบของภาคแสดงหรือฟังก์ชันที่มีอาร์กิวเมนต์ มีวิธีอื่นในการแสดงเฟรม ตัวอย่างเช่น สามารถแสดงเป็นสิ่งทูเปิลของแบบฟอร์มต่อไปนี้: ( (ชื่อเฟรม) (ชื่อสล็อต)) (ค่าสล็อต,),..., (ชื่อสล็อต n) (ค่าสล็อต l))

โดยปกติแล้วเฟรมในภาษาตัวแทนความรู้จะมีประเภทนี้

เช่นเดียวกับประเภทการรับรู้อื่น ๆ ของภาษาศาสตร์คอมพิวเตอร์ แนวคิดของกรอบก็เหมือนกัน ในทางภววิทยา มันเป็นส่วนหนึ่งของระบบการรับรู้ของมนุษย์ และในแง่นี้ กรอบสามารถเปรียบเทียบได้กับแนวคิดเช่น ท่าทาง ต้นแบบ แบบเหมารวม แบบแผน ในจิตวิทยาความรู้ความเข้าใจ หมวดหมู่เหล่านี้ได้รับการพิจารณาจากมุมมองของภววิทยา ดังนั้น D. Norman จึงแยกแยะความแตกต่างระหว่างวิธีการดำรงอยู่สองวิธีหลักและการจัดระเบียบความรู้ในระบบความรู้ความเข้าใจของมนุษย์ - เครือข่ายความหมายและแบบแผน “สคีมา” เขาเขียน “เป็นชุดความรู้ที่จัดระเบียบซึ่งรวบรวมไว้เพื่อเป็นตัวแทนของหน่วยความรู้ส่วนบุคคลและเป็นอิสระ สคีมาของฉันสำหรับแซมอาจมีข้อมูลที่อธิบายลักษณะทางกายภาพ กิจกรรมของเขา และลักษณะบุคลิกภาพ สคีมานี้เกี่ยวข้องกับสคีมาอื่นๆ ที่อธิบาย ด้านอื่นๆ ของมัน" [Norman 1998, p. 359] หากเราพิจารณาด้านเครื่องมือของประเภทเฟรม นี่คือโครงสร้างสำหรับการเป็นตัวแทนความรู้ที่เปิดเผย ในระบบ AI ที่มีอยู่ เฟรมสามารถสร้างโครงสร้างความรู้ที่ซับซ้อนได้ ระบบเฟรมอนุญาตให้มีลำดับชั้น - เฟรมหนึ่งสามารถเป็นส่วนหนึ่งของอีกเฟรมหนึ่งได้

ในเนื้อหา แนวคิดของเฟรมมีความใกล้เคียงกับหมวดหมู่ของการตีความมาก อันที่จริง ช่องคืออะนาล็อกของเวเลนซ์ การเติมช่องคืออะนาล็อกของแอกแทนต์ ความแตกต่างที่สำคัญระหว่างพวกเขาคือการตีความประกอบด้วยข้อมูลที่เกี่ยวข้องทางภาษาเกี่ยวกับเนื้อหาของคำเท่านั้น และเฟรม ประการแรก ไม่จำเป็นต้องเชื่อมโยงกับคำ และประการที่สอง รวมข้อมูลทั้งหมดที่เกี่ยวข้องกับสถานการณ์ปัญหาที่กำหนด รวมถึง รวมทั้งนอกภาษา (ความรู้เกี่ยวกับโลก) 3).

สคริปต์คือโครงสร้างแนวคิดสำหรับการนำเสนอขั้นตอนความรู้เกี่ยวกับสถานการณ์แบบโปรเฟสเซอร์หรือพฤติกรรมแบบโปรเฟสเซอร์ องค์ประกอบของสคริปต์คือขั้นตอนของอัลกอริทึมหรือคำสั่ง พวกเขามักจะพูดถึง "สถานการณ์การเยี่ยมชมร้านอาหาร" "สถานการณ์การซื้อ" ฯลฯ

ในขั้นต้น เฟรมยังใช้สำหรับการนำเสนอขั้นตอน (เปรียบเทียบคำว่า "กรอบขั้นตอน") แต่ตอนนี้คำว่า "สคริปต์" ถูกใช้บ่อยมากขึ้นในแง่นี้ สถานการณ์จำลองสามารถแสดงได้ไม่เพียงแค่เป็นอัลกอริธึมเท่านั้น แต่ยังรวมถึงเครือข่ายด้วย จุดยอดซึ่งสอดคล้องกับสถานการณ์บางอย่าง และส่วนโค้งสอดคล้องกับการเชื่อมต่อระหว่างสถานการณ์ นอกจากแนวคิดของสคริปต์แล้ว นักวิจัยบางคนยังใช้หมวดหมู่ของสคริปต์สำหรับการสร้างแบบจำลองสติปัญญาด้วยคอมพิวเตอร์ ตามข้อมูลของ R. Schenk สคริปต์คือลำดับความสัมพันธ์เชิงสาเหตุที่เป็นที่ยอมรับโดยทั่วไปและเป็นที่รู้จัก เช่น การทำความเข้าใจบทสนทนา

มันเทเหมือนถังข้างนอก

คุณจะยังต้องไปที่ร้าน: ไม่มีอะไรกินในบ้าน - เมื่อวานแขกกวาดทุกอย่างออกไป

ขึ้นอยู่กับการเชื่อมต่อทางความหมายที่ไม่ชัดเจน เช่น “ถ้า” ฝนตกมันไม่พึงปรารถนาที่จะออกไปข้างนอกเพราะคุณอาจป่วยได้" การเชื่อมต่อเหล่านี้สร้างสคริปต์ซึ่งเจ้าของภาษาใช้เพื่อทำความเข้าใจคำพูดและพฤติกรรมที่ไม่ใช่คำพูดของกันและกัน

อันเป็นผลมาจากการใช้สถานการณ์จำลองกับสถานการณ์ปัญหาเฉพาะ ก วางแผน). แผนถูกใช้เพื่อแสดงความรู้ตามขั้นตอนเกี่ยวกับการกระทำที่เป็นไปได้ที่นำไปสู่การบรรลุเป้าหมายเฉพาะ แผนเกี่ยวข้องกับเป้าหมายกับลำดับของการกระทำ

โดยทั่วไป แผนประกอบด้วยลำดับขั้นตอนที่เปลี่ยนสถานะเริ่มต้นของระบบไปเป็นสถานะสุดท้าย และนำไปสู่การบรรลุเป้าหมายย่อยและเป้าหมายที่แน่นอน ในระบบ AI แผนเกิดขึ้นจากการวางแผนหรือกิจกรรมการวางแผนของโมดูลที่เกี่ยวข้อง - โมดูลการวางแผน กระบวนการวางแผนอาจขึ้นอยู่กับการปรับข้อมูลจากสถานการณ์หนึ่งสถานการณ์ขึ้นไป ซึ่งเปิดใช้งานโดยขั้นตอนการทดสอบ เพื่อแก้ไขสถานการณ์ปัญหา แผนนี้ดำเนินการโดยโมดูลผู้บริหาร ซึ่งควบคุมกระบวนการรับรู้และการกระทำทางกายภาพของระบบ ในกรณีเบื้องต้นแผนเข้า ระบบอัจฉริยะแสดงถึงลำดับการดำเนินการอย่างง่าย ในเวอร์ชันที่ซับซ้อนมากขึ้น แผนจะเชื่อมโยงกับหัวข้อเฉพาะ ทรัพยากร ความสามารถ เป้าหมาย ข้อมูลโดยละเอียดเกี่ยวกับสถานการณ์ปัญหา ฯลฯ การเกิดขึ้นของแผนเกิดขึ้นในกระบวนการสื่อสารระหว่างแบบจำลองโลก ซึ่งส่วนหนึ่งเกิดจากสถานการณ์จำลอง โมดูลการวางแผน และโมดูลผู้บริหาร

แผนมีความเกี่ยวข้องต่างจากสคริปต์ สถานการณ์เฉพาะเป็นนักแสดงที่เฉพาะเจาะจงและแสวงหาความสำเร็จตามเป้าหมายเฉพาะ การเลือกแผนจะขึ้นอยู่กับทรัพยากรของผู้รับเหมา ความเป็นไปได้ของแผน - เงื่อนไขที่จำเป็นการสร้างในระบบการรับรู้ และลักษณะความเป็นไปได้ไม่สามารถใช้ได้กับสถานการณ์

แนวคิดที่สำคัญอีกประการหนึ่งคือแบบจำลองของโลก โดยทั่วไปแล้วแบบจำลองโลกมักเข้าใจว่าเป็นชุดความรู้เกี่ยวกับโลกที่จัดระเบียบในลักษณะใดลักษณะหนึ่ง ซึ่งเป็นลักษณะของระบบการรับรู้หรือแบบจำลองคอมพิวเตอร์ ในรูปแบบที่ค่อนข้างกว้างกว่า แบบจำลองโลกถูกพูดถึงว่าเป็นส่วนหนึ่งของระบบการรับรู้ที่เก็บความรู้เกี่ยวกับโครงสร้างของโลก รูปแบบของมัน ฯลฯ ในอีกความเข้าใจหนึ่ง แบบจำลองโลกเกี่ยวข้องกับผลลัพธ์ของการทำความเข้าใจข้อความ หรือพูดให้กว้างกว่านั้นคือวาทกรรม ในกระบวนการทำความเข้าใจวาทกรรม แบบจำลองทางจิตของวาทกรรมนั้นถูกสร้างขึ้น ซึ่งเป็นผลมาจากปฏิสัมพันธ์ของแผนเนื้อหาของเนื้อหาและความรู้เกี่ยวกับคุณลักษณะของโลกของหัวข้อที่กำหนด [Johnson-Laird 1988, p. 237 ff] ความเข้าใจที่หนึ่งและสองมักจะนำมารวมกัน นี่เป็นเรื่องปกติสำหรับนักวิจัยทางภาษาศาสตร์ที่ทำงานด้านภาษาศาสตร์เกี่ยวกับความรู้ความเข้าใจและวิทยาศาสตร์เกี่ยวกับความรู้ความเข้าใจ

ที่เกี่ยวข้องอย่างใกล้ชิดกับหมวดหมู่ของเฟรมคือแนวคิดของฉาก หมวดหมู่ฉากส่วนใหญ่จะใช้ในวรรณคดีเพื่อเป็นการกำหนดโครงสร้างแนวคิดสำหรับการนำเสนอสถานการณ์ที่แสดงออกอย่างชัดเจนและส่วนต่างๆ ที่เกิดขึ้นจริงในการพูดและเน้นด้วยวิธีการทางภาษาศาสตร์ (คำศัพท์ โครงสร้างทางวากยสัมพันธ์ หมวดหมู่ไวยากรณ์ ฯลฯ) เนื่องจากเกี่ยวข้องกับรูปแบบทางภาษา ฉากจึงมักเกิดขึ้นจริงด้วยคำหรือสำนวนบางอย่าง ในไวยากรณ์ของโครงเรื่อง (ดูด้านล่าง) ฉากจะปรากฏเป็นส่วนหนึ่งของตอนหรือการเล่าเรื่อง ตัวอย่างฉากทั่วไป ได้แก่ ชุดคิวบ์ที่ระบบ AI ทำงานด้วย ตำแหน่งของแอ็กชันในเรื่องและผู้เข้าร่วมในแอ็กชัน เป็นต้น ในปัญญาประดิษฐ์ ฉากต่างๆ จะถูกใช้ในระบบการจดจำภาพ เช่นเดียวกับในโปรแกรมที่เน้นไปที่การศึกษา (การวิเคราะห์ คำอธิบาย) ของสถานการณ์ปัญหา แนวคิดเกี่ยวกับฉากหนึ่งๆ ได้แพร่หลายในภาษาศาสตร์เชิงทฤษฎี เช่นเดียวกับตรรกะ โดยเฉพาะอย่างยิ่งในความหมายเชิงสถานการณ์ ซึ่งความหมายของหน่วยศัพท์มีความเกี่ยวข้องโดยตรงกับฉากนั้น

ภาษาศาสตร์เชิงคำนวณสมัยใหม่มุ่งเน้นไปที่การใช้แบบจำลองทางคณิตศาสตร์เป็นอย่างมาก มีความเชื่อกันโดยทั่วไปว่านักภาษาศาสตร์ไม่จำเป็นอย่างยิ่งสำหรับการสร้างแบบจำลองภาษาธรรมชาติโดยอัตโนมัติ มีบทกลอนที่รู้จักกันดีจาก Frederick Jelinek หัวหน้าศูนย์การรู้จำคำพูดของมหาวิทยาลัย Johns Hopkins: “ เมื่อใดก็ตามที่นักภาษาศาสตร์ออกจากกลุ่ม อัตราการจดจำก็จะเพิ่มขึ้น"- ทุกครั้งที่นักภาษาศาสตร์ออกจากคณะทำงาน คุณภาพการจดจำจะเพิ่มขึ้น

อย่างไรก็ตาม งานการสร้างแบบจำลองทางภาษาที่ซับซ้อนและหลายระดับถูกกำหนดไว้สำหรับนักพัฒนา ระบบอัตโนมัติยิ่งเห็นได้ชัดว่าวิธีแก้ปัญหานี้เป็นไปไม่ได้หากไม่คำนึงถึงทฤษฎีทางภาษา ความเข้าใจในการทำงานของภาษา และความสามารถของผู้เชี่ยวชาญทางภาษา ในเวลาเดียวกัน เห็นได้ชัดว่าวิธีอัตโนมัติสำหรับการวิเคราะห์และสร้างแบบจำลองข้อมูลภาษาสามารถเพิ่มคุณค่าให้กับการวิจัยทางภาษาเชิงทฤษฎีได้อย่างมาก โดยเป็นทั้งวิธีการในการรวบรวมข้อมูลภาษาและเครื่องมือในการทดสอบความถูกต้องของสมมติฐานทางภาษาศาสตร์โดยเฉพาะ

ฟอรัมเกี่ยวกับการประเมินระบบประมวลผลข้อความอัตโนมัติ

S.Yu.Toldova, O.N. Lyashevskaya, A.A. บอนช์-ออสโมลอฟสกายา

จะทำให้ความหมายของคำศัพท์เป็นระเบียบและทำให้ "เครื่องอ่านได้" ได้อย่างไร? คำตอบสำหรับสิ่งนี้ได้มาจากแบบจำลองการกระจายตัวของภาษา ซึ่งความหมายของคำคือผลรวมของบริบทในคลังข้อมูลที่มีขนาดใหญ่เพียงพอ โครงข่ายประสาทเทียมทำให้สามารถฝึกฝนโมเดลดังกล่าวได้อย่างรวดเร็วและมีประสิทธิภาพ

Denis Kiryanov, Tanya Panova (หัวหน้างานวิทยาศาสตร์ B.V. Orekhov)

โปรแกรมนี้มีสองฟังก์ชั่น: a) การทำให้ข้อความภาษายิดดิชเป็นมาตรฐาน b) การทับศัพท์จากสคริปต์สี่เหลี่ยมเป็นภาษาละติน ปัญหาเหล่านี้มีความเกี่ยวข้องมาก: จนถึงขณะนี้ยังไม่มี Normalizer ตัวเดียว เว้นแต่คุณจะนับเครื่องตรวจตัวสะกดเช่นนี้ ในขณะเดียวกัน สำนักพิมพ์เกือบทุกแห่งที่จัดพิมพ์หนังสือในภาษายิดดิชก็ปฏิบัติตามการฝึกสะกดคำของตนเอง จำเป็นต้องใช้ตัวปรับมาตรฐานเพื่อทำงานกับคลังภาษายิดดิช: เพื่อลดข้อความทั้งหมดให้เหลือเพียงการสะกดคำเดียวที่โปรแกรมแยกวิเคราะห์รู้จัก การทับศัพท์จะช่วยให้นักพิมพ์สามารถทำงานกับเนื้อหาภาษายิดดิชได้

วิดีโอของเจ้าหน้าที่ของ School of Linguistics:

ทางเลือก; ปีที่ 3, 2, 3 โมดูล

ที่จำเป็น; ปีที่ 1 โมดูลที่ 2

ทางเลือก; ปีที่ 3 โมดูลที่ 3

ที่จำเป็น; ปีที่ 4 โมดูล 1-3

ที่จำเป็น; ปีที่ 4, 2 โมดูล

ที่จำเป็น; ปีที่ 2, 1, 2, 4 โมดูล

สารสนเทศทางภาษาเป็นส่วนหนึ่งของทฤษฎีการบริการข้อมูล ทฤษฎีการบริการข้อมูลเกิดขึ้นจากการใช้คอมพิวเตอร์ในการพูด กล่าวคือ เกี่ยวข้องกับการใช้คอมพิวเตอร์ในการบันทึก การบัญชี และการจัดเก็บข้อมูลทางภาษา ด้วยเทคโนโลยีที่ทำให้สามารถรวมฟังก์ชันของห้องสมุด หอจดหมายเหตุ และสำนักงานเข้าด้วยกันได้

คลาสข้อความขนาดใหญ่ได้รับการประมวลผลผ่านการสรุปอัตโนมัติ ปริมาณข้อมูลทางวิทยาศาสตร์และทางเทคนิคที่เติบโตอย่างต่อเนื่องการค้นหาซึ่งใช้แรงงานเข้มข้นมากขึ้นเรื่อย ๆ ทำให้เกิดแนวคิดในการค้นหาผ่านสิ่งที่เรียกว่าข้อความรองซึ่งเป็นข้อมูลที่ย่อจากเอกสารหลัก: คำอธิบายบรรณานุกรม ,นามธรรม,นามธรรม,การแปลทางวิทยาศาสตร์

การยุบข้อความหลักทำได้โดยการบีบอัด มีการพัฒนาวิธีพิเศษสำหรับการยุบข้อความหลัก:

ก) วิธีการกระจายทางสถิติประกอบด้วยการระบุประโยคที่ให้ข้อมูลมากที่สุดซึ่งมีความเข้มข้นของสัญญาณทางภาษาที่สำคัญที่สุดสำหรับข้อความที่กำหนด

b) วิธีการใช้ตัวบ่งชี้ความหมายเมื่อมีการบันทึก "ประเด็น" ที่มีความหมายที่สุดของข้อความ - หัวข้อการวิจัยวัตถุประสงค์วิธีการความเกี่ยวข้องขอบเขตข้อสรุปผลลัพธ์) c) วิธีการเชื่อมต่อข้อความซึ่งประกอบด้วยข้อเท็จจริงที่ว่าเมื่อคำนึงถึงการเชื่อมต่อระหว่างวลีทำให้นามธรรมแบบองค์รวม

3. คำศัพท์เชิงปฏิบัติ
คำศัพท์เชิงปฏิบัติประกอบด้วยส่วนต่างๆ:

ก) คำศัพท์เฉพาะทางที่เกี่ยวข้องกับทฤษฎีและการปฏิบัติในการสร้างพจนานุกรมพิเศษ การรวมระบบคำศัพท์ การแปลคำศัพท์ การสร้างธนาคารข้อมูลคำศัพท์ ทำให้การจัดเก็บและการประมวลผลเป็นไปโดยอัตโนมัติ

b) พจนานุกรมศัพท์เองก็กลายเป็นหัวข้อของภาษาศาสตร์ประยุกต์ซึ่งเป็นหนึ่งในภาษาศาสตร์เชิงปฏิบัติที่ใช้แรงงานเข้มข้นที่สุด พจนานุกรมถูกสร้างขึ้นมานานหลายทศวรรษ ดังนั้นความปรารถนาของนักวิทยาศาสตร์ในการทำกิจกรรมพจนานุกรมอัตโนมัติจึงเป็นที่เข้าใจได้ พจนานุกรมอัตโนมัติปรากฏขึ้น จุดประสงค์คือเพื่อเพิ่มผลิตภาพแรงงานเมื่อทำงานกับข้อความ รวบรวม จัดเก็บ และประมวลผลหน่วยภาษาต่างๆ พจนานุกรมประเภทนี้ใช้ในระบบประมวลผลข้อความอัตโนมัติ

การแปลอัตโนมัติ

การแปลอัตโนมัติหรือด้วยเครื่องขึ้นอยู่กับสมมติฐานที่เป็นไปได้ที่จะประสานรูปแบบที่แตกต่างกัน โครงสร้างภาษา(คำศัพท์ การเรียงลำดับคำ การผันคำ โครงสร้างวากยสัมพันธ์) หลักการแปลทางภาษาคือการเปรียบเทียบหน่วยทางภาษาของสองภาษาขึ้นไปที่มีความหมายเทียบเท่ากัน

การพัฒนาระบบการแปลอัตโนมัติมีสองขั้นตอนในระยะแรก ปัญหาพื้นฐานของการแปลด้วยเครื่องได้รับการแก้ไข เช่น การสร้างพจนานุกรมอัตโนมัติ การพัฒนาภาษาตัวกลาง การทำให้ไวยากรณ์เป็นระเบียบ การเอาชนะคำพ้องเสียง และการประมวลผลรูปแบบสำนวน ในขั้นตอนที่สอง แบบจำลองเซตทฤษฎีของไวยากรณ์ แบบจำลองของไวยากรณ์การพึ่งพา ส่วนประกอบทางตรง และแบบจำลองของไวยากรณ์กำเนิด ยังคงได้รับการพัฒนาและนำไปใช้ในทางปฏิบัติค่อนข้างมีประสิทธิผล ในช่วงเวลานี้ ความหมายตามแบบจำลอง "ความหมาย - ข้อความ" มีส่วนเกี่ยวข้องมากขึ้นในภาษาศาสตร์ประยุกต์ ศูนย์ภาษาศาสตร์ประยุกต์ที่เกิดขึ้นในมหาวิทยาลัยในประเทศและต่างประเทศกำลังพัฒนากลยุทธ์การแปลด้วยเครื่อง ซึ่งรวมถึงห้องปฏิบัติการภาษาศาสตร์คณิตศาสตร์ที่มหาวิทยาลัยเซนต์ปีเตอร์สเบิร์กที่สถาบันคณิตศาสตร์ประยุกต์แห่ง Russian Academy of Sciences; ศูนย์แปลออล-ยูเนี่ยน; กลุ่ม "สถิติคำพูด" ที่สถาบันสอนการสอนเลนินกราดภายใต้การนำของ Raymond Genrikhovich Piotrovsky; กลุ่มศึกษาการสร้างแบบจำลองวากยสัมพันธ์ "ความหมาย - ข้อความ" ภายใต้การนำของ Igor Aleksandrovich Melchuk

ขั้นตอนใหม่ในการปรับปรุงการแปลด้วยเครื่องเกี่ยวข้องกับการใช้ภาษาตัวกลาง - ภาษาที่ใช้แทนความรู้ มันขึ้นอยู่กับการวิเคราะห์ความหมายของประโยคที่ได้รับจากการทำความเข้าใจประโยคที่ป้อนเสริมและทำเครื่องหมายด้วยความช่วยเหลือของข้อมูลจากฐานความรู้และในแง่ของมัน กระบวนการแปลคือการแปลงประโยคอินพุตของภาษา X ไปเป็นโครงสร้างผลลัพธ์ของภาษา Y กล่าวอีกนัยหนึ่ง ผลลัพธ์ของการแปลด้วยคอมพิวเตอร์ไม่ใช่การแปลเอง แต่เป็นการบอกเล่าข้อความต้นฉบับ (X) คุณภาพของการแปลขึ้นอยู่กับประสิทธิผลของภาษาที่ใช้แทนความรู้ คุณภาพสูงการแปลภาษาด้วยเครื่องสามารถทำได้โดยการสร้างรากฐานทางภาษาที่เชื่อถือได้และเครื่องมือซอฟต์แวร์สำหรับการสร้างเครือข่ายความหมายอันทรงพลังโดยใช้พจนานุกรมอัตโนมัติ

IV. ภาษาศาสตร์ชาติพันธุ์

ภาษาศาสตร์ชาติพันธุ์ (ethnosemantics, anthropolinguistics) เป็นสาขาวิชาภาษาศาสตร์ที่ศึกษาภาษาโดยมีความสัมพันธ์กับวัฒนธรรมของกลุ่มชาติพันธุ์ใดกลุ่มหนึ่งโดยเฉพาะ รากฐานของภาษาศาสตร์ชาติพันธุ์ถูกวางไว้ในงานของ Franz Boas และ Edward Sapir ในช่วงไตรมาสแรกของศตวรรษที่ 20 ในช่วงครึ่งหลังของศตวรรษที่ 20 ภาษาศาสตร์ชาติพันธุ์วิทยาได้กลายเป็นสาขาหนึ่งของภาษาศาสตร์อิสระ การศึกษาภาษาชาติพันธุ์ในช่วงครึ่งหลังของศตวรรษที่ 20 โดดเด่นด้วยคุณสมบัติเช่น: วิธีการที่เกี่ยวข้อง จิตวิทยาเชิงทดลอง; การเปรียบเทียบแบบจำลองความหมายของภาษาต่างๆ ศึกษาปัญหาอนุกรมวิธานพื้นบ้าน การวิจัยเชิงคู่ขนาน การสร้างวัฒนธรรมชาติพันธุ์ทางจิตวิญญาณขึ้นใหม่โดยอาศัยข้อมูลภาษา ฟื้นความสนใจต่อคติชนวิทยา

ประเด็นสำคัญของภาษาศาสตร์ชาติพันธุ์มีสองปัญหาที่เกี่ยวข้องกันอย่างใกล้ชิด ซึ่งสามารถเรียกว่า "ความรู้ความเข้าใจ" และ "การสื่อสาร":

1. แนวคิดทางวัฒนธรรม (ทุกวัน ศาสนา สังคม ฯลฯ) ของผู้คนที่พูดภาษานี้เกี่ยวกับโลกรอบตัวพวกเขาและสถานที่ของมนุษย์ในโลกนี้สะท้อนให้เห็นในภาษาอย่างไร โดยวิธีใด และในรูปแบบใด

2. รูปแบบและวิธีการสื่อสารใด - การสื่อสารทางภาษาเป็นหลัก - มีลักษณะเฉพาะสำหรับกลุ่มชาติพันธุ์หรือสังคมที่กำหนด?

ตามปัญหาเหล่านี้ ภาษาศาสตร์ชาติพันธุ์วิทยาได้เกิดขึ้นสองทิศทาง: ภาษาศาสตร์ชาติพันธุ์วิทยาที่มุ่งเน้นการรับรู้ และภาษาศาสตร์เชิงการสื่อสาร

ก) ภาษาศาสตร์ชาติพันธุ์วิทยาที่มุ่งเน้นความรู้ความเข้าใจ

ภาษาศาสตร์ชาติพันธุ์วิทยาที่มุ่งเน้นความรู้ความเข้าใจเป็นลักษณะของภาษาศาสตร์อเมริกัน เรียกว่า ภาษาศาสตร์มานุษยวิทยา ในขั้นต้น ภาษาศาสตร์มานุษยวิทยามุ่งเน้นไปที่การศึกษาวัฒนธรรมของชนชาติที่แตกต่างกันอย่างมากจากชาวยุโรป โดยเฉพาะชาวอเมริกันอินเดียน การสร้างความสัมพันธ์ทางครอบครัวระหว่างภาษาเหล่านี้และการอธิบายสถานะปัจจุบันของพวกเขานั้นอยู่ภายใต้ภารกิจในการอธิบายวัฒนธรรมของคนเหล่านี้อย่างครอบคลุมและการสร้างประวัติศาสตร์ใหม่รวมถึงเส้นทางการอพยพ การบันทึกและการตีความตำราในชีวิตประจำวันและคติชนถือเป็นองค์ประกอบสำคัญของคำอธิบายทางมานุษยวิทยา

ตามแนวทางของฟรานซ์ โบอาส นักภาษาศาสตร์มานุษยวิทยาเชื่อว่าเศษเสี้ยวของการจำแนกความเป็นจริงในภาษาหนึ่งๆ สอดคล้องกับแง่มุมที่สำคัญกว่าของวัฒนธรรมหนึ่งๆ ดังที่นักภาษาศาสตร์และนักมานุษยวิทยาชาวอเมริกัน แฮร์รี ฮอยเออร์ ตั้งข้อสังเกตว่า “ชนเผ่านักล่าและนักเก็บของป่า เช่น ชนเผ่าอาปาเช่ทางตะวันตกเฉียงใต้ของอเมริกา มีคำศัพท์มากมายเกี่ยวกับชื่อสัตว์ พืช และปรากฏการณ์ทางสิ่งแวดล้อม ชนชาติที่มีแหล่งที่มาของการดำรงอยู่หลักคือ ตกปลา(โดยเฉพาะชาวอินเดียนแดงทางชายฝั่งแปซิฟิกตอนเหนือ) มีคำศัพท์เกี่ยวกับชุดชื่อปลาโดยละเอียด ตลอดจนเครื่องมือและเทคนิคการตกปลา”

ความสนใจที่ยิ่งใหญ่ที่สุดของนักภาษาศาสตร์ชาติพันธุ์ถูกดึงดูดโดยระบบอนุกรมวิธานเช่นการกำหนดส่วนของร่างกายเงื่อนไขเครือญาติที่เรียกว่าการจำแนกชาติพันธุ์ทางชีววิทยานั่นคือชื่อพืชและสัตว์ (นักวิทยาศาสตร์ชาวอังกฤษ B. Berlin, Anna Vezhbitskaya) - และโดยเฉพาะการกำหนดสี (B. Berlin และ P .Kay, A.Vezhbitskaya)

ในภาษาศาสตร์ชาติพันธุ์วิทยามานุษยวิทยาสมัยใหม่ เราสามารถแยกแยะทิศทาง "เชิงสัมพันธ์" และ "สากลนิยม" ได้ตามเงื่อนไข ประการแรก สิ่งสำคัญคือการศึกษาลักษณะเฉพาะทางวัฒนธรรมและภาษาศาสตร์ในภาพของผู้พูดเกี่ยวกับโลก ประการที่สองคือการค้นหาคุณสมบัติสากลของ คำศัพท์และไวยากรณ์ของภาษาธรรมชาติ

ตัวอย่างของการวิจัยเกี่ยวกับทิศทางสัมพัทธภาพในภาษาศาสตร์ชาติพันธุ์คือผลงานของ Yuri Derenikovich Apresyan, Nina Davidovna Arutyunova, Anna Vezhbitskaya, Tatyana Vyacheslavovna Bulygina, Alexey Dmitrievich Shmelev, E.S. Yakovleva ซึ่งอุทิศให้กับลักษณะเฉพาะของภาพภาษารัสเซียของโลก ผู้เขียนเหล่านี้วิเคราะห์ความหมายและการใช้คำที่แสดงถึงแนวคิดที่เป็นเอกลักษณ์ซึ่งไม่เป็นเรื่องปกติสำหรับการสร้างแนวความคิดของโลกในภาษาอื่น (บางทีฉันอาจจะเศร้าโศกและกล้าหาญ) หรือสอดคล้องกับแนวคิดที่มีอยู่ในวัฒนธรรมอื่น แต่มีความสำคัญอย่างยิ่งสำหรับวัฒนธรรมรัสเซียหรือได้รับการตีความเป็นพิเศษ (ความจริงและความยุติธรรม เสรีภาพและเจตจำนง โชคชะตาและโชคชะตา) ให้เรายกตัวอย่างส่วนของคำอธิบายคำว่า "อาจจะ" จากหนังสือของ T.V. Bulygina และ A.D. Shmelev "แนวคิดทางภาษาศาสตร์ของโลก":

«<...>บางที ความหมายไม่เหมือนกับคำว่า "อาจจะ" หรือ "อาจจะ" เลย<...>ส่วนใหญ่มักจะใช้เป็นข้ออ้างสำหรับความประมาทเมื่อพูดถึงความหวังไม่มากนักที่จะมีเหตุการณ์ดีๆ เกิดขึ้น แต่เป็นการหลีกเลี่ยงผลที่ไม่พึงประสงค์อย่างยิ่งบางประการ คนที่ซื้อลอตเตอรี่จะไม่เรียกว่าฉวยโอกาส ดังนั้นใคร ๆ ก็สามารถพูดเกี่ยวกับบุคคลที่<...>ประหยัดเงินโดยไม่ต้องซื้อประกันสุขภาพและหวังว่าจะไม่มีอะไรเลวร้ายเกิดขึ้น<...>ดังนั้นการหวังโอกาสจึงไม่ใช่แค่การหวังโชคเท่านั้น หากสัญลักษณ์แห่งโชคลาภคือรูเล็ตต์ ความหวังในโอกาสก็อาจเป็นสัญลักษณ์ของ “รูเล็ตรัสเซีย”

ตัวอย่างของการวิจัยในทิศทางสากลนิยมในด้านภาษาศาสตร์ชาติพันธุ์คือผลงานของนักวิทยาศาสตร์ชาวโปแลนด์ Anna Wierzbicka ซึ่งอุทิศให้กับหลักการของการอธิบายความหมายทางภาษา เป้าหมายของการวิจัยเป็นเวลาหลายปีโดย A. Vezhbitskaya และผู้ติดตามของเธอคือการสร้างชุดของแนวคิดพื้นฐานสากลที่เรียกว่า "ความหมายดั้งเดิม" โดยการรวมกันซึ่งแต่ละภาษาสามารถสร้างการกำหนดค่าจำนวนอนันต์เฉพาะสำหรับภาษาที่กำหนดและ วัฒนธรรม. ความหมายดั้งเดิมเป็นคำศัพท์สากลกล่าวอีกนัยหนึ่งนี่คือแนวคิดเบื้องต้นซึ่งมีคำที่แสดงถึงสิ่งเหล่านั้นในภาษาใด ๆ แนวคิดเหล่านี้ชัดเจนโดยสัญชาตญาณสำหรับผู้พูดภาษาใดๆ และบนพื้นฐานของแนวคิดเหล่านี้ เราสามารถสร้างการตีความใดๆ ได้ ไม่ว่าหน่วยทางภาษาจะซับซ้อนเพียงใดก็ตาม การศึกษาเนื้อหาจากภาษาที่มีความหลากหลายทางพันธุกรรมและวัฒนธรรมของโลกรวมถึงภาษาของปาปัวนิวกินีภาษาออสโตรนีเซียนภาษาแอฟริกันและชาวพื้นเมืองของออสเตรเลีย A. Vezhbitskaya ปรับปรุงรายการความหมายดั้งเดิมอย่างต่อเนื่อง งานของเธอเรื่อง "การตีความแนวคิดทางอารมณ์" มีรายการต่อไปนี้:

“สาระสำคัญ” – ฉัน คุณ ใครบางคน บางสิ่งบางอย่าง ผู้คน;
“ตัวกำหนดและตัวกำหนดปริมาณ” – นี่, เหมือนกัน, เหมือนกัน, อีกอย่าง, หนึ่ง, สอง, หลาย, ทั้งหมด/ทั้งหมด;
“ภาคแสดงทางจิต” – คิด (เกี่ยวกับ) พูด รู้ รู้สึก ต้องการ;
“การกระทำและเหตุการณ์” - ทำ, เกิดขึ้น/เกิดขึ้น;
“การให้คะแนน” – ดี, แย่;
“คำอธิบาย” – ใหญ่, เล็ก;
“เวลาและสถานที่” – เมื่อ, ที่ไหน, หลัง/ก่อน, ใต้/บน;
“metapredicates” – ไม่ใช่/ไม่ใช่/ปฏิเสธ เพราะ/เพราะ ถ้า สามารถ;
“intensifier” – มาก;
“อนุกรมวิธานและการแบ่งส่วน” – ชนิด/พันธุ์ ส่วนหนึ่ง;
“ความหย่อน/ต้นแบบ” – คล้ายกัน/เป็น

จากความหมายดั้งเดิมเช่น "แบบสำเร็จรูป" A. Vezhbitskaya ได้รวบรวมการตีความแม้แต่แนวคิดที่ละเอียดอ่อนเช่นอารมณ์ ตัวอย่างเช่น เธอสามารถแสดงให้เห็นความแตกต่างเล็กน้อยระหว่างแนวคิดของวัฒนธรรมอเมริกันที่แสดงด้วยคำว่า "ความสุข" และแนวคิดที่แสดงด้วยคำว่า "มีความสุข" ของรัสเซีย (และคำคุณศัพท์ที่คล้ายกันในโปแลนด์ ฝรั่งเศส และเยอรมัน) คำว่า "มีความสุข" ดังที่ A. Vezhbitskaya เขียน แม้ว่าโดยปกติจะถือว่าเป็นพจนานุกรมที่เทียบเท่าก็ตาม คำภาษาอังกฤษ“ความสุข” ในวัฒนธรรมรัสเซีย มีความหมายแคบกว่า “โดยปกติจะใช้เพื่อแสดงถึงสภาวะที่หาได้ยากของความสุขที่สมบูรณ์หรือความพึงพอใจที่ได้รับจากสิ่งที่จริงจัง เช่น ความรัก ครอบครัว ความหมายของชีวิต ฯลฯ” นี่คือวิธีที่ความแตกต่างนี้ถูกกำหนดในภาษาของความหมายดั้งเดิม (องค์ประกอบของการตีความ B ที่ไม่มีในการตีความ A จะถูกเน้นด้วยตัวพิมพ์ใหญ่)

การตีความ A: X รู้สึกมีความสุข
X รู้สึกบางอย่าง
มีสิ่งดีๆเกิดขึ้นกับฉัน
ฉันต้องการสิ่งนี้
ฉันไม่ต้องการสิ่งอื่นใด
X รู้สึกบางอย่างที่คล้ายกัน

การตีความ B: X มีความสุข
X รู้สึกบางอย่าง
บางครั้งคนๆ หนึ่งก็คิดแบบนี้:
มีบางสิ่งที่ดีมากเกิดขึ้นกับฉัน
ฉันต้องการสิ่งนี้
ทุกอย่างปกติดี
ฉันไม่ต้องการสิ่งอื่นใดอีกแล้ว
บุคคลนี้จึงรู้สึกถึงบางสิ่งที่ดี
X รู้สึกบางอย่างที่คล้ายกัน

สำหรับโครงการวิจัยของ A. Vezhbitskaya สิ่งสำคัญคือการค้นหาความหมายดั้งเดิมสากลนั้นดำเนินการเชิงประจักษ์โดยใช้วิธีภาษาศาสตร์ภาคสนาม - ทำงานร่วมกับผู้ให้ข้อมูล: ประการแรกในแต่ละภาษาแต่ละภาษามีบทบาทที่แนวคิดที่กำหนดเล่นในการตีความภาษาอื่น ๆ แนวคิดได้รับการชี้แจงและใน -ประการที่สอง สำหรับแต่ละแนวคิด ชุดของภาษาจะถูกระบุซึ่งแนวคิดนี้ถูกทำให้เป็นคำศัพท์ นั่นคือ มีคำพิเศษที่แสดงถึงแนวคิดนี้

B) ภาษาศาสตร์เชิงชาติพันธุ์เชิงการสื่อสาร

ผลลัพธ์ที่สำคัญที่สุดในภาษาศาสตร์เชิงชาติพันธุ์วิทยาที่เน้นการสื่อสารมีความเกี่ยวข้องกับทิศทางที่เรียกว่า "ชาติพันธุ์วิทยาแห่งการพูด" หรือ "ชาติพันธุ์วิทยาแห่งการสื่อสาร" ชาติพันธุ์วิทยาของคำพูดเป็นทฤษฎีและวิธีการวิเคราะห์การใช้ภาษาในบริบททางสังคมวัฒนธรรมถูกเสนอในช่วงต้นทศวรรษที่ 60 ในงานของ D. Himes และ John J. Gumperz และพัฒนาในงานของนักวิทยาศาสตร์ชาวอเมริกัน Aron Cicurel, J. Bauman, A.W. คอร์ซาโร คำพูดจะศึกษาเฉพาะในส่วนที่เกี่ยวข้องกับคำพูดหรือเหตุการณ์การสื่อสารภายในกรอบที่มันถูกสร้างขึ้นเท่านั้น เน้นย้ำเงื่อนไขทางวัฒนธรรมของเหตุการณ์สุนทรพจน์ใดๆ (การเทศน์ การไต่สวนในศาล การสนทนาทางโทรศัพท์ ฯลฯ) ที่ได้รับการเน้นย้ำ กฎการใช้ภาษากำหนดขึ้นจากการสังเกตในปัจจุบัน (การเข้าร่วมกิจกรรมสุนทรพจน์) การวิเคราะห์ข้อมูลที่เกิดขึ้นเอง และการสัมภาษณ์เจ้าของภาษาในภาษาที่กำหนด

ภายในกรอบของทิศทางนี้ แบบจำลองพฤติกรรมการพูดได้รับการยอมรับในวัฒนธรรมใดวัฒนธรรมหนึ่ง ในกลุ่มชาติพันธุ์ใดกลุ่มหนึ่งหรือ กลุ่มสังคม. ตัวอย่างเช่น ในวัฒนธรรมของ "มาตรฐานยุโรปกลาง" การสนทนาอย่างไม่เป็นทางการระหว่างคนหลายคนถือว่าตามกฎของมารยาทที่ดีที่เป็นที่ยอมรับในชุมชนนี้ว่าผู้เข้าร่วมจะไม่ขัดจังหวะซึ่งกันและกัน ทุกคนจะได้รับโอกาส พูดในทางกลับกัน และคนที่ต้องการพูดมักจะส่งสัญญาณสิ่งนี้ด้วยคำว่า "ให้ฉันทราบ" "ให้ฉันถาม" เป็นต้น ใครก็ตามที่ต้องการออกจากการสนทนาก็ประกาศเจตนารมณ์ด้วยคำว่า “น่าเสียดาย ฉันต้องไปแล้ว” “ฉันต้องไปแล้ว” และอื่นๆ บรรทัดฐานที่แตกต่างกันอย่างสิ้นเชิงของพฤติกรรมการพูดในที่สาธารณะได้รับการยอมรับ เช่น ในวัฒนธรรมอะบอริจินของออสเตรเลียจำนวนหนึ่ง การปฏิบัติตาม สิทธิส่วนบุคคล ผู้เข้าร่วมรายบุคคลการสนทนาในชุมชนเหล่านี้ไม่ใช่กฎบังคับ: คู่สนทนาหลายคนสามารถพูดพร้อมกันได้ ไม่จำเป็นต้องตอบสนองต่อคำพูดของผู้อื่น ผู้พูดพูดโดยไม่เอ่ยถึงใครเป็นพิเศษ คู่สนทนาอาจไม่มองหน้ากัน ฯลฯ . รูปแบบพฤติกรรมการพูดนี้สร้างขึ้นบนสมมติฐานเบื้องต้นว่าคำพูดทั้งหมดสะสมอยู่ในโลกโดยรอบ ดังนั้น "การรับ" ข้อความจึงไม่จำเป็นต้องเป็นไปตาม "การส่ง" โดยตรง

หัวข้อที่เกี่ยวข้องในชาติพันธุ์วิทยาของการสื่อสารคือการศึกษาการแสดงออกทางภาษาของสถานะทางสังคมสัมพัทธ์ของคู่สนทนา: กฎของการพูดกับคู่สนทนารวมถึงการใช้ชื่อที่อยู่ตามชื่อนามสกุลชื่อและนามสกุลมืออาชีพ ที่อยู่ (เช่น “แพทย์” “สหายเอก” “ศาสตราจารย์”) ความเหมาะสมของคำปราศรัย “ถึงคุณ” และ “ถึงคุณ” เป็นต้น ให้ความสนใจเป็นพิเศษกับภาษาที่ความสัมพันธ์ระหว่างตำแหน่งทางสังคมของผู้พูดและผู้ฟังได้รับการแก้ไขไม่เพียง แต่ในคำศัพท์เท่านั้น แต่ยังรวมถึงไวยากรณ์ด้วย ตัวอย่างคือภาษาญี่ปุ่น ซึ่งการเลือกรูปแบบไวยากรณ์ของคำกริยาขึ้นอยู่กับว่าผู้ฟังอยู่สูงหรือต่ำกว่าผู้พูดในลำดับชั้นทางสังคม และผู้พูดและผู้ฟังเป็นส่วนหนึ่งของหน่วยทางสังคมเดียวกันหรือไม่ . นอกจากนี้ ยังคำนึงถึงความสัมพันธ์ระหว่างผู้พูดกับบุคคลที่ถูกพูดถึงด้วย เรากำลังพูดถึง. ผลจากผลกระทบที่ซับซ้อนของข้อจำกัดเหล่านี้ บุคคลคนเดียวกันจึงใช้รูปแบบคำกริยาที่แตกต่างกันเมื่อพูดกับผู้ใต้บังคับบัญชาและเมื่อพูดกับผู้บังคับบัญชา เมื่อพูดกับเพื่อนร่วมงาน และเมื่อพูดกับคนแปลกหน้า เมื่อพูดกับภรรยาและภรรยาของเพื่อนบ้าน .

ไวยากรณ์ยังสะท้อนให้เห็นถึงคุณลักษณะของมารยาทในการพูดภาษาญี่ปุ่นเช่นความปรารถนาที่จะหลีกเลี่ยงการบุกรุกเข้าไปในขอบเขตของความคิดและความรู้สึกของคู่สนทนา ในภาษาญี่ปุ่นมีรูปแบบไวยากรณ์พิเศษของคำกริยา - ที่เรียกว่า "อารมณ์ทางเลือก" การใช้คำต่อท้ายอารมณ์ที่พึงประสงค์ – ไท ผู้พูดแสดงความปรารถนาที่จะดำเนินการตามกริยาดั้งเดิม: “อ่าน” + ไท = “อยากอ่าน”, “ออก” + ไท = “อยากออก” อย่างไรก็ตาม รูปแบบของอารมณ์ที่ต้องการจะเกิดขึ้นได้ก็ต่อเมื่อผู้พูดบรรยายถึงความปรารถนาของตนเองเท่านั้น ความปรารถนาของคู่สนทนาหรือบุคคลที่สามแสดงออกมาโดยใช้โครงสร้างพิเศษ ซึ่งมีความหมายโดยประมาณว่า "โดย" สัญญาณภายนอกเราสามารถสรุปได้ว่าบุคคล X ต้องการดำเนินการ Y" ดังนั้น ผู้พูดภาษาญี่ปุ่นสามารถตัดสินเกี่ยวกับความตั้งใจของเขาเองเท่านั้น ขึ้นอยู่กับข้อกำหนดของไวยากรณ์ แต่ภาษาก็ไม่อนุญาตให้มีการกล่าวโดยตรงเกี่ยวกับสถานะภายในของ บุคคลอื่น เช่น เกี่ยวกับความปรารถนาของเขา คุณสามารถพูดว่า "ฉันต้องการ..." แต่คุณไม่สามารถพูดว่า "คุณต้องการ..." หรือ "เขาต้องการ..." ได้ แต่เพียง "ดูเหมือนว่าสำหรับฉัน (ฉันมี ความประทับใจ) ที่คุณต้องการ...” หรือ “สำหรับฉัน (ฉันมีความประทับใจ) ว่าเขาต้องการ…”

นอกเหนือจากบรรทัดฐานของมารยาทในการพูดแล้ว กลุ่มชาติพันธุ์วิทยาของการสื่อสารยังศึกษาสถานการณ์การพูดที่พิธีกรรมในบางวัฒนธรรม เช่น การไต่สวนในศาล การป้องกันวิทยานิพนธ์ ธุรกรรมทางการค้า และอื่นๆ ที่คล้ายคลึงกัน หลักเกณฑ์การเลือกภาษาในการสื่อสารระหว่างภาษา แบบแผนทางภาษาและความคิดโบราณที่ส่งสัญญาณว่าข้อความอยู่ในประเภทใดประเภทหนึ่ง (“ กาลครั้งหนึ่ง” - ในเทพนิยาย“ พวกเขาฟังและตัดสินใจ” - ในรายงานการประชุม)

ภาษาศาสตร์ชาติพันธุ์สมัยใหม่มีความสัมพันธ์อย่างใกล้ชิดกับสังคมวิทยา จิตวิทยา และสัญศาสตร์ ในภาษาศาสตร์ชาติพันธุ์วิทยาของรัสเซีย สถานที่พิเศษถูกครอบครองโดยการวิจัยที่จุดตัดของภาษาศาสตร์ชาติพันธุ์วิทยา คติชนวิทยา และภาษาศาสตร์ประวัติศาสตร์เชิงเปรียบเทียบ ก่อนอื่นนี่คือโครงการวิจัยที่อุทิศให้กับประวัติศาสตร์ทางชาติพันธุ์และชาติพันธุ์วัฒนธรรมของชาวสลาฟ (Nikita Ilyich Tolstoy, Svetlana Mikhailovna Tolstaya, Vladimir Nikolaevich Toporov) ภายในกรอบของโปรแกรมนี้ มีการรวบรวมแผนที่ทางภาษาชาติพันธุ์ พิธีกรรม ความเชื่อ และนิทานพื้นบ้าน มีการศึกษาโครงสร้างของข้อความสลาฟที่ประมวลผลแล้วบางประเภท รวมถึงข้อความสะกด ปริศนา งานศพและพิธีกรรมการก่อสร้าง ฯลฯ โดยมีความสัมพันธ์กับข้อมูลจากการวิจัยทางประวัติศาสตร์และโบราณคดีเชิงเปรียบเทียบ

  • การจัดระบบทางภาษาศาสตร์และการจำแนกภาษาศาสตร์ของชนชาติต่างๆ ในโลก
  • การจำแนกประเภทของภาษาและรูปแบบการพูดทางสังคมศาสตร์ (หรือการทำงาน)

  • ภาษาศาสตร์เชิงคำนวณ(อีกด้วย: ทางคณิตศาสตร์หรือ ภาษาศาสตร์เชิงคำนวณ, ภาษาอังกฤษ ภาษาศาสตร์เชิงคำนวณ) - ทิศทางทางวิทยาศาสตร์ในด้านการสร้างแบบจำลองทางคณิตศาสตร์และคอมพิวเตอร์ของกระบวนการทางปัญญาในมนุษย์และสัตว์เมื่อสร้างระบบปัญญาประดิษฐ์ซึ่งมีจุดมุ่งหมายเพื่อใช้แบบจำลองทางคณิตศาสตร์เพื่ออธิบายภาษาธรรมชาติ

    ภาษาศาสตร์เชิงคำนวณทับซ้อนกับการประมวลผลภาษาธรรมชาติ อย่างไรก็ตาม ในระยะหลังไม่ได้เน้นที่แบบจำลองเชิงนามธรรม แต่เน้นที่วิธีการประยุกต์ในการอธิบายและประมวลผลภาษาสำหรับระบบคอมพิวเตอร์

    กิจกรรมของนักภาษาศาสตร์คอมพิวเตอร์คือการพัฒนาอัลกอริธึมและแอปพลิเคชันสำหรับการประมวลผลข้อมูลทางภาษา

    ต้นกำเนิด

    ภาษาศาสตร์คณิตศาสตร์เป็นสาขาหนึ่งของวิทยาศาสตร์ปัญญาประดิษฐ์ ประวัติศาสตร์เริ่มต้นขึ้นในสหรัฐอเมริกาในช่วงทศวรรษ 1950 ด้วยการประดิษฐ์ทรานซิสเตอร์และการกำเนิดของคอมพิวเตอร์รุ่นใหม่ เช่นเดียวกับภาษาการเขียนโปรแกรมแรกๆ การทดลองจึงเริ่มต้นด้วยการแปลด้วยเครื่อง โดยเฉพาะในวารสารวิทยาศาสตร์ของรัสเซีย ในปี 1960 มีการศึกษาที่คล้ายกันในสหภาพโซเวียต (ตัวอย่างเช่นบทความเกี่ยวกับการแปลจากภาษารัสเซียเป็นภาษาอาร์เมเนียในคอลเลกชัน "ปัญหาของไซเบอร์เนติกส์" ในปี 1964) อย่างไรก็ตาม คุณภาพของการแปลด้วยเครื่องยังคงด้อยกว่าคุณภาพของการแปลโดยมนุษย์มาก

    ตั้งแต่วันที่ 15 พฤษภาคมถึง 21 พฤษภาคม พ.ศ. 2501 การประชุม All-Union Conference on Machine Translation ครั้งแรกจัดขึ้นที่ I Moscow State Pedagogical Institute of Foreign Languages คณะกรรมการจัดงานนำโดย V. Yu. Rosenzweig และเลขาธิการบริหารของคณะกรรมการจัดงาน G. V. Chernov โปรแกรมการประชุมฉบับเต็มได้รับการตีพิมพ์ในคอลเลกชั่น “Machine Translation and Applied Linguistics” เล่ม 1 ฉบับที่ 1, 1959 (หรือที่รู้จักในชื่อ “ประกาศของสมาคมการแปลด้วยเครื่องหมายเลข 8”) ดังที่ V. Yu. Rosenzweig เล่า คอลเลกชันบทคัดย่อการประชุมที่ได้รับการตีพิมพ์ได้มาถึงสหรัฐอเมริกาและสร้างความประทับใจอย่างมากที่นั่น

    ในเดือนเมษายน พ.ศ. 2502 การประชุม All-Union ครั้งแรกเกี่ยวกับภาษาศาสตร์คณิตศาสตร์ซึ่งจัดขึ้นโดยมหาวิทยาลัยเลนินกราดและคณะกรรมการภาษาศาสตร์ประยุกต์จัดขึ้นที่เลนินกราด ผู้จัดประชุมหลักคือ N.D. Andreev นักคณิตศาสตร์ที่มีชื่อเสียงจำนวนหนึ่งเข้าร่วมในการประชุม โดยเฉพาะ S. L. Sobolev, L. V. Kantorovich (ต่อมา - รางวัลโนเบล) และ A. A. Markov (สองคนสุดท้ายพูดในการอภิปราย) V. Yu. Rosenzweig กล่าวปาฐกถาพิเศษในวันเปิดการประชุม “ทฤษฎีภาษาศาสตร์ทั่วไปของการแปลและภาษาศาสตร์ทางคณิตศาสตร์”

    สาขาวิชาภาษาศาสตร์คอมพิวเตอร์

    • การประมวลผลภาษาธรรมชาติ การประมวลผลภาษาธรรมชาติ; วากยสัมพันธ์ สัณฐานวิทยา การวิเคราะห์ข้อความเชิงอรรถศาสตร์) รวมถึง:
    1. ภาษาศาสตร์คอร์ปัส การสร้างและการใช้คลังข้อความอิเล็กทรอนิกส์
    2. การสร้างพจนานุกรมอิเล็กทรอนิกส์ อรรถาภิธาน และภววิทยา ตัวอย่างเช่น ลิงโว่ ตัวอย่างเช่น พจนานุกรมจะใช้สำหรับการแปลอัตโนมัติและการตรวจสอบตัวสะกด
    3. การแปลข้อความอัตโนมัติ Promt ได้รับความนิยมในหมู่นักแปลภาษารัสเซีย หนึ่งในบริการฟรีคือ Google Translate
    4. การแยกข้อเท็จจริงจากข้อความโดยอัตโนมัติ (การแยกข้อมูล) การแยกข้อเท็จจริง การทำเหมืองข้อความ)
    5. การอ้างอิงอัตโนมัติ การสรุปข้อความอัตโนมัติ). คุณลักษณะนี้รวมอยู่ใน Microsoft Word เป็นต้น
    6. การสร้างระบบการจัดการความรู้ ดูระบบผู้เชี่ยวชาญ
    7. การสร้างระบบคำถามและคำตอบ ระบบตอบคำถาม).
    • การรู้จำอักขระด้วยแสง โอซีอาร์). เช่น โปรแกรม FineReader
    • การรู้จำเสียงพูดอัตโนมัติ ASR). มีซอฟต์แวร์แบบชำระเงินและฟรี
    • การสังเคราะห์เสียงพูดอัตโนมัติ

    สมาคมและการประชุมใหญ่ๆ

    โปรแกรมการศึกษาในรัสเซีย

    ดูสิ่งนี้ด้วย

    เขียนบทวิจารณ์เกี่ยวกับบทความ "ภาษาศาสตร์คอมพิวเตอร์"

    หมายเหตุ

    ลิงค์

    • (เชิงนามธรรม)
    • - ฐานความรู้ของแหล่งข้อมูลทางภาษาสำหรับภาษารัสเซีย
    • - รหัสโอเพ่นซอร์สของยูทิลิตี้ภาษาศาสตร์เชิงคำนวณบางอย่าง
    • - การเข้าถึงโปรแกรมภาษาศาสตร์คอมพิวเตอร์แบบออนไลน์

    ข้อความที่ตัดตอนมาจากลักษณะภาษาศาสตร์คอมพิวเตอร์

    “ เอาไปพาเด็กไป” ปิแอร์พูดพร้อมมอบเด็กผู้หญิงและพูดกับผู้หญิงคนนั้นอย่างไม่เกรงกลัวและเร่งรีบ - มอบให้พวกเขา มอบให้พวกเขา! - เขาตะโกนเกือบจะใส่ผู้หญิงคนนั้น วางหญิงสาวที่กรีดร้องลงบนพื้นแล้วมองย้อนกลับไปที่ครอบครัวชาวฝรั่งเศสและอาร์เมเนียอีกครั้ง ชายชรากำลังนั่งเท้าเปล่าอยู่แล้ว เจ้าหนูน้อยชาวฝรั่งเศสถอดรองเท้าบู๊ตครั้งสุดท้ายและปรบมือให้รองเท้าคู่หนึ่งปะทะกัน ชายชราร้องไห้สะอื้นพูดอะไรบางอย่าง แต่ปิแอร์เพียงแวบเดียวเท่านั้น ความสนใจทั้งหมดของเขาหันไปหาชายชาวฝรั่งเศสในหมวกซึ่งในเวลานั้นส่ายไปมาช้าๆเคลื่อนตัวไปหาหญิงสาวแล้วเอามือออกจากกระเป๋าแล้วคว้าคอของเธอ
    หญิงอาร์เมเนียแสนสวยยังคงนั่งนิ่งอยู่ในท่าเดิม โดยขนตายาวของเธอลดลง และราวกับว่าเธอไม่เห็นหรือรู้สึกถึงสิ่งที่ทหารกำลังทำกับเธอ
    ในขณะที่ปิแอร์วิ่งไม่กี่ก้าวที่แยกเขาออกจากฝรั่งเศส นักปล้นตัวยาวในชุดคลุมก็ฉีกสร้อยคอที่เธอสวมออกจากคอของหญิงชาวอาร์เมเนียแล้ว และหญิงสาวก็ใช้มือจับคอของเธอแล้วกรีดร้องด้วยเสียงแหลม .
    – Laissez cette femme! [ปล่อยผู้หญิงคนนี้!] - ปิแอร์บ่นด้วยน้ำเสียงที่บ้าคลั่งคว้าไหล่ทหารที่โค้งงอยาวแล้วโยนเขาออกไป ทหารล้มลุกแล้ววิ่งหนีไป แต่สหายของเขาทิ้งรองเท้าบู๊ตหยิบมีดออกมาและก้าวเข้าสู่ปิแอร์อย่างน่ากลัว
    - ขอให้โชคดี! [อ้อ! อย่าโง่!] – เขาตะโกน
    ปิแอร์อยู่ในความโกรธแค้นซึ่งเขาจำอะไรไม่ได้เลยและความแข็งแกร่งของเขาเพิ่มขึ้นสิบเท่า เขารีบวิ่งไปที่ชาวฝรั่งเศสเท้าเปล่า และก่อนที่เขาจะหยิบมีดออกมา เขาก็ล้มเขาลงแล้วและยังใช้หมัดทุบเขาอีกด้วย ได้ยินเสียงร้องอย่างเห็นชอบจากฝูงชนที่อยู่รอบๆ และในขณะเดียวกันก็มีทหารลาดตระเวนชาวฝรั่งเศสขี่ม้ามาปรากฏตัวที่มุมถนน ทหารหอกวิ่งเหยาะๆไปหาปิแอร์และชาวฝรั่งเศสแล้วล้อมพวกเขาไว้ ปิแอร์จำอะไรไม่ได้เลยว่าเกิดอะไรขึ้นต่อไป เขาจำได้ว่าเขาทุบตีใครบางคน เขาถูกทุบตี และสุดท้ายเขาก็รู้สึกว่ามือของเขาถูกมัด มีทหารฝรั่งเศสจำนวนหนึ่งยืนล้อมเขาและค้นดูชุดของเขา
    “ฉันเป็นคนไม่ฉุนเฉียว ผู้หมวด [ร้อยโท เขามีกริช”] เป็นคำแรกที่ปิแอร์เข้าใจ
    - อ่า สู้ ๆ ! [อ้าอาวุธ!] - เจ้าหน้าที่พูดแล้วหันไปหาทหารเท้าเปล่าที่พาปิแอร์ไปด้วย
    “C"est bon, vous direz tout cela au conseil de guerre, [เอาล่ะ โอเค คุณจะบอกทุกอย่างในการพิจารณาคดี" เจ้าหน้าที่กล่าว และหลังจากนั้นเขาก็หันไปหาปิแอร์: "Parlez vous Francais vous?" คุณพูดภาษาฝรั่งเศสได้หรือไม่? ]
    ปิแอร์มองไปรอบ ๆ เขาด้วยดวงตาแดงก่ำและไม่ตอบ ใบหน้าของเขาอาจดูน่ากลัวมาก เพราะเจ้าหน้าที่พูดอะไรบางอย่างด้วยเสียงกระซิบ และหอกอีกสี่คนก็แยกตัวออกจากทีมและยืนอยู่ทั้งสองข้างของปิแอร์
    – ปาร์เลซ กับ ฟรองซัวส์? – เจ้าหน้าที่ถามซ้ำโดยอยู่ห่างจากเขา - Faites venir l "ตีความ [เรียกล่าม] - จากด้านหลังเขาจากไป ผู้ชายตัวเล็ก ๆในชุดพลเรือนรัสเซีย ปิแอร์จากการแต่งกายและคำพูดของเขาจำได้ทันทีว่าเขาเป็นคนฝรั่งเศสจากร้านค้าแห่งหนึ่งในมอสโก
    “Il n"a pas l"air d"un homme du peuple [เขาดูไม่เหมือนคนธรรมดาสามัญเลย" นักแปลกล่าวขณะมองไปที่ปิแอร์
    - โอ้โอ้! ca m"a bien l"air d"un des incendiaires" เจ้าหน้าที่เบลอ "Demandez lui ce qu"il est? [โอ้โอ้! เขาดูเหมือนคนวางเพลิงมาก ถามเขาว่าเขาเป็นใคร?] เขากล่าวเสริม
    - คุณคือใคร? – ถามนักแปล “เจ้าหน้าที่ต้องตอบ” เขากล่าว
    – เฌ เนอ วูส์ ดิราย ปาส กิ เฌ ซุย เฌซุย โวเตอร์ ผู้ถูกคุมขัง เอ็มเมเนซ มอย [ฉันจะไม่บอกคุณว่าฉันเป็นใคร ฉันเป็นนักโทษของคุณ พาฉันไป” จู่ๆ ปิแอร์ก็พูดเป็นภาษาฝรั่งเศส
    - อ่า อ่า! – เจ้าหน้าที่พูดพร้อมกับขมวดคิ้ว - มาร์ชอน!
    ฝูงชนรวมตัวกันล้อมรอบหอก ใกล้กับปิแอร์มากที่สุดคือผู้หญิงคนหนึ่งมีรอยเจาะร่างกายกับผู้หญิงคนหนึ่ง เมื่อทางเบี่ยงเริ่มเคลื่อนตัว เธอก็เคลื่อนตัวไปข้างหน้า
    - พวกเขาจะพาคุณไปที่ไหนที่รักของฉัน? - เธอพูด. - ผู้หญิงคนนี้ ฉันจะทำยังไงกับผู้หญิงคนนี้ ถ้าเธอไม่ใช่ของพวกเขา! - ผู้หญิงคนนั้นพูด
    – Qu"est ce qu"elle veut cette femme? [เธอต้องการอะไร] - ถามเจ้าหน้าที่
    ปิแอร์ดูเหมือนเขาเมา ความปีติยินดีของเขาทวีความรุนแรงมากยิ่งขึ้นเมื่อเห็นเด็กผู้หญิงที่เขาช่วยชีวิตไว้
    “Ce qu”elle dit?” เขาพูด “Elle m”apporte ma fille que je viens de sauver des flammes” เขากล่าว - ลาก่อน! [เธอต้องการอะไร? เธออุ้มลูกสาวของฉันซึ่งฉันช่วยไว้จากไฟ ลาก่อน!] - และเขาไม่รู้ว่าคำโกหกที่ไร้จุดหมายนี้หนีรอดไปได้อย่างไรจึงเดินอย่างเด็ดขาดและเคร่งขรึมท่ามกลางชาวฝรั่งเศส
    หน่วยลาดตระเวนของฝรั่งเศสเป็นหนึ่งในกลุ่มที่ถูกส่งตามคำสั่งของ Duronel ไปยังถนนต่างๆ ของมอสโกเพื่อปราบปรามการปล้นสะดมและโดยเฉพาะอย่างยิ่งเพื่อจับกุมผู้ลอบวางเพลิงซึ่งตามความเห็นทั่วไปที่เกิดขึ้นในวันนั้นในหมู่ชาวฝรั่งเศสที่มีตำแหน่งสูงสุดคือ สาเหตุของการเกิดเพลิงไหม้ หลังจากเดินไปตามถนนหลายสาย หน่วยลาดตระเวนก็ได้จับชาวรัสเซียที่น่าสงสัยอีก 5 คน เจ้าของร้าน 1 คน นักบวช 2 คน ชาวนาและคนรับใช้ 1 คน และคนปล้นสะดมอีกหลายคน แต่ในบรรดาผู้ต้องสงสัยทั้งหมด ปิแอร์ดูน่าสงสัยที่สุด เมื่อพวกเขาถูกนำตัวไปพักค้างคืนในบ้านหลังใหญ่บน Zubovsky Val ซึ่งมีการจัดตั้งป้อมยามขึ้น ปิแอร์ถูกแยกออกจากกันภายใต้การดูแลที่เข้มงวด

    ในเซนต์ปีเตอร์สเบิร์กในเวลานี้ในแวดวงที่สูงที่สุดด้วยความร้อนแรงกว่าที่เคยมีการต่อสู้ที่ซับซ้อนระหว่างฝ่ายของ Rumyantsev, ฝรั่งเศส, Maria Feodorovna, Tsarevich และคนอื่น ๆ จมน้ำตายเช่นเคยโดยการเป่าแตร ของโดรนประจำศาล แต่ความสงบ หรูหรา กังวลแต่เรื่องผี ภาพสะท้อนของชีวิต ชีวิตในเซนต์ปีเตอร์สเบิร์กดำเนินไปเช่นเดิม และเนื่องจากวิถีชีวิตนี้จึงจำเป็นต้องใช้ความพยายามอย่างมากในการรับรู้ถึงอันตรายและสถานการณ์ที่ยากลำบากที่ชาวรัสเซียพบตัวเอง มีทางออกเดียวกัน ลูกบอล โรงละครฝรั่งเศสเดียวกัน ผลประโยชน์เดียวกันของศาล ความสนใจในการบริการและการวางอุบายที่เหมือนกัน เฉพาะในแวดวงที่สูงที่สุดเท่านั้นที่พยายามระลึกถึงความยากลำบากของสถานการณ์ปัจจุบัน มีการบอกด้วยเสียงกระซิบว่าจักรพรรดินีทั้งสองมีท่าทีตรงกันข้ามกันในสถานการณ์ที่ยากลำบากเช่นนี้ จักรพรรดินีมาเรีย เฟโอโดรอฟนา ซึ่งกังวลเกี่ยวกับสวัสดิภาพของสถาบันการกุศลและการศึกษาภายใต้เขตอำนาจของเธอได้ออกคำสั่งให้ส่งสถาบันทั้งหมดไปยังคาซานและสิ่งของของสถาบันเหล่านี้ก็ถูกบรรจุไว้แล้ว เมื่อถูกถามว่าจักรพรรดินี Elizaveta Alekseevna ต้องการสั่งอะไร โดยมีลักษณะความรักชาติแบบรัสเซีย ทรงยอมตอบว่าเธอไม่สามารถออกคำสั่งเกี่ยวกับสถาบันของรัฐได้ เนื่องจากสิ่งนี้เกี่ยวข้องกับอธิปไตย เกี่ยวกับสิ่งเดียวกันซึ่งขึ้นอยู่กับเธอเป็นการส่วนตัวเธอยอมบอกว่าเธอจะเป็นคนสุดท้ายที่จะออกจากเซนต์ปีเตอร์สเบิร์ก

    วางแผน:

    1. ภาษาศาสตร์เชิงคำนวณคืออะไร?

    2. วัตถุประสงค์และวิชาภาษาศาสตร์คอมพิวเตอร์

    4. ปัญหาทางภาษาศาสตร์เชิงคำนวณ

    5. วิธีการวิจัยภาษาศาสตร์เชิงคำนวณ

    6. ประวัติและเหตุผลของการเกิดขึ้นของภาษาศาสตร์คอมพิวเตอร์

    7. เงื่อนไขพื้นฐานของภาษาศาสตร์เชิงคำนวณ

    8. นักวิทยาศาสตร์ที่ทำงานเกี่ยวกับปัญหาภาษาศาสตร์เชิงคำนวณ

    9. สมาคมและการประชุมวิชาการภาษาศาสตร์คอมพิวเตอร์

    10. วรรณกรรมที่ใช้


    ภาษาศาสตร์เชิงคำนวณ –ทิศทางอิสระในภาษาศาสตร์ประยุกต์ เน้นการใช้คอมพิวเตอร์ในการแก้ปัญหาที่เกี่ยวข้องกับการใช้ภาษาธรรมชาติ (ชชิลิกีนา ก.ม.)


    ภาษาศาสตร์เชิงคำนวณ– เนื่องจากเป็นหนึ่งในสาขาวิชาภาษาศาสตร์ประยุกต์ เธอได้ศึกษาพื้นฐานทางภาษาศาสตร์ของวิทยาการคอมพิวเตอร์และทุกแง่มุมของการเชื่อมโยงระหว่างภาษากับการคิด การสร้างแบบจำลองภาษาและการคิดในสภาพแวดล้อมคอมพิวเตอร์โดยใช้โปรแกรมคอมพิวเตอร์ และความสนใจของเธออยู่ที่: 1) การเพิ่มประสิทธิภาพการสื่อสารตามความรู้ทางภาษา 2) การสร้างส่วนต่อประสานภาษาธรรมชาติและประเภทของความเข้าใจภาษาสำหรับการสื่อสารระหว่างมนุษย์กับเครื่องจักร 3) การสร้างและการสร้างแบบจำลองระบบคอมพิวเตอร์สารสนเทศ (Sosnina E.P.)


    วัตถุประสงค์ของภาษาศาสตร์คอมพิวเตอร์– การวิเคราะห์ภาษาในสภาพธรรมชาติตามที่ผู้คนใช้ สถานการณ์ที่แตกต่างกันการสื่อสาร และวิธีการกำหนดคุณลักษณะของภาษา


    งานของภาษาศาสตร์คอมพิวเตอร์:


    วิธีการวิจัยภาษาศาสตร์คอมพิวเตอร์:

    1. วิธีการสร้างแบบจำลอง-วัตถุพิเศษของการศึกษาที่ไม่สามารถหาได้จากการสังเกตโดยตรง ตามคำจำกัดความของนักคณิตศาสตร์ เค. แชนนอน แบบจำลองคือการนำเสนอวัตถุในรูปแบบใดรูปแบบหนึ่งที่แตกต่างจากรูปแบบการดำรงอยู่จริงของมัน

    2. วิธีทฤษฎีการแทนองค์ความรู้หมายถึงวิธีการแสดงความรู้ที่มุ่งเน้นการประมวลผลอัตโนมัติโดยคอมพิวเตอร์สมัยใหม่

    3. วิธีทฤษฎีภาษาโปรแกรม(ทฤษฎีภาษาโปรแกรม) เป็นสาขาวิชาวิทยาการคอมพิวเตอร์ที่เกี่ยวข้องกับการออกแบบ การวิเคราะห์ การกำหนดลักษณะและการจำแนกภาษาโปรแกรมและการศึกษาคุณลักษณะเฉพาะของแต่ละภาษา


    เหตุผลในการเกิดขึ้นของภาษาศาสตร์คอมพิวเตอร์

    1. การเกิดขึ้นของคอมพิวเตอร์

    2. ปัญหาในการสื่อสารกับคอมพิวเตอร์ของผู้ใช้ที่ไม่ผ่านการฝึกอบรม


    1. ระบบค้นหาพจนานุกรมพัฒนาขึ้นที่ Birkbeck College ในลอนดอนในปี 1948

    2. บันทึกข้อตกลงของวอร์เรน วีเวอร์

    3. จุดเริ่มต้นของการแนะนำคอมพิวเตอร์เครื่องแรกในด้านการแปลด้วยเครื่อง

    4. โครงการจอร์จทาวน์ เมื่อปี พ.ศ. 2497


    1. ALPAC (คณะกรรมการที่ปรึกษาการประมวลผลภาษาอัตโนมัติ) 2. เวทีใหม่ในการพัฒนาเทคโนโลยีคอมพิวเตอร์และการใช้งานในงานด้านภาษา 3. การสร้างคอมพิวเตอร์และภาษาโปรแกรมรุ่นใหม่ 4. เพิ่มความสนใจในการแปลภาษาด้วยเครื่อง 60

    -70 ของศตวรรษที่ยี่สิบ


    ปลายยุค 80 - ต้นยุค 90 ของศตวรรษที่ยี่สิบ

      การเกิดขึ้นและการพัฒนาอย่างแข็งขันของอินเทอร์เน็ต

    • การเติบโตอย่างรวดเร็วของปริมาณข้อมูลข้อความในรูปแบบอิเล็กทรอนิกส์

    • ความจำเป็นในการประมวลผลข้อความอัตโนมัติในภาษาธรรมชาติ


    1. ผลิตภัณฑ์ของ PROMT และ ABBY (Lingvo) 2. เทคโนโลยีการแปลด้วยเครื่อง 3. เทคโนโลยีหน่วยความจำการแปล

    ระบบการค้าสมัยใหม่

    • ข้อความฟื้นคืนชีพ

    • โมเดลการสื่อสาร

    • พจนานุกรมคอมพิวเตอร์

    • เครื่องแปลภาษา

    • คลังข้อความ


    การวิเคราะห์ข้อความภาษาธรรมชาติ

    โครงสร้างข้อความ 3 ระดับ:
    • โครงสร้างวากยสัมพันธ์พื้นผิว

    • โครงสร้างวากยสัมพันธ์เชิงลึก

    • ระดับความหมาย


    ปัญหาของการสังเคราะห์เป็นสิ่งที่ตรงกันข้ามในการวิเคราะห์

    ทำให้ข้อความมีชีวิตชีวา

    1. แลกเปลี่ยนข้อความผ่านภาพบนหน้าจอแสดงผล

    2. รูปแบบการคิดของมนุษย์ 2 รูปแบบ: สัญลักษณ์และภาพ


    1. การเลียนแบบกระบวนการสื่อสาร 2. การสร้างแบบจำลองการเจรจาที่มีประสิทธิภาพ โมเดลการสื่อสาร


    ไฮเปอร์เท็กซ์- วิธีพิเศษในการจัดระเบียบและนำเสนอข้อความซึ่งสามารถเชื่อมโยงข้อความหรือส่วนของข้อความหลาย ๆ อันเข้าด้วยกันได้โดยใช้การเชื่อมต่อประเภทต่างๆ


    ความแตกต่างระหว่างไฮเปอร์เท็กซ์และข้อความดั้งเดิม

    ไฮเปอร์เท็กซ์

      1. การประมวลผล คำพูดด้วยวาจา

    • 2. การประมวลผลข้อความที่เป็นลายลักษณ์อักษร


    การประมวลผลคำพูด

    1. การสังเคราะห์เสียงพูดอัตโนมัติ

    A) การพัฒนาซินธิไซเซอร์แปลงข้อความเป็นคำพูด ประกอบด้วย 2 บล็อก: บล็อกการประมวลผลข้อความทางภาษาและ บล็อกการสังเคราะห์เสียง

    2. การรู้จำเสียงพูดอัตโนมัติ


    1) การจดจำข้อความ

    2) การวิเคราะห์ข้อความ

    3) การสังเคราะห์ข้อความ


    IRS (ระบบสืบค้นข้อมูล)- นี้ ระบบซอฟต์แวร์เพื่อจัดเก็บ ค้นหา และเผยแพร่ข้อมูลที่น่าสนใจ

    ซาคารอฟ วี.พี. เชื่ออย่างนั้น ไอพีเอสเป็นชุดเอกสารและเทคโนโลยีสารสนเทศที่ได้รับคำสั่งซึ่งออกแบบมาเพื่อจัดเก็บและเรียกค้นข้อมูล - ข้อความหรือข้อมูล


    IPS 3 ประเภท

    IPS 3 ประเภท

      คู่มือ- นี่คือการค้นหาในห้องสมุด

    • เครื่องจักรกล IPS เป็นวิธีทางเทคนิคที่รับรองการเลือกเอกสารที่จำเป็น

    • อัตโนมัติ- การค้นหาข้อมูลโดยใช้คอมพิวเตอร์


    พจนานุกรมคอมพิวเตอร์

    พจนานุกรมคอมพิวเตอร์– หนึ่งในสาขาวิชาที่สำคัญของภาษาศาสตร์ประยุกต์ เกี่ยวข้องกับทฤษฎีและการปฏิบัติในการเรียบเรียงพจนานุกรม

    พจนานุกรมมี 2 ทิศทาง:
    • พจนานุกรมแบบดั้งเดิมรวบรวมพจนานุกรมแบบดั้งเดิม

    • พจนานุกรมศัพท์ของเครื่องเกี่ยวข้องกับการเตรียมพจนานุกรมอัตโนมัติและแก้ปัญหาการพัฒนาพจนานุกรมอิเล็กทรอนิกส์


    งานด้านพจนานุกรมคอมพิวเตอร์

    • รับพจนานุกรมต่างๆ จากข้อความโดยอัตโนมัติ

    • การสร้างพจนานุกรมที่เป็นพจนานุกรมแบบดั้งเดิมในรูปแบบอิเล็กทรอนิกส์หรือพจนานุกรมภาษาศาสตร์อิเล็กทรอนิกส์ที่ซับซ้อนสำหรับงานพจนานุกรมแบบดั้งเดิม เช่น LINGVO

    • การพัฒนาด้านทฤษฎีและปฏิบัติในการรวบรวมพจนานุกรมคอมพิวเตอร์พิเศษ เช่น การสืบค้นข้อมูล การแปลด้วยคอมพิวเตอร์


    เครื่องแปลภาษา

    เครื่องแปลภาษา– การแปลงข้อความในภาษาธรรมชาติภาษาหนึ่งเป็นภาษาธรรมชาติอีกภาษาหนึ่งโดยใช้คอมพิวเตอร์

    ประเภทของการแปลด้วยเครื่อง
    • แฟมที(การแปลด้วยเครื่องอัตโนมัติเต็มรูปแบบ) – การแปลอัตโนมัติเต็มรูปแบบ

    • แฮมท์(Human Aided Machine Translation) - การแปลด้วยเครื่องโดยมีส่วนร่วมของมนุษย์

    • คณิตศาสตรมหาบัณฑิต(การแปลโดยมนุษย์โดยใช้เครื่องช่วย) – การแปลดำเนินการโดยบุคคลที่ใช้ซอฟต์แวร์เสริมและเครื่องมือทางภาษา


    • 2) ส.ส.มืออาชีพ– การแปลคุณภาพสูงขึ้นตามด้วยการแก้ไขโดยมนุษย์

    • 3) ส.ส.แบบโต้ตอบ– ถือเป็นการแปลในระบบสนับสนุนพิเศษซึ่งเกิดขึ้นในโหมดสนทนากับระบบคอมพิวเตอร์ คุณภาพของ MP ขึ้นอยู่กับตัวเลือกการปรับแต่ง ทรัพยากร และประเภทของข้อความ

    คลังข้อความ

    คลังข้อความ- นี่คือชุดข้อความบางชุดซึ่งมีพื้นฐานมาจากแนวคิดเชิงตรรกะซึ่งเป็นแนวคิดเชิงตรรกะที่รวมข้อความเหล่านี้เข้าด้วยกัน

    คลังภาษา-ข้อมูลภาษาขนาดใหญ่ นำเสนอทางอิเล็กทรอนิกส์ เป็นหนึ่งเดียว มีโครงสร้าง มีป้ายกำกับ มีความสามารถทางปรัชญา ซึ่งออกแบบมาเพื่อแก้ปัญหาทางภาษาเฉพาะ


    ความเป็นตัวแทนเป็นทรัพย์สินที่สำคัญที่สุดของคลังข้อมูล


    วัตถุประสงค์ของคลังภาษาคือเพื่อแสดงการทำงานของหน่วยภาษาในสภาพแวดล้อมตามบริบทตามธรรมชาติ



    ขึ้นอยู่กับคลังข้อมูล คุณสามารถรับข้อมูลต่อไปนี้:

    1.เกี่ยวกับความถี่ของหมวดไวยากรณ์

    2.เกี่ยวกับการเปลี่ยนแปลงความถี่

    3.เกี่ยวกับการเปลี่ยนแปลงบริบทในช่วงเวลาต่างๆ

    5. เกี่ยวกับการเกิดขึ้นร่วมของหน่วยคำศัพท์

    6. เกี่ยวกับคุณสมบัติของความเข้ากันได้


    คณะสีน้ำตาล


    คลังข้อความ - นี่คือชุดข้อความบางชุดซึ่งมีพื้นฐานมาจากแนวคิดเชิงตรรกะซึ่งเป็นแนวคิดเชิงตรรกะที่รวมข้อความเหล่านี้เข้าด้วยกัน รูปลักษณ์ของแนวคิดเชิงตรรกะนี้ กฎเกณฑ์ในการจัดข้อความให้อยู่ในคลังข้อมูล อัลกอริธึมและโปรแกรมสำหรับวิเคราะห์คลังข้อความ อุดมการณ์และวิธีการวิทยาที่เกี่ยวข้อง กองพลแห่งชาติ แสดงถึงภาษาที่กำหนดในขั้นตอนหนึ่ง (หรือขั้นตอน) ของการดำรงอยู่และในความหลากหลายของประเภท รูปแบบ อาณาเขตและตัวแปรทางสังคม ฯลฯ เงื่อนไขพื้นฐานของภาษาศาสตร์เชิงคำนวณ

      ภาษาโปรแกรม (LP) คือคลาสของภาษาประดิษฐ์ที่ออกแบบมาเพื่อประมวลผลข้อมูลโดยใช้คอมพิวเตอร์ ภาษาโปรแกรมใดๆ ก็ตามเป็นระบบสัญญาณที่เข้มงวด (เป็นทางการ) โดยอาศัยความช่วยเหลือในการเขียนโปรแกรมคอมพิวเตอร์ ตามการประมาณการต่างๆ ขณะนี้มีภาษาการเขียนโปรแกรมที่แตกต่างกันระหว่างพันถึงหมื่น

    • วิทยาศาสตร์คอมพิวเตอร์(วิทยาศาสตร์คอมพิวเตอร์) -ศาสตร์แห่งรูปแบบการบันทึก การจัดเก็บ การประมวลผล การส่งผ่าน และการใช้ข้อมูลโดยใช้วิธีการทางเทคนิค



    ค้นหาข้อมูล (การสืบค้นข้อมูล) คือกระบวนการค้นหาเอกสารดังกล่าว (ข้อความ บันทึก และ

    ฯลฯ) ที่สอดคล้องกับคำขอที่ได้รับ

    « ระบบการสืบค้นข้อมูล (IPS) เป็นชุดเอกสารที่ได้รับคำสั่ง (อาร์เรย์ของเอกสาร) และเทคโนโลยีสารสนเทศที่ออกแบบมาเพื่อจัดเก็บและเรียกค้นข้อมูล - ข้อความ (เอกสาร) หรือข้อมูล (ข้อเท็จจริง)

    พจนานุกรมศัพท์ของเครื่อง(พจนานุกรมเชิงคำนวณ)เกี่ยวข้องกับระบบอัตโนมัติในการจัดทำพจนานุกรมและแก้ปัญหาการพัฒนาระบบอิเล็กทรอนิกส์

    พจนานุกรม

    เครื่องแปลภาษา คือการแปลงข้อความของคอมพิวเตอร์ให้เป็นหนึ่งเดียว

    ภาษาธรรมชาติให้กลายเป็นข้อความเทียบเท่าเนื้อหาในอีกรูปแบบหนึ่ง

    ภาษาธรรมชาติ

    ไฮเปอร์เท็กซ์ เป็นเทคโนโลยีในการจัดระเบียบข้อมูลและข้อความที่มีโครงสร้างพิเศษ แบ่งเป็นบล็อก ๆ แยกกัน มีการนำเสนอแบบไม่เชิงเส้น เพื่อการนำเสนอข้อมูลในสภาพแวดล้อมคอมพิวเตอร์อย่างมีประสิทธิภาพ


      กรอบ เป็นโครงสร้างสำหรับการนำเสนอความรู้ที่ประกาศเกี่ยวกับสถานการณ์ที่เป็นหนึ่งเดียวตามธีมที่พิมพ์ไว้ เช่น โครงสร้างข้อมูลเกี่ยวกับสถานการณ์แบบโปรเฟสเซอร์

    • สถานการณ์ - นี่เป็นลำดับของหลายตอนในเวลา และยังเป็นตัวแทนของสถานการณ์แบบโปรเฟสเซอร์หรือพฤติกรรมแบบโปรเฟสเซอร์ด้วย มีเพียงองค์ประกอบของสถานการณ์เท่านั้นที่เป็นขั้นตอนของอัลกอริทึมหรือคำสั่ง
    • วางแผน – การแสดงความรู้เกี่ยวกับการกระทำที่เป็นไปได้ที่จำเป็นเพื่อให้บรรลุเป้าหมายที่แน่นอน



    นักวิทยาศาสตร์ในสาขาภาษาศาสตร์คอมพิวเตอร์:

    • นักวิทยาศาสตร์โซเวียตและรัสเซีย: Alexey Lyapunov, Igor Melchuk, Olga Kulagina, Yu.D. Apresyan, N.N. Leontyeva, Yu.S. Martemyanov, Z.M. ชาเลียพินา, อิกอร์ โบกุสลาฟสกี้, A.S. นาริญญานี เอ.อี. คิบริก, บารานอฟ A.N.

    • นักวิทยาศาสตร์ชาวตะวันตกนักแสดงนำ:โยริค วิลค์ส, เกรกอรี เกรเฟนสเต็ตต์, กราวิล คอร์เบตต์, จอห์น แคร์โรลล์, ไดอาน่า แม็กคาร์ธี, หลุยส์ มาร์เกซ, แดน มอลโดแวน, โจอาคิม นิฟร์, วิคเตอร์ ราสกิน, เอดูอาร์ด โฮวีย์


    สมาคมและการประชุมทางภาษาศาสตร์คอมพิวเตอร์:
    • "บทสนทนา"- การประชุมหลักของรัสเซียเมื่อวันที่ ภาษาศาสตร์เชิงคำนวณด้วยการมีส่วนร่วมระดับนานาชาติ

    ลำดับความสำคัญของการสนทนาคือ การสร้างแบบจำลองคอมพิวเตอร์ภาษารัสเซีย. ภาษาที่ใช้ในการประชุมคือภาษารัสเซียและภาษาอังกฤษ เพื่อดึงดูดผู้วิจารณ์จากต่างประเทศ ผลงานที่สมัครจำนวนมากจะถูกส่งเป็นภาษาอังกฤษ

    ทิศทางหลักของการประชุม:
    • ความหมายทางภาษาศาสตร์และการวิเคราะห์ความหมาย

    • แบบจำลองภาษาทางการและการประยุกต์

    • ทฤษฎีและคอมพิวเตอร์ พจนานุกรม

    • วิธีการประเมินการวิเคราะห์ข้อความและระบบการแปลด้วยเครื่อง

    • ภาษาศาสตร์คอร์ปัส. การสร้าง การประยุกต์ การประเมินองค์กร

    • อินเทอร์เน็ตเป็นทรัพยากรทางภาษา เทคโนโลยีทางภาษาบนอินเทอร์เน็ต

    • อภิปรัชญา. การสกัดความรู้จากข้อความ

    • การวิเคราะห์เอกสารด้วยคอมพิวเตอร์: บทคัดย่อ การจัดหมวดหมู่, ค้นหา

    • การวิเคราะห์ความรู้สึกอัตโนมัติของข้อความ

    • เครื่องแปลภาษา

    • รูปแบบของการสื่อสาร การสื่อสาร บทสนทนา และ คำพูด

    • การวิเคราะห์และ การสังเคราะห์คำพูด



    2. สมาคมภาษาศาสตร์คอมพิวเตอร์ (เอซีแอล)เป็นวิทยาศาสตร์ระดับนานาชาติและ สังคมวิชาชีพคนที่ทำงานเกี่ยวกับปัญหาเกี่ยวกับภาษาธรรมชาติและคอมพิวเตอร์ การประชุมประจำปีจะจัดขึ้นทุกฤดูร้อนในสถานที่ที่มีการดำเนินการวิจัยภาษาศาสตร์เชิงคำนวณที่สำคัญ ก่อตั้งเมื่อปี พ.ศ. 2505 เดิมชื่อ สมาคมการแปลด้วยเครื่องและภาษาศาสตร์คอมพิวเตอร์ (เอเอ็มทีซีแอล). ในปี พ.ศ. 2511 ได้กลายเป็น ACL
    • UACL มีแบบยุโรปด้วย (EACL)และอเมริกาเหนือ (เอ็นเอเอซีแอล)สาขา

    • วารสารเอซีแอล ภาษาศาสตร์เชิงคำนวณเป็นฟอรัมชั้นนำสำหรับการวิจัยด้านภาษาศาสตร์เชิงคำนวณและการประมวลผลภาษาธรรมชาติ ตั้งแต่ปี 1988 นิตยสารดังกล่าวได้รับการตีพิมพ์สำหรับ ACL สำนักพิมพ์เอ็มไอที.
    • ชุดหนังสือ ACL การวิจัยด้านการประมวลผลภาษาธรรมชาติ, ที่ตีพิมพ์ สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์.

    • ทุกปี ACL และสาขาต่างๆ จะจัดการประชุมระดับนานาชาติในประเทศต่างๆ

    ACL 2014 จัดขึ้นที่เมืองบัลติมอร์ ประเทศสหรัฐอเมริกา

    • อ้างอิง:

    • 1. มาร์ชุก ยู.เอ็น. ภาษาศาสตร์คอมพิวเตอร์: หนังสือเรียน/Yu.N. Marchuk.- M.:AST: ตะวันออก-ตะวันตก, 2550-317 หน้า

    • 2. ชิลิขินา ก.เอ็ม. พื้นฐานของภาษาศาสตร์ประยุกต์: หนังสือเรียนเฉพาะทาง 021800 (031301) - ภาษาศาสตร์เชิงทฤษฎีและประยุกต์, Voronezh, 2549

    • 3. Boyarsky K.K. ความรู้เบื้องต้นเกี่ยวกับภาษาศาสตร์เชิงคำนวณ หนังสือเรียน - เซนต์ปีเตอร์สเบิร์ก: NRU ITMO, 2013. - 72 น.

    • 4. ชชิปิตซินา แอล.ยู. เทคโนโลยีสารสนเทศทางภาษาศาสตร์: หนังสือเรียน / L.Yu. Shchipitsina.- ม.: FLINTA: วิทยาศาสตร์, 2013.- 128 หน้า

    • 5. ซอสนินา อี.พี. ภาษาศาสตร์ประยุกต์เบื้องต้น: หนังสือเรียน / E.P. Sosnina. - ฉบับที่ 2, แก้ไขใหม่ และเพิ่มเติม – Ulyanovsk: มหาวิทยาลัยเทคนิคแห่งรัฐ Ulyanovsk, 2012. -110 น.

    • 6. บารานอฟ เอ.เอ็น. ภาษาศาสตร์ประยุกต์เบื้องต้น: หนังสือเรียน - อ.: บทบรรณาธิการ URSS, 2544 - 360 หน้า

    • 7. ภาษาศาสตร์ประยุกต์: หนังสือเรียน / L.V. บอนดาร์โก แอล.เอ. Verbitskaya, G.Ya. Martynenko และคนอื่น ๆ ; ตัวแทน บรรณาธิการ A.S. เกิร์ด. เซนต์ปีเตอร์สเบิร์ก: สำนักพิมพ์เซนต์ปีเตอร์สเบิร์ก ม. 2539.- 528 น.

    • 8. เชมยาคิน ยู.ไอ. จุดเริ่มต้นของภาษาศาสตร์คอมพิวเตอร์: หนังสือเรียน อ.: สำนักพิมพ์ MGOU, JSC "Rosvuznauka", 1992.