سلسله مراتب زبان های چامسکی یک سیستم طبقه بندی است که گرامرهای رسمی را بر اساس قدرت تولیدی آنها دسته بندی می کند. در دهه 1950 توسط نوام چامسکی، زبان شناس و دانشمند کامپیوتر مشهور، پیشنهاد شد. این سلسله مراتب از چهار سطح تشکیل شده است که هر یک کلاس متفاوتی از زبان های رسمی را نشان می دهد. این سطوح با نام های Type-3 (معمول)، Type-2 (Free-Context)، Type-1 (Context-Sensitive) و Type-0 (Unrestricted) شناخته می شوند.
در پایین ترین سطح سلسله مراتب، ما زبان های نوع 3 را داریم که به عنوان زبان های منظم نیز شناخته می شوند. این زبان ها را می توان با خودکارهای متناهی، مانند خودکارهای متناهی قطعی و غیر قطعی، شناخت. زبان های منظم با عبارات منظم و دستور زبان های منظم مشخص می شوند. عبارات با قاعده عبارتهای جبری هستند که الگوهای رشتهها را توصیف میکنند، در حالی که گرامرهای منظم شامل قوانین تولیدی است که رشتهها را در یک زبان منظم تولید میکنند. یک مثال از یک زبان منظم مجموعه ای از تمام رشته هایی است که با یک عبارت منظم مطابقت دارند، مانند زبان همه رشته های باینری با تعداد زوج 0.
با حرکت به سمت بالا، با زبانهای نوع ۲ مواجه میشویم که به زبانهای Context-Free نیز شناخته میشوند. این زبانها را میتوان با خودکارهای فشاری شناسایی کرد، که خودکارهای محدودی هستند که با یک پشته تقویت شدهاند. زبانهای بدون زمینه توسط گرامرهای بدون زمینه توصیف میشوند، که از قوانین تولیدی تشکیل شدهاند که رشتههایی را در یک زبان بدون متن ایجاد میکنند. گرامرهای بدون زمینه دارای نمادهای غیر پایانی، نمادهای پایانی و قوانین تولید هستند که مشخص می کنند چگونه می توان غیر پایانه ها را با دنباله ای از نمادها جایگزین کرد. نمونهای از یک زبان بدون متن، مجموعهای از تمام عبارات حسابی است که به خوبی شکل گرفتهاند، که در آن پرانتزها متعادل هستند و عملگرها به درستی اعمال میشوند.
سطح بعدی سلسله مراتب، زبانهای نوع 1 است که به زبانهای حساس به زمینه نیز شناخته میشوند. این زبان ها را می توان با خودکارهای محدود خطی که اتوماتای محدود با نواری هستند که می توانند در هر دو جهت حرکت کنند، شناسایی کرد. زبانهای حساس به متن توسط گرامرهای حساس به متن توصیف میشوند که از قوانین تولید تشکیل شدهاند که رشتههایی را در یک زبان حساس به متن ایجاد میکنند. گرامرهای حساس به زمینه دارای محدودیت اضافی هستند که طول سمت راست یک قانون تولید نمی تواند کوتاهتر از طول سمت چپ باشد. نمونهای از زبان حساس به متن، مجموعهای از تمام پالیندرومها است، که در آن یک رشته یکسان به جلو و عقب میخواند.
در نهایت، در بالای سلسله مراتب، زبانهای Type-0 را داریم که به نام زبانهای Unrestricted نیز شناخته میشوند. این زبان ها را می توان توسط ماشین های تورینگ که دستگاه های محاسباتی انتزاعی هستند که قادر به شبیه سازی هر الگوریتم کامپیوتری هستند، تشخیص داد. زبان های نامحدود توسط دستور زبان های نامحدود توصیف می شوند که هیچ محدودیتی در قوانین تولید ندارند. یک مثال از یک زبان نامحدود، مجموعه ای از تمام زبان های بازگشتی قابل شمارش است که شامل همه زبان های قابل محاسبه است.
سلسله مراتب زبان های چامسکی چارچوبی سیستماتیک برای طبقه بندی گرامرهای رسمی بر اساس قدرت تولیدی آنها فراهم می کند. این زبان با زبانهای معمولی که کمترین قدرت را دارند شروع میشود و به زبانهای بدون متن، حساس به بافت و بدون محدودیت پیش میرود که به طور فزایندهای قدرتمندتر میشوند. این سلسله مراتب یک مفهوم اساسی در زمینه نظریه پیچیدگی محاسباتی است و پیامدهای مهمی برای مطالعه زبان های رسمی و خودکار دارد.
سایر پرسش ها و پاسخ های اخیر در مورد سلسله مراتب Chomsky و زبانهای حساس به متن:
- این که یک زبان از زبان دیگر قدرتمندتر است به چه معناست؟
- آیا روش های فعلی برای تشخیص نوع 0 وجود دارد؟ آیا انتظار داریم کامپیوترهای کوانتومی آن را عملی کنند؟
- فرآیند طراحی گرامر حساس به بافت را برای زبانی که از رشته هایی با تعداد مساوی یک، دو و سه تشکیل شده است، توضیح دهید.
- یک مثال از یک زبان حساس به بافت را بیاورید و توضیح دهید که چگونه می توان آن را با گرامر حساس به متن تشخیص داد.
- زبانهای نوع 0 که بهعنوان زبانهای قابل شمارش بازگشتی نیز شناخته میشوند، از نظر پیچیدگی محاسباتی با انواع دیگر زبانها چه تفاوتی دارند؟
- تفاوت زبانهای بدون بافت و زبانهای حساس به متن را از نظر قواعد حاکم بر شکلگیری آنها توضیح دهید.