مطالعه جدید نشان می‌دهد که چرا مدل‌های هوش مصنوعی با استدلال شبیه‌سازی‌شده هنوز به وعده‌های خود عمل نمی‌کنند.

yasingholami86
arstechnica, اخبار

### عملکرد مدل‌های هوش مصنوعی در حل مسائل و ارائه اثبات‌های ریاضی

مدل‌های هوش مصنوعی پیشرفته در حل مسائل ریاضی عالی عمل می‌کنند، اما در ارائه اثبات‌های ریاضی برای مسابقات مانند المپیاد ریاضی ناکام می‌مانند. یک پژوهش جدید نشان می‌دهد که این مدل‌ها در حل مسائل روتینی ریاضی بسیار دقیق هستند، اما در ارائه اثبات‌های عمیق ریاضی که در مسابقات سطح بالا لازم است، شکست می‌خورند.

#### نتایج مطالعه

مطالعه این مدل‌ها در برابر مسائل المپیاد ریاضی آمریکا در سال 2025 نشان داد که بیشتر مدل‌ها در ارائه اثبات‌های کامل معتبر زیر 5 درصد امتیاز کسب کردند، اما یک مدل بهتر عمل کرد، با این حال همچنان محدود بود.

#### تفاوت در عملکرد

این تفاوت در عملکرد بین حل مسائل و ارائه اثبات‌ها نشان می‌دهد که مدل‌های هوش مصنوعی در شناسایی الگوها و ارائه پاسخ‌های عددی دقیق هستند، اما در ارائه اثبات‌های ریاضی که نیاز به درک عمیق مفاهیم و استدلال‌های منطقی دارند، کاملاً موفق نیستند. این ناکامی ممکن است به دلیل روش‌های آموزش و بهینه‌سازی مدل‌ها باشد که بر اساس تکنیک‌هایی همچون یافتن پاسخ نهایی در قالبی خاص هستند.

#### رویکردهای جدید برای بهبود

برخی از پژوهشگران رویکردهای جدیدی مانند ادغام موتورهای استدلال نمادین، ایجاد تکنیک‌های بهتر برای بررسی اثبات‌ها و استفاده از بررسی‌های خودسازگاری را برای بهبود استدلال هوش مصنوعی در نظر گرفته‌اند. با این حال، بهبود مدل‌های فعلی به تنهایی ممکن است شکاف بین استدلال ماشینی و انسانی را پر نکن