مطالعه جدید نشان میدهد که چرا مدلهای هوش مصنوعی با استدلال شبیهسازیشده هنوز به وعدههای خود عمل نمیکنند.

### عملکرد مدلهای هوش مصنوعی در حل مسائل و ارائه اثباتهای ریاضی
مدلهای هوش مصنوعی پیشرفته در حل مسائل ریاضی عالی عمل میکنند، اما در ارائه اثباتهای ریاضی برای مسابقات مانند المپیاد ریاضی ناکام میمانند. یک پژوهش جدید نشان میدهد که این مدلها در حل مسائل روتینی ریاضی بسیار دقیق هستند، اما در ارائه اثباتهای عمیق ریاضی که در مسابقات سطح بالا لازم است، شکست میخورند.
#### نتایج مطالعه
مطالعه این مدلها در برابر مسائل المپیاد ریاضی آمریکا در سال 2025 نشان داد که بیشتر مدلها در ارائه اثباتهای کامل معتبر زیر 5 درصد امتیاز کسب کردند، اما یک مدل بهتر عمل کرد، با این حال همچنان محدود بود.
#### تفاوت در عملکرد
این تفاوت در عملکرد بین حل مسائل و ارائه اثباتها نشان میدهد که مدلهای هوش مصنوعی در شناسایی الگوها و ارائه پاسخهای عددی دقیق هستند، اما در ارائه اثباتهای ریاضی که نیاز به درک عمیق مفاهیم و استدلالهای منطقی دارند، کاملاً موفق نیستند. این ناکامی ممکن است به دلیل روشهای آموزش و بهینهسازی مدلها باشد که بر اساس تکنیکهایی همچون یافتن پاسخ نهایی در قالبی خاص هستند.
#### رویکردهای جدید برای بهبود
برخی از پژوهشگران رویکردهای جدیدی مانند ادغام موتورهای استدلال نمادین، ایجاد تکنیکهای بهتر برای بررسی اثباتها و استفاده از بررسیهای خودسازگاری را برای بهبود استدلال هوش مصنوعی در نظر گرفتهاند. با این حال، بهبود مدلهای فعلی به تنهایی ممکن است شکاف بین استدلال ماشینی و انسانی را پر نکن