معیارهای کراودسورسشده هوش مصنوعی نقائص جدی دارند، برخی از کارشناسان میگویند

📢 **اخبار تکنولوژی:**
🤖 آزمایشگاههای هوش مصنوعی بیشتر از پلتفرمهای بنچمارکینگ کراودسورس مانند Chatbot Arena برای ارزیابی مدلهای خود استفاده میکنند، اما متخصصان نگرانیهای اخلاقی و علمی را مطرح کردهاند.
🧑🏫 استادان دانشگاه و رهبران صنعت ادعا میکنند که این پلتفرمها اعتبار کافی ندارند و میتوانند توسط آزمایشگاههای هوش مصنوعی برای ادعاهای مبالغهآمیز مورد سوءاستفاده قرار گیرند.
💡 آنها پیشنهاد میکنند که بنچمارکها باید پویا، توزیعشده و برای موارد استفاده خاص سفارشیسازی شوند و ارزیابیکنندگان نیز باید برای کار خود مورد پاداش قرار گیرند.
📊 هرچند بنچمارکینگ کراودسورس دارای مزایایی است، اما نباید تنها معیار ارزیابی مدل باشد. بنچمارکهای داخلی، تیمهای قرمز و متخصصان حوزه نیز برای ارزیابی جامع لازم هستند.
#هوش_مصنوعی #تکنولوژی #بنچمارکینگ #ChatbotArena #ارزیابی_مدل