معیارهای کراودسورس‌شده هوش مصنوعی نقائص جدی دارند، برخی از کارشناسان می‌گویند

yasingholami86
techcrunch

📢 **اخبار تکنولوژی:**

🤖 آزمایشگاه‌های هوش مصنوعی بیشتر از پلتفرم‌های بنچمارکینگ کراودسورس مانند Chatbot Arena برای ارزیابی مدل‌های خود استفاده می‌کنند، اما متخصصان نگرانی‌های اخلاقی و علمی را مطرح کرده‌اند.

🧑‍🏫 استادان دانشگاه و رهبران صنعت ادعا می‌کنند که این پلتفرم‌ها اعتبار کافی ندارند و می‌توانند توسط آزمایشگاه‌های هوش مصنوعی برای ادعاهای مبالغه‌آمیز مورد سوءاستفاده قرار گیرند.

💡 آن‌ها پیشنهاد می‌کنند که بنچمارک‌ها باید پویا، توزیع‌شده و برای موارد استفاده خاص سفارشی‌سازی شوند و ارزیابی‌کنندگان نیز باید برای کار خود مورد پاداش قرار گیرند.

📊 هرچند بنچمارکینگ کراودسورس دارای مزایایی است، اما نباید تنها معیار ارزیابی مدل باشد. بنچمارک‌های داخلی، تیم‌های قرمز و متخصصان حوزه نیز برای ارزیابی جامع لازم هستند.

#هوش_مصنوعی #تکنولوژی #بنچمارکینگ #ChatbotArena #ارزیابی_مدل