آیا ChatGPT بیطرف خواهد شد؟ تلاش سازنده برای اصلاح الگوریتمها

اوپنایآی ضمن انجام چندین آزمایش متفاوت، میگوید ChatGPT نباید سوگیری سیاسی داشته باشد.
به گزارش پارسینه به نقل از زومیت، اوپنایآی در بیانیهی جدیدش اعلام کرد که ChatGPT نباید در هیچ جهتی سوگیری سیاسی داشته باشد. به گفتهی این شرکت، مدلهای GPT-5 بیش از هر نسخهی پیشین به این هدف نزدیک شدهاند.
نتیجهی ارزیابی از یک «آزمون فشار داخلی» بهدست آمده که واکنش چتبات را نسبتبه موضوعات بحثبرانگیز بررسی کرده و حاصل ماهها کار تیمی بوده است. این تلاش در ادامهی برنامهی چندسالهی اوپنایآی برای پاسخدادن به انتقادها دربارهی تمایل احتمالی مدلهایش به دیدگاههای خاص سیاسی انجام شد.
اوپنایآی بررسی کرد که ChatGPT چگونه به پرسشهای بیطرف و همچنین پرسشهایی با بار سیاسی پاسخ میدهد. برای هر یک از ۱۰۰ موضوع (از مهاجرت گرفته تا بارداری)، پنج نوع پرسش طراحی شده بود که از زاویهی لیبرال، محافظهکار، خنثی و مواردی با لحن «احساسی» مطرح میشدند. چهار مدل در این بررسی شرکت داشتند: نسخههای پیشین GPT-4o و OpenAI o3 و دو مدل جدید GPT-5 instant و GPT-5 thinking.
پاسخهای ChatGPT سپس توسط یک مدل زبانی دیگر ارزیابی شدند. این مدل با استفاده از معیارهایی مانند «تقویت موضع سیاسی»، «بیاعتبارسازی دیدگاه کاربر» یا «ارائهی نظر شخصی بهجای تحلیل بیطرفانه» موارد سوگیری را شناسایی میکرد. بهعنوان نمونه، اگر چتبات واژهای از متن کاربر را در گیومه قرار میداد، این رفتار نوعی رد ضمنی دیدگاه او تلقی میشد.
اوپنایآی در مثالی توضیح داده که نسخهی قدیمی ChatGPT در پاسخ به پرسشی دربارهی کمبود خدمات سلامت روان در آمریکا گفته بود: «غیرقابلقبول است که افراد باید هفتهها یا ماهها برای دیدن پزشک منتظر بمانند.» در حالی که نسخهی بیطرفتر بهجای قضاوت، تنها بر «کمبود متخصصان سلامت روان، بهویژه در مناطق روستایی و کمدرآمد» و مخالفتهای بیمهها یا دولت تمرکز میکرد.
نتایج کلی نشان میدهد سوگیری در پاسخها «بهندرت و با شدت کم» مشاهده شده است، اگرچه پرسشهای احساسی بیشتر موجب لغزش در بیطرفی شدهاند. مدلهای GPT-5 نسبت به نسخههای پیشین، ۳۰ درصد نمرهی سوگیری کمتری گرفتند و در برابر پرسشهای تحریکآمیز مقاومت بیشتری نشان دادند. موارد معدود سوگیری معمولاً بهصورت بیان دیدگاه شخصی یا تقویت لحن احساسی کاربر ظاهر شد.
اوپنایآی پیشتر اقداماتی برای کاهش سوگیری انجام داده بود؛ از جمله افزودن تنظیمات کنترل لحن در ChatGPT و انتشار عمومی Model Spec یا فهرست رفتارهای هدفگذاریشدهی چتبات.
اوپنایآی فهرست کامل موضوعات مورد استفاده در آزمایش را منتشر نکرده، اما میگوید این موارد در هشت دستهی کلی قرار میگرفتند؛ از جمله «فرهنگ و هویت» و «حقوق و مسائل اجتماعی» که هر دو از محورهای اصلی مورد توجه دولت فعلی آمریکا محسوب میشوند.
ارسال نظر