گوناگون

آیا ChatGPT بی‌طرف خواهد شد؟ تلاش سازنده برای اصلاح الگوریتم‌ها

اوپن‌ای‌آی ضمن انجام چندین آزمایش متفاوت، می‌گوید ChatGPT نباید سوگیری سیاسی داشته باشد.

به گزارش پارسینه به نقل از زومیت، اوپن‌ای‌آی در بیانیه‌ی جدیدش اعلام کرد که ChatGPT نباید در هیچ جهتی سوگیری سیاسی داشته باشد. به گفته‌ی این شرکت، مدل‌های GPT-5 بیش از هر نسخه‌ی پیشین به این هدف نزدیک شده‌اند.

نتیجه‌ی ارزیابی از یک «آزمون فشار داخلی» به‌دست آمده که واکنش چت‌بات را نسبت‌به موضوعات بحث‌برانگیز بررسی کرده و حاصل ماه‌ها کار تیمی بوده است. این تلاش در ادامه‌ی برنامه‌ی چندساله‌ی اوپن‌ای‌آی برای پاسخ‌دادن به انتقادها درباره‌ی تمایل احتمالی مدل‌هایش به دیدگاه‌های خاص سیاسی انجام شد.

اوپن‌ای‌آی بررسی کرد که ChatGPT چگونه به پرسش‌های بی‌طرف و همچنین پرسش‌هایی با بار سیاسی پاسخ می‌دهد. برای هر یک از ۱۰۰ موضوع (از مهاجرت گرفته تا بارداری)، پنج نوع پرسش طراحی شده بود که از زاویه‌ی لیبرال، محافظه‌کار، خنثی و مواردی با لحن «احساسی» مطرح می‌شدند. چهار مدل در این بررسی شرکت داشتند: نسخه‌های پیشین GPT-4o و OpenAI o3 و دو مدل جدید GPT-5 instant و GPT-5 thinking.

پاسخ‌های ChatGPT سپس توسط یک مدل زبانی دیگر ارزیابی شدند. این مدل با استفاده از معیارهایی مانند «تقویت موضع سیاسی»، «بی‌اعتبارسازی دیدگاه کاربر» یا «ارائه‌ی نظر شخصی به‌جای تحلیل بی‌طرفانه» موارد سوگیری را شناسایی می‌کرد. به‌عنوان نمونه، اگر چت‌بات واژه‌ای از متن کاربر را در گیومه قرار می‌داد، این رفتار نوعی رد ضمنی دیدگاه او تلقی می‌شد.

اوپن‌ای‌آی در مثالی توضیح داده که نسخه‌ی قدیمی ChatGPT در پاسخ به پرسشی درباره‌ی کمبود خدمات سلامت روان در آمریکا گفته بود: «غیرقابل‌قبول است که افراد باید هفته‌ها یا ماه‌ها برای دیدن پزشک منتظر بمانند.» در حالی که نسخه‌ی بی‌طرف‌تر به‌جای قضاوت، تنها بر «کمبود متخصصان سلامت روان، به‌ویژه در مناطق روستایی و کم‌درآمد» و مخالفت‌های بیمه‌ها یا دولت تمرکز می‌کرد.

نتایج کلی نشان می‌دهد سوگیری در پاسخ‌ها «به‌ندرت و با شدت کم» مشاهده شده است، اگرچه پرسش‌های احساسی بیشتر موجب لغزش در بی‌طرفی شده‌اند. مدل‌های GPT-5 نسبت به نسخه‌های پیشین، ۳۰ درصد نمره‌ی سوگیری کمتری گرفتند و در برابر پرسش‌های تحریک‌آمیز مقاومت بیشتری نشان دادند. موارد معدود سوگیری معمولاً به‌صورت بیان دیدگاه شخصی یا تقویت لحن احساسی کاربر ظاهر شد.

اوپن‌ای‌آی پیش‌تر اقداماتی برای کاهش سوگیری انجام داده بود؛ از جمله افزودن تنظیمات کنترل لحن در ChatGPT و انتشار عمومی Model Spec یا فهرست رفتارهای هدف‌گذاری‌شده‌ی چت‌بات.

اوپن‌ای‌آی فهرست کامل موضوعات مورد استفاده در آزمایش را منتشر نکرده، اما می‌گوید این موارد در هشت دسته‌ی کلی قرار می‌گرفتند؛ از جمله «فرهنگ و هویت» و «حقوق و مسائل اجتماعی» که هر دو از محورهای اصلی مورد توجه دولت فعلی آمریکا محسوب می‌شوند.