چتبات هوشمصنوعی همسطح یک پزشک متخصص!
ساعت 24- نتیجهی مطالعهای جدید نشان میدهد ChatGPT در حوزهی چشمپزشکی عملکرد بسیار خوبی دارد.
به گزارش فایننشال تایمز، مطالعهای جدید از دانشکدهی پزشکی بالینی دانشگاه کمبریج نشان میدهد که هوش مصنوعی GPT-۴ در ارزیابی چشمپزشکی تقریباً به خوبی یک متخصص در این زمینه عمل میکند. محققان، مدلهای زبانی بزرگ GPT-۳.۵ و Palm ۲ و LLaMA را با ۸۷ سوال چند گزینهای آزمایش کردند. پنج چشمپزشک متخصص، سه کارآموز چشمپزشکی و دو پزشک غیرمتخصص جوان در آزمون آزمایشی یکسان شرکت کردند.
سوالات در مورد همه چیز از حساسیت به نور گرفته تا آسیب جدی به چشم مطرح شد. پاسخ این سوالات به صورت عمومی در دسترس نبودند، بنابراین محققان معتقدند که مدلهای زبانی بزرگ از قبل در مورد آنها آموزش ندیدهاند.
GPT-۴ امتیاز بالاتری نسبت به کارآموزان و پزشکان جوان کسب کرد و ۶۰ سوال را به درستی پاسخ داد. در حالی که پزشکان بهطور میانگین به ۳۷ سوال پاسخ درست دادند. پزشکان متخصص به ۵۶ سوال پاسخ دقیقی ارئه کردند؛ اما با میانگین نمرهی ۶۶٫۴ نشان دادند که همچنان از هوش مصنوعی جلوترند.
PalM ۲ به ۴۹ سوال و GPT-۳.۵ به ۴۲ سوال به درستی جواب دادند. LLaMA با ۲۸ پاسخ درست کمترین امتیاز را بین مدلهای زبانی بزرگ دیگر بهدست آورد.
محققان خاطرنشان کردند که مطالعهی جدیدشان تعداد محدودی سوال ارائه کرد، به خصوص در دستههای خاص؛ به این معنی که نتایج واقعی ممکن است متفاوت باشد. مدلهای زبانی بزرگ ذاتاً تمایل به «توهم» یا ساختن چیزهای مختلف دارند. مثلاً تشخیص اشتباه وجود آب مروارید یا سرطان و بهطور کلی دقت پایین در تشخیص بیماری میتواند عواقب بسیار خطرناکی داشته باشد.
زومیت
ساعت 24 از انتشار نظرات حاوی توهین و افترا و نوشته شده با حروف لاتین (فینگیلیش) معذور است.