پشت صحنه پدیده جدید هوش مصنوعی در جهان
ساعت 24 - این روزها بعید است کسی اینترنتگردی کند و این طرف و آن طرف چشمش به «چت جیپیتی» و ساعت 24- زلزلهای که به راه انداخته نیفتد. این پدیده در نام خود اشارهای مختصر به فناوری پیشرفتهای دارد که پیش از این برای عموم چندان شناختهشده نبود.
۱. تولیدگر: در مبحث پردازش زبان طبیعی، تولیدگر به این معنی است که مدل قادر به تولید متن جدیدی است که شبیه به زبان انسان باشد. این متن جدید میتواند شامل جملهها، پاراگرافها و یا عبارتهای طولانیتر منسجم و مناسب باشد.
۲. از پیش آموزشدیده: این عبارت به مرحله اولیه آموزشدهی مدل زبانی اشاره دارد. در طول این پروسه، مدل زبانی با استفاده از مجموعه بزرگی از متون اینترنتی یا منابع دیگری که در اختیار دارد یاد میگیرد کلمه بعدی در یک جمله را بر اساس کلمات قبلی پیشبینی کند.این فرآیند مدل را قادر می سازد تصویرسازی درستی از الگوهای آماری و روابط موجود بین دادهها داشته باشد.
۳. ترانسفورمر: این کلمه اشاره به نوع خاصی از معماری یادگیری عمیق دارد. این معماری با استفاده از سازوکارهایی که از آن برخوردار است مدل را قادر میسازد تا به هنگام تولید خروجی، اهمیت کلمات مختلف در ورودی را بسنجد و در نظر بگیرد.ترانسفورمرها به دلیل تواناییشان در مدیریت داده و و قابلیت موازیسازیشان در پردازش زبان طبیعی محبوب شدهاند.در حال حاضر چت جیپیتی و شرکت سازندهاش اوپن ایآی شناختهشدهترین نامهای حوزه «ترانسفورمر از پیش آموزشدیده» هستند، با این حال شرکتهای متعددی وجود دارند که وارد گردونه رقابت با آن شدهاند.