ChatGPT یک رقیب جدید دارد که به نام claude 2 شناخته میشود و سازندگان آن را به عنوان یک همکار صمیمی، مشتاق و یا دستیار شخصی معرفی کردهاند.
شرکت هوش مصنوعی آنتروپ، با مقر در سان فرانسیسکو، نسل دوم چتبات تولید زبان طبیعی خود را راهاندازی کرده و با ادعای جسورانهای کلود 2 را به بازار عرضه کرده است.
به گفته آنتروپ، کلود 2 عملکرد بهتری دارد و میتواند پاسخهای طولانیتری ارائه دهد. همچنین، در زمینه کدنویسی، ریاضی و استدلال پیشرفتهایی داشته است. کلود 2 همچنین قادر است 100 توکن ورودی یا خروجی را مدیریت کند که معادل 75 هزار کلمه اطلاعات است، به این معنی که میتواند به سوالات ساده و گزارشهای پیچیده پاسخ دهد.
در محیط واقعی، آنتروپ اعلام کرده است که کلود 2 در آزمون بخش چند گزینهای با نمره 76.5 Q عملکرد خوبی داشته است که نسبت به کلود 1.3 با نمره 73.0 Q و در آزمونهای خواندن و نوشتن GRE نمرهای بالاتر از 90 Q کسب کرده است. من نیز آن را تست کردهام.
من آن را امتحان کردم
استفاده از کلود 2 بسیار ساده است و به دلیل تمایل انویدیا به اعطای مجوز چتبات به کسب و کارها، این موضوع تعجبآوری نیست. در مدت زمان محدودی که از آن استفاده کردهام، کلود 2 به سرعت به سوالات من پاسخ داد.
همچنین به نظر میرسید که چگونه دوست دارم اطلاعات به من ارائه شود و پس از درخواست کوتاه کردن یک پاسخ طولانی، یک سری نکات را برای تمام سوالات آینده انتخاب کرد.

کلود 2 به نظر میرسد مهارتهای کدنویسی خود را بهبود بخشیده و در تست کدنویسی پایتون به نام Codex HumanEval، امتیاز 71.2 Q را کسب کرده است. در همان تست، نسل قبلی تنها به 56.0 Q رسیده بود. در مجموعهی GSM8k، مجموعهای از مسائل ریاضی دورهی دبیرستان، کلود 2 امتیاز 88.0 Q را کسب کرده است که بیشتر از 85.2 Q است.
به طور علاوه، انویدیا برنامههای جذابی برای بهبود قابلیتهای کلود 2 در دست دارد. انویدیا بتای عمومی کلود 2 را برای ساکنان ایالات متحده و انگلستان راهاندازی کرده است.
در کل، تجربه استفاده از کلود 2 بسیار ساده است. پاسخهایی که دریافت کردم، صحیح و شخصیسازی شده بودند. اما جالب خواهد بود که ببینیم تا چه حد میتوانیم کلود را با زمان بیشتری آزمایش کنیم.
کلود 2: تکنولوژی جدید ایمن

کلود 2 یکی از اولین رباتها است که از تکنیکهای جدید ایمنی استفاده میکند. این تکنیکها در یک سال گذشته برای بهبود نتایج و جلوگیری از استفادههای خطرناک هوش مصنوعی مولد مانند چتباتها و دیپفیکها معرفی شدهاند.
این تکنیکها شامل مدلهای آموزشی با یادگیری تقویتی از بازخورد انسانی (RLHF) هستند. به این ترتیب، کلود 2 دارای توانایی “اصلاح اخلاقی خود” و همچنین قابلیت تشخیص و توضیح درخواستهای نامناسب با هوش مصنوعی قانونی است.
به طور نتیجه، کلود 2 بهبود چشمگیری در ارائه پاسخهای بیضرر نسبت به نسل قبلی خود، کلود 1.3، داشته است.

تلاش برای ایمنسازی چتباتها ممکن است نهادهای دولتی را که به طور فزایندهای بر روی خطرات بالقوه ناشی از ظهور مدلهای هوش مصنوعی مولد مانند چتباتها و دیپفیکها تمرکز دارند، راضی کند.
کاخ سفید نیز طرحی برای تنظیم هوش مصنوعی ارائه کرده است که حوزههایی مانند تعصب، حریم خصوصی و اطلاعات نادرست را پوشش میدهد. در اروپا، اتحادیه اروپا قوانین سختگیرانهتری را برای سیستمهای هوش مصنوعی پرخطر با شفافیت و حفاظتهای نظارتی پیشنهاد کرده است. همچنین، FTC با استناد به قوانین حقیقت در تبلیغات، به شرکتها هشدار داده است که از فریبکاری هوش مصنوعی جلوگیری کنند.
رگولاتورها در انگلستان، استرالیا و دیگر کشورها نیز نگرانیهایی را در مورد استفاده از دادههای شخصی برای آموزش مدلها و سواستفاده از تولید محتوای مضر بیان کردهاند و قوانین جدیدی را برای جلوگیری از انتشار اطلاعات نادرست، تقلب در جعل هویت و سایر آسیبها در نظر گرفتهاند.
از زمان عرضه ChatGPT در اواخر سال 2022، توجه قانونگذاران و مقامها به آن جلب شده است و بیش از یک میلیون کاربر ثبتنام کردهاند تا این چتبات هوش مصنوعی را آزمایش کنند. غولهای فناوری دیگر نیز با الهام از محبوبیت این زبان، مدلهای زبان تولیدی عظیم خود مانند GPT-3 از گوگل، Sudowrite از OpenAI و Chatbot از مایکروسافت را عرضه کردهاند. استارتاپهای کوچکتر نیز به رقابت پیوستهاند و اپلیکیشنهای هوش مصنوعی خلاقانهای را برای نوشتن، هنر و کدنویسی ارائه میدهند.
بدون دیدگاه