هوش مصنوعی روزی آگاهانه خرابکاری می‌کند

۱۴۰۳-۰۷-۲۹

دقیقه خواندن

به گزارش گروه دانش و فناوری اقتصاد ۱۰۰، شرکت آنتروپیک که توسعه دهنده هوش مصنوعی است، به تازگی تحقیقات جدیدی را منتشر کرده است که در آن مجموعه‌ای از تهدیدات بالقوه خرابکارانه برای بشریت ناشی از مدل‌های پیشرفته هوش مصنوعی را شناسایی می‌کند.

به گفته این شرکت، این پژوهش بر چهار روش خاص متمرکز شده است که یک مدل هوش مصنوعی مخرب می‌تواند انسان را فریب دهد تا تصمیمی خطرناک یا مضر بگیرد.

در نهایت، این تحقیقات جدید یک خبر خوب یک خبر بد برای ما دارد. خبر بد اینکه طبق تحقیقات این شرکت، مدل‌های زبان بزرگ پیشرفته مانند ChatGPT و Claude-3 ظرفیت روشنی برای خرابکاری نشان می‌دهند.

در این مطالعه آمده است: مدل‌های به اندازه کافی توانمند می‌توانند نظارت و تصمیم‌گیری انسانی را در زمینه‌های مهم زیر سوال ببرند. به عنوان مثال، در زمینه توسعه هوش مصنوعی، مدل‌ها می‌توانند به طور پنهانی تلاش‌ها برای ارزیابی قابلیت‌های خطرناک خود، نظارت بر رفتار آنها یا تصمیم‌گیری در مورد استقرارشان را مختل کنند.

با این حال، خبر خوب این است که محققان شرکت آنتروپیک مطمئن هستند که این خطرات را حداقل در حال حاضر می‌توان کاهش داد.

خرابکاری

آنتروپیک چهار راه را که یک مدل هوش مصنوعی می‌تواند با آنها تصمیم‌گیری انسان را مختل کند، شناسایی کرد و سپس مدل‌های خود را آزمایش کرد تا ببیند آیا موفقیت آمیز عمل خواهند کرد یا خیر.

محققان ابتدا یک مدل را وادار کردند تا با هدایت انسان به سمت اطلاعات نادرست، اقدام به خرابکاری کند. این تهدید می‌تواند در شرایطی پدیدار شود که انسان‌ها برای تجزیه حجم عظیمی از داده‌ها از جانب خود به یک سیستم هوش مصنوعی متکی هستند.

سپس این تیم مدل‌ها را آزمایش کرد تا ببیند سامانه هوش مصنوعی طراحی شده برای کمک به توسعه‌دهندگان انسانی برای ایجاد کدی برای وارد کردن مخفیانه اشکالات یا خراب کردن تلاش‌های کدگذار، چقدر آسان عمل می‌کند.

دو تهدید آخر شامل «پنهان کردن توانایی‌ها»(sandbagging) بود که اصطلاحی است که سناریویی را توصیف می‌کند که در آن یک هوش مصنوعی وانمود می‌کند که قادر به انجام کاری نیست تا آزمایش‌کنندگان ایمنی را متقاعد کند که خطرناک نیست.

در حالی که همه اینها ممکن است به طور بالقوه خطرناک به نظر برسند، آنتروپیک به مردم اطمینان داد که برای محافظت از بشریت در برابر احتمال خرابکاری هوش مصنوعی به اقدامات پیش‌گیرنده اندکی نیاز است.

طبق اعلام این شرکت؛ به طور کلی در حالی که آزمایشات ما نشان داد که احتمالاً نشانه‌های سطح پایینی از توانایی‌های خرابکاری در مدل‌های فعلی وجود دارد، ما می‌گوییم که حداقل اقدامات پیش‌گیرنده برای مقابله با خطرات کافی است. با این حال، با بهبود قابلیت‌های هوش مصنوعی، ارزیابی‌های واقعی‌تر و پیش‌گیری‌های قوی‌تر احتمالاً ضروری خواهند بود.

منبع :

ایسنا

ویژه

وبگردی

هوش مصنوعی

منبع

۱۴۰۳-۰۷-۲۹

دقیقه خواندن

هوش مصنوعی روزی آگاهانه خرابکاری می‌کند

خرابکاری

ویژه

وبگردی

دیدگاهتان را بنویسید لغو پاسخ

قیمت طلا، سکه و ارز امروز ۲۱ فروردین‌ ماه ۱۴۰۴/ قیمت سکه و طلا صعودی شد

تصمیمات غلط و گوش های خاموش

تخت‌گاز خودروهای بی‌کیفیت در آمار خونین تصادفات

وقتی ۲۰۷ با گوسفند معاوضه می‌شود ؛ پژو در طویله، گوسفند در پارکینگ!

تغییر مهم در فیش حقوقی کارکنان و بازنشستگان/ جزییات اعلام شد

جدیدترین گزارش از وضعیت سدهای کشور پس از بارندگی‌های اخیر/ ورودی آب به سدهای ۳۸ درصد کاهش یافت

قیمت طلا، سکه و ارز امروز ۲۱ فروردین‌ ماه ۱۴۰۴/ قیمت سکه و طلا صعودی شد

تصمیمات غلط و گوش های خاموش

تخت‌گاز خودروهای بی‌کیفیت در آمار خونین تصادفات

وقتی ۲۰۷ با گوسفند معاوضه می‌شود ؛ پژو در طویله، گوسفند در پارکینگ!

تغییر مهم در فیش حقوقی کارکنان و بازنشستگان/ جزییات اعلام شد

جدیدترین گزارش از وضعیت سدهای کشور پس از بارندگی‌های اخیر/ ورودی آب به سدهای ۳۸ درصد کاهش یافت

وضعیت تورم در استان‌های ایران/ کدام شهر صدرنشین است؟

سقوط ۱۱۶ میلیارد دلاری ثروت دوست صمیمی ترامپ

نسخه ویژه یک اقتصاددان برای سرمایه‌گذاری مولد/ راغفر: نه تنها در زمان تحریم، که در زمان جنگ هم می‌توان اقتصاد را مدیریت کرد

در سال گذشته چند نفر وام فرزندآوری گرفتند؟

پژو۲۰۶ صندوق‌دار ۳۶۵ میلیون تومان شد/ جدول قیمت پژو ۲۰۶ صندوق‌دار صفر در بازار

۲ پیش‌ بینی مهم از آینده واردات خودرو/ کاکایی: نگران بخش تولید هستم/ خسروانی: منتظر این اتفاق در بازار خودرو باشید

خبر جدید درباره طرح کالابرگ/ متقاضیان بخوانند

پیش‌بینی تحلیلگران درباره قیمت طلا/ آیا طلا به رشد خود ادامه می‌دهد؟

قیمت طلا، سکه و ارز امروز ۷ فروردین‌ماه ۱۴۰۴/ قیمت طلا و سکه تکان خورد

جدول محاسبه حقوق کارگران در سال جدید منتشر شد/ جزییات

قیمت جدید گوشت امروز ۵ فروردین ۱۴۰۴ اعلام شد/ جزییات تغییر قیمت

با ۱۸۰ میلیون تومان پراید بخرید/ جدول قیمت مدل های مختلف پراید

خبر مهم سازمان برنامه درباره واریزی بزرگ دولت/ زمان پرداخت یارانه جدید اعلام شد

کارگران در سال ۱۴۰۴ چند ساعت باید کار کنند؟ + جدول ساعت کار موظفی کارگران