به عصر هوش مصنوعی «جمنای» خوش آمدید
گوگل به تازگی از قدرتمندترین مدل هوش مصنوعی خود به نام جمنای (Gemini) رونمایی کرده است، اما این هوش مصنوعی چیست و چه کاری می تواند انجام دهد؟
به گزارش اخبار تایمز؛ هوش مصنوعی جدید گوگل به تازگی رونمایی و عرضه شده است و زمان آن فرا رسیده است که درباره این رقیب چت GPT اطلاعات بیشتری کسب کنیم.
گوگل جمنای چیست؟
Jamnai یک مدل هوش مصنوعی جدید و قدرتمند از گوگل است که نه تنها متن، بلکه تصاویر، ویدئوها و صداها را نیز درک می کند. جمنای به عنوان یک مدل چندوجهی قادر به انجام وظایف پیچیده در ریاضیات، فیزیک و سایر زمینه ها و همچنین درک و تولید کدهای با کیفیت بالا در زبان های برنامه نویسی مختلف است.
در حال حاضر این هوش مصنوعی در هوش مصنوعی گوگل بارد و گوشی هوشمند گوگل پیکسل ۸ ادغام شده است اما به تدریج در سایر سرویس های گوگل نیز قرار خواهد گرفت.
به گفته دنیس حسابیس، مدیر عامل و یکی از بنیانگذاران Google DeepMind، جمنا نتیجه یک تلاش مشترک در مقیاس بزرگ توسط تیم های سراسر گوگل، از جمله همکاران ما در Google Research است. این هوش مصنوعی از ابتدا با هدف چندوجهی بودن ساخته شده است، به این معنی که می تواند انواع مختلف اطلاعات از جمله متن، کد، صدا، تصاویر و ویدئو را تعمیم دهد و به طور یکپارچه درک کند، با آن کار کند و با آنها تعامل داشته باشد.
چه کسی جمنای را ساخته است؟
Jamnai توسط گوگل و آلفابت، شرکت مادر گوگل ایجاد شد و به عنوان پیشرفته ترین مدل هوش مصنوعی این شرکت تا به امروز منتشر شد. Google DeepMind نیز سهم قابل توجهی در توسعه Jumnai داشته است.
آیا چندین نسخه مختلف از جمنای وجود دارد؟
گوگل Jamnai را به عنوان یک مدل منعطف توصیف می کند که می تواند بر روی همه چیز از مراکز داده گوگل تا دستگاه های تلفن همراه اجرا شود. برای دستیابی به این انعطاف، Gemini در سه نسخه ارائه می شود: Gemini Nano، Gemini Pro و Gemini Ultra.
نانو جمنای
اندازه مدل Nano Jumnai برای اجرا بر روی تلفنهای هوشمند، بهویژه Google Pixel 8 طراحی شده است. این مدل برای انجام کارهایی بر روی دستگاهی ساخته شده است که نیاز به پردازش هوش مصنوعی کارآمد بدون اتصال به سرورهای خارجی دارد، مانند پیشنهاد پاسخها در برنامههای چت یا خلاصه کردن متن
پرو جمنای
Pro Jamna که در مراکز داده گوگل اجرا می شود، برای ارائه آخرین نسخه چت ربات هوش مصنوعی این شرکت، Bard، طراحی شده است. این هوش مصنوعی قادر به ارائه پاسخ های سریع و درک سوالات پیچیده است.
اولترا جمنای
اگرچه اولترا جمنای هنوز برای استفاده گسترده در دسترس نیست، اما گوگل آن را به عنوان تواناترین مدل خود توصیف میکند که از نتایج پیشرفته فعلی در ۳۰ معیار از ۳۲ معیار آکادمیک پرکاربرد مورد استفاده در تحقیقات و توسعه مدلهای زبانی بزرگ(LLM) فراتر رفته است. این هوش مصنوعی برای کارهای بسیار پیچیده طراحی شده است و قرار است پس از اتمام مرحله آزمایشی فعلی عرضه شود.
چگونه میتوان به جمنای دسترسی پیدا کرد؟
Jamnai اکنون در محصولات Google در اندازههای نانو و حرفهای مانند تلفن پیکسل ۸ و چت بات Bard در دسترس است. گوگل قصد دارد به تدریج Jumnai را در موتور جستجو، تبلیغات، کروم و سایر خدمات خود ادغام کند.
توسعهدهندگان و مشتریان سازمانی از ۱۳ دسامبر میتوانند از طریق Gemini API در استودیوی هوش مصنوعی گوگل و هوش مصنوعی Google Cloud Vertex به پرو جمنای دسترسی داشته باشند. توسعهدهندگان اندروید نیز از طریق AICore به نانوجمنای دسترسی خواهند داشت، که به صورت پیش نمایش اولیه در دسترس خواهد بود.
جمنای چه تفاوتی با سایر مدلهای هوش مصنوعی مانند جیپیتی-۴ دارد؟
به نظر میرسد که مدل جدید جمنای گوگل یکی از بزرگترین و پیشرفتهترین مدلهای هوش مصنوعی تا به امروز باشد، اگرچه عرضه مدل اولترا حقیقت را مشخص خواهد کرد. در مقایسه با سایر مدلهای محبوبی که در حال حاضر چتباتهای هوش مصنوعی را تقویت میکنند، جمنای به دلیل ویژگی چندوجهی بومی خود متمایز است، در حالی که مدلهای دیگر، مانند جیپیتی-۴، برای چندوجهی بودن واقعا به اتصالات و ادغامها متکی هستند.
در مقایسه با جیپیتی-۴ که یک مدل عمدتا مبتنی بر متن است، جمنای به راحتی وظایف چندوجهی را به صورت بومی انجام میدهد. در حالی که جیپیتی-۴ در کارهای مرتبط با زبان مانند ایجاد محتوا و تجزیه و تحلیل متن پیچیده به صورت بومی برتر است، برای انجام تجزیه و تحلیل تصویر و دسترسی به وب به اتصالات اُپنایآی (OpenAI) متوسل میشود و برای تولید تصاویر و پردازش صدا به DALL-E ۳ و ویسپر (Whisper) متکی است.
همچنین، به نظر می رسد گوگل جمنا بیش از سایر مدل های موجود در حال حاضر بر روی محصول تمرکز کرده است. این هوش مصنوعی یا در اکوسیستم شرکت ادغام شده است یا برای انجام این کار برنامه ریزی شده است، زیرا هم به Bard و هم Pixel 8 قدرت می دهد. مدل های دیگر مانند GPT-4 و Meta’s Llama بیشتر سرویس گرا هستند و برای انواع مختلف در دسترس هستند.
انتهای پیام