همه چیز در خصوص هوش مصنوعی گوگل: از چت بات سفارشی تا عینک هوشمند
به گزارش دانشنامه آریایی، بخش زیادی از کنفرانس گوگل I/O 2024 به قابلیت های هوش مصنوعی Gemini و سایر محصولات این شرکت اختصاص داشت. مدل هوش مصنوعی جمینای 1.5 فلش، Project Astra، هوش مصنوعی Veo برای ساخت ویدیو و امکان ساخت چت بات های سفارشی از جمله اطلاعیه های تازه گوگل در این رویداد بودند.
به گزارش خبرگزاری خبرنگاران ، شرکت گوگل کنفرانس سالانه توسعه دهندگان خود را موسوم به I/O با معرفی هوش مصنوعی نو خود، Gemini 1.5 Flash AI شروع کرد که گفته می گردد سبک تر از مدل Gemini Pro و در دسترس تر است.
Gemini 1.5؛ سریع تر و مقرون به صرفه تر
مدل Gemini 1.5 Flash به گونه ای طراحی شده است که سرعت بالاتر و تأخیر کمتری داشته باشد. مدیرعامل دیپ مایند می گوید که گوگل مدل Gemini 1.5 Flash را به آن علت ساخته که توسعه دهندگان به مدل سبک تر و مقرون به صرفه تری از نسخه پرو احتیاج داشتند. نسخه فلش در جایگاهی میان جمینای 1.5 پرو و جمینای 1.5 نانو قرار می گیرد.
جمینای 1.5 فلش البته برای مصرف نمایندگان معمولی ساخته نشده است. این مدل هوش مصنوعی توسعه دهندگانی را هدف قرار داده است که می خواهند محصولات و سرویس های مبتنی بر هوش مصنوعی بسازند.
موتورجست وجوی گوگل با هوش مصنوعی Gemini متحول می گردد
هوش مصنوعی Gemini گوگل در نوترین رویداد این شرکت با تحولات قابل توجهی در زمینه جست وجوی هوشمند روبرو شده است. این تحولات می توانند یکی از مهم ترین نقاط قوت هوش مصنوعی گوگل طی چند وقت اخیر باشند.
گوگل جمینای حالا به بخشی از گوشی های اندرویدی تبدیل شده و با نصب اپ اختصاصی آن، می توانید به صورت یکپارچه از این هوش مصنوعی بهره ببرید. گوگل با هماهنگ سازی اپ جمینای و سیستم عامل اندروید، به کاربر اجازه می دهد تا به سادگی بخش های مختلف گوشی هوشمند خود را جست وجو و اطلاعات مورد نظر خود را پیدا کند.
یکی از ویژگی های جذابی که گوگل برای اپلیکیشن Gemini معرفی کرد، قابلیت Live یا زنده است. در کنفرانس توسعه دهندگان گوگل اعلام شد که Gemini Live می تواند قابلیت گفت وگوی طبیعی با این مدل هوش مصنوعی را فراهم کند تا تعامل صوتی بهتری با این فناوری داشته باشید.
قابلیت Gemini Live به وسیله آیکون صدا در اپلیکیشن Gemini در اندروید و iOS در دسترس خواهد بود. زمانی که روی این آیکون بزنید، با پنجره ای تمام صفحه روبه رو می شوید که افکت موجی جذابی را هم به شما نشان می دهد. در این حالت می توانید با هوش مصنوعی دیالوگ دوطرفه داشته باشید و پاسخ سؤالات خود را در کمترین زمان بگیرید.
چت بات های سفارشی خود را فراوری کنید
گوگل از چندین ویژگی نو برای هوش مصنوعی Gemini خود رونمایی کرد که یکی از قدرتمندترین آن ها قابلیتی به نام Gems است که به کاربران اجازه می دهد نسخه های سفارشی دستیار Gemini خود را با شخصیت های مختلف ایجاد نمایند.
قابلیت Gems به شما اجازه می دهد تا چت بات های گفتگومحور خود را ایجاد کنید که می توانند وظایف خاصی را انجام دهند. بعلاوه چت بات های هوش مصنوعی که با این قابلیت ساخته می شوند، می توانند دارای ویژگی های شخصیتی منحصر به فرد خود باشند.
قابلیت های هوش مصنوعی نو اندروید
گوگل اظهار داشت که قابلیت جست وجوی مبتنی بر هوش مصنوعی به گوشی های هوشمند اندرویدی اضافه خواهد شد و Gemini دستیار نو هوش مصنوعی کاربران می گردد تا وظایف مختلفی را انجام دهد. پردازش روی دستگاه هوش مصنوعی نیز در راه است. گوگل توضیحات خود را با قابلیت Circle to Search شروع کرد که به گفته آن، اکنون دستیار آموزشی همه جانبه ای برای دانش آموزان است.
گوگل می گوید که این قابلیت در دستگاه های اندرویدی به زودی می تواند مسائل بسیار پیچیده و چندبعدی را درک و حل نماید. بعلاوه تا سرانجام سال 2024، بیش از 200 میلیون دستگاه به آن مجهز خواهند شد.
قدرتمندترین AI تصویرساز گوگل
مدل هوش مصنوعی Imagen 3، مولد تصویری است که به ادعای اهالی مانتین ویو، قدرتمندترین هوش مصنوعی تصویرساز این برند محسوب می گردد. ظاهراً گوگل آماده شده تا بیش از پیش در زمینه فراوری تصاویر با پرامپت قدرت نمایی کند.
گوگل این مولد تصویر هوش مصنوعی را به زودی در دسترس توسعه دهندگان و مشتریان سازمانی قرار خواهد داد. ظاهراً این شرکت در نظر دارد که در فاز بعدی، هوش مصنوعی Imagen 3 را برای عموم افراد نیز منتشر کند.
هوش مصنوعی Veo؛ ساخت ویدیوهای خیره نماینده با دستورات متنی
هوش مصنوعی ویدیوساز پیشرفته Veo، می تواند ویدیوهای فول اچ دی را بر اساس پرامپت متنی بسازد یا پس از ساخت ویدیو، با دستورات متنی آن ها را تغییر دهد. این هوش مصنوعی پیشرفته دراصل پاسخ این شرکت به هوش مصنوعی Sora از OpenAI است.
گوگل ادعا می نماید که Veo درکی پیشرفته از زبان و مفاهیم بصری دارد تا بتواند هر ویدیویی را که کاربر در فکر خود دارد، ایجاد کند. ویدئوهای فراوریشده با این هوش مصنوعی، تکنیک های سینمایی و بصری مانند مفهوم تایم لپس را به نمایش می گذارند.
هوش مصنوعی ویدیوساز Veo در بخش VideoFX گوگل برای بعضی از سازندگان در دسترس خواهد بود و این شرکت می گوید که به YouTube Shorts و سایر محصولات نیز می آید. اگر Veo درنهایت به این بخش از یوتیوب اضافه گردد، این ویژگی می تواند رجحان هایی برای یوتیوب ایجاد کند.
پاسخ مستقیم گوگل به قابلیت های نو ChatGPT
در این کنفرانس بعلاوه از Astra به عنوان هوش مصنوعی جهانی یاد شد که می تواند در زندگی روزمره مفید باشد. به نظر می رسد که پروژه نو گوگل پاسخ مستقیمی به قابلیت های نو ChatGPT است که یک روز قبل از رویداد گوگل، به وسیله OpenAI معرفی شده بود.
ظاهراً Project Astra اپلیکیشنی است که به دوربین دستگاه دسترسی دارد و به وسیله آن می تواند به بعضی سوالات توضیح دهد. در این ویدیو، Astra به وسیله دوربین می تواند به محیط اطراف کاربر نگاه کند و آن را توصیف کند. نکته ای که در کنفرانس گوگل موردتوجه خبرنگاران و افراد حاضر نهاده شد، سرعت عمل Astra در ارائه پاسخ ها است. به گفته گوگل، Astra نه تنها داده های بصری را در زمان واقعی پردازش می نماید، بلکه هرچیزی را که می بیند، می تواند به خاطر بیاورد و از اطلاعات ذخیره شده خود نیز استفاده می نماید.
ویژگی AI Overviews و قابلیت های آن
گوگل درجریان رویداد Google I/O 24 از ویژگی AI Overviews نیز برای موتور جست وجوی خود رونمایی کرد. این ویژگی در تجربه جست وجوی کاربران، تغییراتی اساسی ایجاد می نماید.
گوگل سال گذشته از ویژگی هوش مصنوعی نوی برای تجربه SGE مرورگر کروم رونمایی کرد که کاربران با یاری آن می توانند مقالات موجود در وب را خلاصه نمایند. باتوجه به اسکرین شات هایی که در رویداد به نمایش گذاشته شد، به نظر می رسد ویژگی AI Overviews می تواند به شکل موثری همان SGE با نامی نو باشد.
Ask Photos؛ ویژگی نو هوش مصنوعی
گوگل بعلاوه درجریان این رویداد از ویژگی نوی برای گوگل فوتوز رونمایی کرد. این ویژگی به صورت آزمایشی در دسترس کاربران قرار گرفته است و با هوش مصنوعی جمینای گوگل پشتیبانی می گردد. این ویژگی اواخر تابستان عرضه خواهد شد.
نسل ششم پردازنده تنسور با نام Trillium
غول فناوری مستقر در ماونتین ویو یکی از معدود شرکت هایی است که پردازنده های خود را به عنوان جایگزین پردازنده های انویدیا ارائه می نماید. پردازنده نو Trillium نیز ساخته شده که توان لازم را برای فراوری متن و دیگر فایل های رسانه ای از مدل های بزرگ هوش مصنوعی فراهم کند. این پردازنده نه تنها حدود 5 برابر قوی تر از پردازنده نسل قبلی یعنی v5e است، بلکه 67 درصد در مصرف انرژی بهینه تر عمل می نماید. سوندار پیچای می گوید پردازنده تنسور نو آن ها بهینه ترین TPU تاریخ گوگل است.
مهندسان گوگل در طراحی این واحد پردازشی تنسور با افزایش ظرفیت حافظه ای که پهنای باند بالا دارد، توانایی این پردازنده را ارتقا داده اند. مدل های هوش مصنوعی معمولاً به اندازه زیادی حافظه احتیاج دارند که می توانند گلوگاه عملکرد این سیستم ها باشند. گوگل بعلاوه واحدهای MXU را در این پردازنده توسعه داده و مجموع سرعت کلاک را بالا برده است.
پردازنده Trillium از نسل سوم SparseCore استفاده می نماید که گوگل آن را به عنوان شتاب دهنده ای تخصصی برای رتبه بندی های پیشرفته و کارهای مربوط به توصیه محتوا توصیف می نماید. این شرکت می گوید با این کار، Trillium می تواند مدل ها را سریع تر آموزش بدهد و تأخیر کمتری داشته باشد.
LearnLM؛ یادگیری بهتر با هوش مصنوعی
یکی از مدل های هوش مصنوعی معرفی شده گوگل، LearnLM نام دارد که بر مبنای مدل جمینای ساخته شده و برای یادگیری بهینه سازی شده است. گوگل درحال همکاری با معلمان است تا این مدل ها را وارد کلاس های درس کند. این شرکت اعتقاد دارد که این هوش مصنوعی می تواند در یادگیری و برنامه ریزی های درسی کاربردهای زیادی داشته باشد.
گوگل در این باره اعلام نموده است که با متخصصانی از کالج معلمان کلمبیا، دانشگاه ایالتی آریزونا، دانشگاه نیویورک تیش و خان آموزشگاه نیز همکاری خواهد نمود تا این فناوری را آزمایش کند و بهبود ببخشد.
مدل زبانی با 27 میلیارد پارامتر!
گوگل در کنفرانس سالانه توسعه دهندگان Google I/O 2024 از نسل بعدی مدل های زبانی Gemma رونمایی کرد. نسخه متن باز Gemma 2 با 27 میلیارد پارامتر در ماه ژوئن عرضه می گردد.
در حال حاضر PaliGemma، یک نوع Gemma از پیش آموزش دیده است که گوگل آن را به عنوان نخستین مدل زبان بینایی در خانواده Gemma برای توضیح تصاویر، برچسب گذاری تصویر و موارد استفاده بصری پرسش و پاسخ توصیف می نماید.
ظاهرا گوگل این مدل 27 میلیارد پارامتری را برای اجرا روی پردازنده های گرافیکی نسل بعدی انویدیا، میزبان Google Cloud TPU و سرویس مدیریت شده Vertex AI بهینه نموده است.
گوگل در حاشیه این کنفرانس اظهار داشت که امروز (چهارشنبه، 26 اردیبهشت) دومین نسخه بتا از سیستم عامل اندروید 15 منتشر می گردد.
گوگل هنوز به طور دقیق معین ننموده که این آپدیت نو شامل چه ویژگی هایی می گردد، اما شاید بعضی قابلیت های هوش مصنوعی نو نیز در آن مورد آزمایش قرار بگیرند. احتمالاً طی چند روز آینده، گزارش های بیشتری در این رابطه منتشر خواهد شد.
گزینه نو Web در نوار جستجوی گوگل
گفته می گردد که گزینه Web تقریباً تمام بلوک های محتوایی را که گوگل در صفحه نتایج جست وجو قرار می دهد، فیلتر می نماید و تنها ها و متن ساده وب سایت ها را خواهید داشت. بعلاوه گزینه Web قابلیت نو جست وجوی هوش مصنوعی این شرکت را نیز مسدود خواهد نمود. این قابلیت هنوز برای تمامی کاربران فعال نیست و به مرور در دسترس قرار خواهد گرفت.
البته این گزینه نو، شاید برای بعضی کاربران چندان کاربردی نباشد. چون که بلوک و ماژول های پیشنهادی گوگل در بالای صفحه معمولا مفید واقع می گردد. بعلاوه بعید است که غول فناوری تنها با فشردن دکمه Web از تبلیغات خود دست بکشد. به هرحال در مواقعی که در پی پاسخ ساده و معینی هستید، ماژول های گوگل می توانند به سرعت چنین پاسخی را برای شما فراهم نمایند و احتیاجی به گزینه Web نخواهید داشت.
گوگل در مراسم I/O ظاهراً عینک هوشمند نو خود را هم نشان داد
به نظر می رسد که گوگل در خلال مراسم I/O خود، نمونه اولیه عینک هوشمند آینده اش را نیز برای چند لحظه نشان داده باشد. این پروژه ممکن است با یاری سامسونگ و شاید حتی کوالکام ساخته گردد.
هنوز معین نیست که آیا گوگل واقعاً چنین عینکی را عرضه خواهد نمود یا خیر، اما محتمل است گوگل قصد داشته باشد عینک هوشمندی با نمایشگرهای AR ارائه دهد. بعلاوه در توضیحات یوتوب ویدیوی Project Astra، گوگل می گوید که دومین قسمت از دموی این پروژه روی نمونه اولیه یک عینک اجرا می گردد.
البته گوگل سابقه ای نسبتاً طولانی در ساخت عینک های AR دارد. گوگل گلس این شرکت با شیشه های کوچک چند سال پیش رونمایی شد، اما چندان مورد پسند کارشناسان و کاربران قرار نگرفت. بااین حال، اکنون با روی کارآمدن هوش مصنوعی مولد، مخصوصاً با قابلیت های صوتی و بصری آن، شاید بتوان گفت که با این فناوری نو، در آینده گوگل گلس احیا خواهد شد.
54323
منبع: خبرآنلاین