گوگل از Gemini 2.0 Flash رونمایی کرده است؛ مدلی پیشرفته که علاوه بر تولید متون نوشتاری، قادر به ایجاد تصاویر و صدا به صورت بومی است. این مدل همچنین می تواند با اپلیکیشن ها و سرویس های شخص ثالث تعامل کند و به این ترتیب، به جستجوی گوگل دسترسی داشته باشد، کدهای برنامه نویسی را اجرا کند و قابلیت های گسترده تری را ارائه دهد.
نسخه آزمایشی ۲.۰ Flash از همین امروز از طریق API Gemini و پلتفرم های توسعه دهندگان هوش مصنوعی گوگل، AI Studio و Vertex AI در دسترس توسعه دهندگان قرار خواهد گرفت. با این حال، قابلیت های تولید صدا و تصویر در ابتدا تنها برای گروه محدودی از شرکای منتخب فعال خواهد بود و عرضه گسترده آن از ماه ژانویه آغاز می شود.
گوگل اعلام کرده است که در ماه های آینده، ۲.۰ Flash را در طیف وسیعی از محصولات خود مانند Android Studio، Chrome DevTools، Firebase، Gemini Code Assist و سایر محصولات یکپارچه خواهد کرد.
نسل قبلی Flash، یعنی ۱.۵ Flash، تنها قادر به تولید متن بود و برای انجام وظایف بسیار پیچیده طراحی نشده بود. گوگل ادعا می کند که این مدل جدید بسیار انعطاف پذیرتر است و بخشی از این انعطاف پذیری به دلیل توانایی آن در فراخوانی ابزارهایی مانند موتور جستجو و تعامل با APIهای خارجی است.
تکفارس