نانو بانانا ۲: ترکیبی از قابلیت‌های حرفه‌ای با سرعت برق‌آسا

حیدری7 اسفند 1404

آخرین مدل تولید تصویر ما، دانش پیشرفته از جهان واقعی، مشخصات آماده برای تولید، ثبات سوژه و موارد دیگر را با سرعت مدل Flash ارائه می‌دهد.

به گزارش توسعه برند ؛ در آگوست سال گذشته، مدل تصویر ما در جمینای، یعنی نانو بانانا (Nano Banana)، به یک پدیده وایرال تبدیل شد و تعریف جدیدی از تولید و ویرایش تصویر ارائه داد. سپس در ماه نوامبر، ما نانو بانانا پرو (Nano Banana Pro) را منتشر کردیم که هوشمندی پیشرفته و کنترل خلاقانه با کیفیت استودیویی را در اختیار کاربران قرار می‌داد. امروز، ما بهترین‌های هر دو دنیا را برای کاربران در سراسر گوگل به ارمغان می‌آوریم.

معرفی می‌کنیم: نانو بانانا ۲ (Gemini 3.1 Flash Image)، جدیدترین و پیشرفته‌ترین مدل تصویر ما. اکنون می‌توانید دانش پیشرفته از جهان واقعی، کیفیت و قدرت استدلالی را که در نانو بانانا پرو دوست داشتید، با سرعتی برق‌آسا دریافت کنید.

هوشمندی و کیفیت بصری با سرعت Flash

نانو بانانا ۲، هوشمندی پرسرعت مدل جمینای فلش (Gemini Flash) را به دنیای تولید بصری می‌آورد و امکان ویرایش‌ها و تکرارهای سریع را فراهم می‌کند. این مدل، ویژگی‌هایی که زمانی منحصر به نسخه پرو بودند را در دسترس مخاطبان گسترده‌تری قرار می‌دهد، از جمله:

دانش پیشرفته از جهان واقعی: این مدل از پایگاه دانش جمینای درباره دنیای واقعی استفاده می‌کند و با اطلاعات لحظه‌ای و تصاویر جستجوی وب تقویت می‌شود تا سوژه‌های خاص را با دقت بیشتری رندر کند. این درک عمیق همچنین به شما کمک می‌کند اینفوگرافیک بسازید، یادداشت‌ها را به دیاگرام تبدیل کنید و داده‌ها را مصورسازی نمایید.
رندر و ترجمه دقیق متن: نانو بانانا ۲ به شما امکان می‌دهد متنی دقیق و خوانا برای ماکت‌های بازاریابی یا کارت‌های تبریک تولید کنید. حتی می‌توانید متن درون یک تصویر را ترجمه و بومی‌سازی کنید تا ایده‌های خود را در سطح جهانی به اشتراک بگذارید.

کنترل خلاقانه بهبودیافته

نانو بانانا ۲ همچنین شکاف بین سرعت و کیفیت بصری را به شدت کاهش داده و تصاویری با کیفیت بالا و فوتورئالیستیک ارائه می‌دهد. در اینجا آنچه مدل جدید ما ارائه می‌دهد و نسبت به نانو بانانای اصلی بهبود بخشیده، آمده است:

ثبات سوژه: شباهت کاراکترها را تا ۵ شخصیت و وفاداری به جزئیات تا ۱۴ شیء را در یک جریان کاری واحد حفظ کنید. این به شما امکان می‌دهد استوری‌بورد بسازید و روایت ایجاد کنید بدون اینکه ظاهر ورودی‌هایتان تغییر کند.
پیروی دقیق از دستورالعمل‌ها: با پیروی بهبودیافته از دستورالعمل‌ها، مدل با دقت بیشتری به درخواست‌های پیچیده شما پایبند می‌ماند و جزئیات ظریف ایده شما را ثبت می‌کند تا تصویری که دریافت می‌کنید، همان تصویری باشد که درخواست کرده‌اید.
مشخصات آماده برای تولید: دارایی‌های بصری جذاب با کنترل کامل بر نسبت‌های تصویر و رزولوشن‌های مختلف از ۵۱۲ پیکسل تا 4K بسازید. این تضمین می‌کند که تصاویر شما چه برای یک پست اجتماعی عمودی و چه برای یک پس‌زمینه عریض، شارپ و باکیفیت باقی بمانند.
ارتقاء کیفیت بصری: نانو بانانا ۲ نورپردازی زنده، بافت‌های غنی‌تر و جزئیات دقیق‌تری را ارائه می‌دهد و زیبایی‌شناسی باکیفیت را با سرعتی که از یک مدل Flash انتظار می‌رود، حفظ می‌کند.

امروز نانو بانانا ۲ را امتحان کنید

نیاز شما هرچه که باشد، ما اکنون ابزار عالی برای هر جریان کاری را ارائه می‌دهیم: نانو بانانا پرو برای کارهای باکیفیت که به حداکثر دقت واقعی نیاز دارند، و نانو بانانا ۲ برای تولید سریع، پیروی دقیق از دستورالعمل‌ها و استفاده از جستجوی تصویر یکپارچه.

نانو بانانا ۲ از امروز در سراسر محصولات گوگل عرضه می‌شود، از جمله:

اپلیکیشن جمینای: نانو بانانا ۲ جایگزین نانو بانانا پرو در مدل‌های Fast، Thinking و Pro خواهد شد. مشترکین Google AI Pro و Ultra همچنان از طریق منوی سه نقطه و با بازتولید تصاویر، به نانو بانانا پرو برای کارهای تخصصی دسترسی خواهند داشت.
جستجو: در حالت هوش مصنوعی (AI Mode) و لنز (Lens)، از طریق اپلیکیشن گوگل و همچنین مرورگرهای موبایل و دسکتاپ.
AI Studio + API: به صورت پیش‌نمایش در AI Studio و Gemini API در دسترس است.
Google Cloud: به صورت پیش‌نمایش با Gemini API در Vertex AI در دسترس است.
Flow: نانو بانانا ۲ مدل پیش‌فرض تولید تصویر در Flow است و برای تمام کاربران Flow با اعتبار صفر (رایگان) در دسترس است.
Ads (تبلیغات): نانو بانانا در بخش تبلیغات برای ارائه پیشنهادات در هنگام ایجاد کمپین‌ها در دسترس است.

اصالت‌سنجی قدرتمند: نشانه‌گذاری و تأیید

همانطور که رسانه‌های مولد تکامل می‌یابند، ابزارهایی که برای شناسایی و درک آن‌ها استفاده می‌کنیم نیز باید تکامل یابند. ما با ترکیب فناوری پیشرفته SynthID با گواهی‌نامه‌های محتوای C2PA، رویکرد خود را در زمینه اصالت‌سنجی عمیق‌تر می‌کنیم تا به کاربران دیدی جامع‌تر و زمینه‌مندتر نه تنها در مورد اینکه آیا از هوش مصنوعی استفاده شده، بلکه چگونه استفاده شده، ارائه دهیم.

ابزارهای اصالت‌سنجی ما در حال حاضر تأثیرگذار هستند. از زمان راه‌اندازی در نوامبر، ویژگی تأیید SynthID ما در اپلیکیشن جمینای بیش از ۲۰ میلیون بار در زبان‌های مختلف استفاده شده و به مردم کمک کرده تا تصاویر، ویدئوها و صداهای تولید شده توسط هوش مصنوعی گوگل را شناسایی کنند. به زودی تأیید C2PA را نیز به اپلیکیشن جمینای اضافه خواهیم کرد.

بخش ۲: تحلیل و نکات کلیدی استراتژیک

این یک حرکت بسیار هوشمندانه و تهاجمی از سوی گوگل است که چندین هدف استراتژیک را دنبال می‌کند:

دموکراتیزه کردن قدرت: گوگل در حال حذف کردن مرز بین مدل “سریع ولی متوسط” و مدل “کند ولی حرفه‌ای” است. با ارائه قابلیت‌های Pro با سرعت Flash، آن‌ها در حال تبدیل کردن مدل پیش‌فرض و رایگان خود به یک ابزار فوق‌العاده قدرتمند هستند. این کار مستقیماً ابزارهای پولی مانند Midjourney را به چالش می‌کشد.
حل مشکلات کلیدی تولید تصویر: گوگل دقیقاً به نقاط ضعفی حمله کرده که بزرگترین موانع بر سر راه استفاده حرفه‌ای از هوش مصنوعی مولد تصویر بوده‌اند:

ثبات سوژه (Subject Consistency): این یک “جام مقدس” در تولید تصویر است. ناتوانی در حفظ چهره یک شخصیت در صحنه‌های مختلف، بزرگترین مانع برای داستان‌سرایی و برندسازی بود. ادعای حفظ ثبات تا ۵ کاراکتر، یک جهش بزرگ رو به جلو است.
رندر دقیق متن: اکثر مدل‌ها در نوشتن متن خوانا و بدون غلط روی تصاویر ضعیف هستند. حل این مشکل، درهای جدیدی را برای طراحان گرافیک، بازاریابان و تولیدکنندگان محتوا باز می‌کند.

جنگ اکوسیستم: برگ برنده گوگل، ادغام (Integration) است. با عرضه همزمان نانو بانانا ۲ در جستجو، جمینای، کلاد، و ابزارهای تبلیغاتی، آن‌ها هوش مصنوعی را به بخشی جدایی‌ناپذیر از تمام ابزارهایی که مردم هر روز استفاده می‌کنند تبدیل می‌کنند. این یک مزیت توزیع است که هیچ رقیب مستقلی (مثل Midjourney یا Stability AI) از آن برخوردار نیست.
پیش‌دستی در مسئولیت‌پذیری (Responsible AI): تأکید بر ابزارهای اصالت‌سنجی مانند SynthID و C2PA یک حرکت هوشمندانه برای کاهش نگرانی‌ها در مورد دیپ‌فیک و اطلاعات نادرست است. گوگل با این کار خود را به عنوان یک بازیگر مسئول در این فضا معرفی می‌کند که می‌تواند در آینده به یک مزیت رقابتی و قانونی تبدیل شود.

برچسب ها