به‌روزرسانی‌های Veo، Imagen و VideoFX، همراه با معرفی Whisk در Google Labs

اخبار جدیدی از گوگل منتشر شده است که شامل نسخه‌های به‌روز شده از مدل‌های تولید ویدیو و تصویر Veo 2 و Imagen 3 می‌شود. این مدل‌ها اکنون در ابزارهای لایه‌های سرعت VidoFX و ImageFX در گوگل لَبس (Google Labs) موجود است، همچنین یک ابزار جدید به نام Whisk معرفی شده است. Veo 2 ویدیوهای با کیفیت بالا را با بهبود واقع‌گرایی و درک سینماگرافی تولید می‌کند، در حالی که Imagen 3 تصاویر با روشنایی بیشتر و تنظیمات بهتر و در انواع و سبک‌های هنری مختلف تولید می‌کند.

معرفی Veo 2: تولید ویدیو به روز

ویدیو Veo 2 با کیفیت بسیار بالا در زمینه‌ها و سبک‌های گوناگون تولید می‌شود. Veo 2 در مقایسه با مدل‌های برتر توسط ارزیابان انسانی به نتایج به‌روزرسانی می‌رسد. این مدل بهترین درک از فیزیک دنیای واقعی و جزئیات و واقع‌بینی حرکت و ابرازات انسان را دارد که بهبودی در دقت و واقع‌گرایی کلی آن را کمک می‌کند. Veo 2 زبان منحصر به فرد سینماگرافی را می‌فهمد: از آن برای یک ژانر خواهید پرسید، عدسه‌ای مشخص کنید، اثرات سینمایی را پیشنهاد داده و Veo 2 آن‌ها را تحویل می‌دهد – با رزولوشن تا 4K و به طول دقایقی. درخواست کنید که یک فیلم کم زاویه ردیابی از میان یک صحنه راه بیابد، یا یک فیلم نزدیک از چهره یک دانشمندی که از میکروسکوپ خود خارج شده است، Veo 2 ایجاد خواهد کرد. در درخواست خود “لنز 18 میلیمتری” را ذکر کردید و Veo 2 می‌داند که باید فیلمی با زاویه پهن را تولید کند که این لنز شهرت دارد، یا پس‌زمینه‌ را تار کرده و بر روی موضوع خود تمرکز می‌کند. به این ترتیب ویدیوهای با کیفیت ویدیویی Veo 2 تولید می‌کند.

معرفی Imagen 3: تولید تصویر به روز

مدل تولید تصویر Imagen 3 نیز بهبود یافته و تصاویر با روشنایی بیشتر و تنظیمات بهتر تولید می‌کند. دقیقاترین انواع و سبک‌های هنری از واقع‌نمایی تا امپرسیونیسم، از آبستره تا آنیمه تولید می‌کند. این بهبود نیز به صورت دقیق‌تری به پیشنهادها پاسخ می‌دهد و جزئیات و بافت‌های غنی‌تری را تولید می‌کند. در مقایسه مستقیم خروجی‌های این مدل با مدل‌های تولید تصویر برتر توسط توسط تصمیم‌گیران انسانی، Imagen 3 به نتایج به‌روزرسانی می‌رسد.

معرفی Whisk: ابزار جدید برای تصویرسازی

Whisk، آخرین آزمایشگاه گوگل Labs، به شما امکان می‌دهد تصاویر ورودی یا ایجاد شده توسف که صحنه و سبک مورد نظر خود را منتقل می‌کنند. سپس شما می‌توانید آن‌ها را با هم ترکیب کرده و آن‌ها را بازخواهید به حالت خود، از یک لایه دیجیتالی تا یک پلاک انامل یا استیکر.

پایان مطلب
از این آپدیت‌های جدید گوگل می‌توان گفت که توانایی تولید ویدیو و تصویر در سطح بالا و به روزترین تکنولوژی‌ها را ارائه کرده است که این امر می‌تواند در زمینه‌های مختلفی از تولید محتوا تا استفاده در کسب و کارها و هنرها مورد استفاده قرار گیرد. این ابزارها با استفاده از هوش مصنوعی، جزئیات و حقایق بیشتری را تولید می‌کنند که این اتفاق می‌تواند کاربران را در بهبود روند خلاقیت و تولید محتوا یاری رساند. Whisk به‌عنوان یک آزمایش جدید، امکانات تصویرسازی پیشرفته را به کاربران ارائه می‌دهد و قابلیت‌های جدیدی را برای ادغام و میکس آپ تصاویر و سناریوها فراهم می‌کند.

با توجه به اینکه این امکانات جدید به سطح لاب‌های جوینده‌ها (Google Labs) معرفی شده‌اند، امکان استفاده از آن‌ها برای عموم فراهم شده است و این موضوع می‌تواند به گسترش استفاده و بهره‌وری از این ابزارها در میان کابران کمک کند.

نظرات ویژه شما و نکات کلیدی

با این آخرین به‌روزرسانی‌ها از گوگل، قدرت تولید ویدیو و تصویر به سطح بالاتری ارتقا یافته و مدل‌ها به‌روز شده‌ای که از توانایی‌های جدیدی از جمله تولید تصاویر روشن و تنظیمات بهتر برخوردار هستند، روانه بازار شده‌اند. استفاده از هوش مصنوعی در این ابزارها به جهت بهبود کیفیت و دقت به نتایج منجر شده است که این امر می‌تواند کمک بزرگی در فرآیندهای خلاقیت و تولید محتوا فراهم کند. این امکانات همچنین به صورت آزمایشی برای استفاده و ادغام آسان تر تصاویر و سناریوها در Whisk ارائه شده است که می‌تواند تجربه کاربری جدید و جذابی را برای کاربران فراهم کند.


منبع:
این مقاله در اصل در https://blog.google/technology/google-labs/video-image-generation-update-december-2024 منتشر شده است.