هوش مصنوعی و سلامت

هوش مصنوعی (AI) می‌تواند پتانسیل تغییر زندگی افراد را خودبه خود داشته باشد، به ویژه در زمینه سلامت. وقتی درباره اینکه این موج جدید هوش مصنوعی چگونه سلامت را تغییر خواهد داد فکر می‌کنیم، حائز اهمیت است که به سه رویکرد زیر توجه ویژه داشته باشیم: توسعه مسئولانه هوش مصنوعی، همکاری با دیگران و یادآوری که هوش مصنوعی تنها یکی از ابزارهای موجود برای بهبود سلامت است. اگر با جسارت و مسئولیت پذیری توسعه یابد، هوش مصنوعی می‌تواند یک نیروی قدرتمند برای تساوی سلامت باشد و نتایج بهبودی را برای همه و همه جا به ارمغان بیاورد.

همکاری Google و Institute of Women’s Cancers برای پیشرفت درمان سرطان زنان

در این همکاری جدید، Google و اینترسیتی زنان با یکدیگر همکاری نموده و قصد دارند که در مبارزه با سرطان‌های زنان انقلابی ایجاد کنند.

Open Health Stack و کمک به توسعه‌دهندگان برای پر کردن کوچکی‌های سلامتی

این ابزارها به توسعه‌دهندگان کمک می‌کنند تا راهکارهای سلامت دیجیتال برای محیط‌های با منابع کمک را در سراسر جهان ایجاد کنند.

تراستی Google برای یک آینده سالم‌تر

در این بخش به استراتژی چهار ستونه سلامت Google برای بهبود سلامت جهانی پرداخته می‌شود.

استفاده از هوش مصنوعی برای افزایش دسترسی به خدمات بهداشتی فوری

Google بررسی می‌کند که چگونه فناوری خود می‌تواند به حل چالش‌های جهانی مانند دسترسی به خدمات بهداشتی فوری کمک کند.

مبانی برای هدایت استفاده از هوش مصنوعی در پشتیبانی از سلامت روان

سلامت روان یک مسئله جهانی است. در اینجا چهار روش کلیدی برای ایجاد هوش مصنوعی برای گسترش دسترسی به آموزش، ارزیابی و …

پیش‌بینی‌ها درباره هوش مصنوعی در خدمات بهداشت در سال 2024

در سال 2024 انتظار داریم که سازمان‌های بهداشتی از genAI برای بهینه‌سازی کارهای اداری، آماده‌سازی برای تغییرات گسترده و …

طریقه‌هایی که هوش مصنوعی می‌تواند برای همه و همه جا سلامت را بهبود ببخشد

دکتر Karen DeSalvo در مورد پتانسیل هوش مصنوعی برای بهبود سلامت برای همه و همه جا صحبت می‌کند. به همراه رویکردهایی برای مواجهه با آن تا بتواند برای …

مسائل مهم کارتان به تجارت شرکت برای تقویت تحقیقات سلامت و ایجاد محصولات متمرکز بر بهبود سلامت برای میلیاردها…

Yossi Matias درباره نقش هوش مصنوعی در پشتیبانی از تحقیقات سلامت و کمک به ما برای ایجاد محصولاتی با تمرکز بر بهبود سلامت برای میلیاردها گفتگو می‌کند.

استفاده از هوش مصنوعی برای تبدیل سلامت عمومی به واقعا عمومی

YouTube از هوش مصنوعی برای تحول و مقیاس بزرگ چگونگی تولید و ارائه اطلاعات سلامت با کیفیت بالا، مرتبط و جذاب در سطح جهانی استفاده می‌کند.

———————————

نظر کارشناسی:
هوش مصنوعی به طور اجمالی توانمندی‌های فراوانی برای ارتقاء خدمات بهداشتی و پشتیبانی از سلامت افراد دارد. با استفاده از تکنولوژی هوش مصنوعی، انتظار می‌رود که بهبود خدمات بهداشتی، افزایش دسترسی به اطلاعات دقیق سلامت، و حل مشکلات جهانی مانند دسترسی به خدمات بهداشتی فوری، بیشتر شود. همچنین، مشارکت بین صنعت و دانشگاه‌ها و موسسات بهداشتی نقش بسزایی در تحقق این اهداف بزرگ دارد. به طور کلی، همکاری و انتقال تکنولوژی هوش مصنوعی به حوزه سلامت می‌تواند گام مهمی در جهت بهبود سلامت جامعه و کاهش نابرابری در دسترسی به خدمات بهداشتی باشد.


منبع:
این مقاله در اصل در https://blog.google/technology/health/google-ai-and-health/ منتشر شده است.

استفاده از هوش مصنوعی تولیدی در سازمان‌های بهداشتی

نگاه کلی به هوش مصنوعی تولیدی برای سازمان‌های بهداشتی

همانطور که می‌دانید، استفاده از هوش مصنوعی در حوزه بهداشت و درمان می‌تواند بهبودهای چشمگیری را به همراه داشته باشد. در حال حاضر، گوگل کلاود به همراه سازمان‌های بهداشتی همکاری می‌کند تا راهکارهای هوش مصنوعی را پیاده کند که به آن‌ها کمک کند تا با چالش‌های اداری و عملیاتی روبه‌رو شوند. این راهکارها شامل جستجوی اطلاعات و مستندات وظیفه محور است که اغلب زمان ارزشمندی را از پژوهشگران و پزشکان می‌گیرد.

بایر فارما: بهبود فرآیندهای آزمایش‌های بالینی

یکی از سازمان‌های بهداشتی که در راستای بهره‌برداری از هوش مصنوعی تولیدی همکاری می‌کند، بایر فارما است. آن‌ها با استفاده از راهکارهای هوش مصنوعی گوگل کلاود، از جمله Vertex AI و Med-PaLM 2، به دنبال به اندازه زمان و هزینه توسعه محصولات دارویی هستند. هوش مصنوعی تولیدی می‌تواند به محققان کمک کند تا به آسانی به داده‌ها دسترسی داشته باشند، ارتباطات ممکن را از داده‌های پژوهشی استخراج کنند و حتی وظایف وقت‌بر نوشتن ارتباطات آزمایشات بالینی و ترجمه آن‌ها به زبان‌های مختلف را به صورت خودکار انجام دهند.

هی سی اے هلثکر: بهبود مستندسازی و گردش کار برای پزشکان

برای ارائه دهندگان خدمات بهداشتی، مستندسازی یک فرآیند زمان‌بر ولی مهم است. هی سی اے هلثکر در همکاری با گوگل کلاود بر روی استفاده از هوش مصنوعی تولیدی برای حمایت از پزشکان و پرستاران به منظور کاهش بار وظایف اداری کار می‌کند. آن‌ها در حال حاضر یک راهکار را که اطلاعات را از گفتگوهای پزشک-بیمار استخراج می‌کند برای ایجاد یادداشت‌های پزشکی استفاده می‌کنند. این محافظت شامل نگهداری از حریم خصوصی بیماران و امنیت داده‌ها می‌شود.

مدی‌تک: آسان‌تر کردن جستجو و خلاصه‌سازی سوابق پزشکی الکترونیکی

پزشکان برای ارائه خدمات بهداشتی به سوابق پزشکی الکترونیکی اعتماد می‌کنند. اما سوابق پزشکی چگال و پیچیده است و اطلاعات بیمار بعضاً در سیستم‌های مختلف ذخیره می‌شود که باعث می‌شود پزشکان نتوانند به تمام اطلاعاتی که نیاز دارند دسترسی پیدا کنند. مدی‌تک همکاری می‌کند تا تجربه جستجو و خلاصه‌سازی در سیستم مدیریت سوابق پزشکی EHR خود، MEDITECH Expanse، را با فناوری هوش مصنوعی ما پیاده کند. آن‌ها امیدوارند از این فناوری برای ادغام اطلاعات از منابع مختلف و ایجاد یک دید طولانی‌مدت از سوابق بیمار بهره برند. آن‌ها همچنین برنامه‌ریزی دارند تا از Med-PaLM 2 در بهتر کردن راهکارهای خود استفاده کنند، شامل کمک به پزشکان برای درک عمیق‌تری از تاریخچه بیماران. این می‌تواند به پزشکان کمک کند تا زمان صرف نوشتن گزارش‌های بالینی را کاهش داده و کاری که انجام می‌دهند را بهبود بخشند.

نتیجه گیری و نظرات کارشناسی

همکاری با سازمان‌های بهداشتی برای آزمایش راهکارهای جدید هوش مصنوعی تولیدی یک قدم اساسی به سوی ساختن فناوری هوش مصنوعی ایمن و موثر است. بازخوردها و دیدگاه‌های آن‌ها از اهمیت بسزایی برخوردارند زیرا ادامه دادن به استفاده از هوش مصنوعی تولیدی برای کمک به بیشترین تعداد سازمان در تحول مراقبت از بیماران ضروری است.
ایده‌آل استفاده از این فناوری برای کمک به تسریع در فرآیند توسعه داروها توسط بایر فارما، به ساده‌تر کردن وظایف اداری پزشکان توسط هی سی اے هلثکر، و راحت کردن جستجو و خلاصه‌سازی سوابق پزشکی الکترونیکی توسط مدی‌تک نشان از پتانسیل بزرگی برای بهبود ارائه خدمات بهداشتی و درمانی دارد.


منبع:
این مقاله در اصل در https://blog.google/technology/health/cloud-next-generative-ai-health/ منتشر شده است.

پیشرفت‌های جدید هوش مصنوعی در حوزه سلامت

بخش اول: پروژه‌های هوش مصنوعی در عرصه بهبود سلامت

تیم‌های مختلفی در گوگل در طول سال‌ها بر روی این مسئله تمرکز کرده‌اند که چگونه فناوری، به ویژه هوش مصنوعی و نوآوری‌های سخت‌افزاری، می‌تواند بهبود دسترسی به مراقبت‌های با کیفیت و عادلانه در سطح جهان ممکن کند. دسترسی به مراقبت‌های بهداشتی مناسب ممکن است بسته به اینکه افراد در کدام منطقه زندگی می‌کنند و آیا مراقبین محلی تجهیزات و آموزش‌های تخصصی برای کارهایی مانند اسکرینینگ بیماری دارند، چالش برانگیز باشد.
گوگل از سال‌ها پیش تحقیقات و برنامه‌های خود را گسترش داده‌است تا بر روی بهبود مراقبت‌هایی که پزشکان ارائه می‌دهند تمرکز کند و این امکان را فراهم کند که مراقبت‌ها به محل‌های خارج از بیمارستان‌ها و اتاق‌های دکتر‌ها منتقل شود.

بخش دوم: استفاده از دوربین‌های هوشمند گوشی برای حفاظت از سلامت قلبی و حفظ بینایی

یکی از پروژه‌های ابتدایی هوش مصنوعی در حوزه بهداشت، ARDA نام دارد که هدف از آن کمک به اسکرینینگ برای رتینوپاتی دیابتی است – یک عارضه از دیابت که، اگر تشخیص داده نشود و درمان نشود، می‌تواند منجر به نابینایی شود.
امروزه، ما روزانه ۳۵۰ بیمار را اسکرینینگ می‌کنیم که منجر به اسکن نزدیک به ۱۰۰۰۰۰ بیمار تا کنون شده است. به تازگی مطالعه تجربی را با برنامه ملی اسکرینینگ تایلند که نشان می‌دهد ARDA دقیق است و قابل اجرا به طور ایمن در مناطق مختلف برای پشتیبانی از اسکرینینگ دید نزدیک به چشم را به اتمام رسانده‌ایم.
به علاوه به بیماری‌های مرتبط با دیابت به شکلی جدید متوجه از عکس‌های بیرونی چشم پرداخته‌ایم، با استفاده از دوربین‌های میز کلینیک‌ها. با توجه به نتایج واعده‌آور اولیه، ما به تحقیقات بالینی با شرکا، از جمله EyePACS و بیمارستان چانگ گونگ مموریال (CGMH) برای بررسی اینکه آیا عکس‌ها از دوربین‌های هوشمند می‌توانند به تشخیص بیماری‌های مرتبط با دیابت و غیر دیابتی از عکس‌های چشم خارجی هم کمک کنند، نگریسته‌ایم. در حالی که این در مراحل اولیه تحقیق و توسعه است، مهندسان و دانشمندان ما به یک آینده ای روشن رویا دیده‌اند که افراد، با کمک دکتران خود، می‌توانند از شرایط سلامت خود در خانه‌هایشان بهتر فهمیده و تصمیم‌گیری کنند.

بخش سوم: ضبط و ترجمه صداهای قلب با گوشی‌های هوشمند

قبلا اظهار کردیم که سنسورهای تلفن همراه همراه با یادگیری ماشین می‌توانند به شما برقراری معیار‌های سلامت و بهداشت خود را آسان کنند و به شما برداشت‌هایی در مورد سلامت روزانه بیاورند. ویژگی ما که به شما اجازه می‌دهد تا نرخ ضربان قلب و نرخ تنفس خود را با دوربین تلفن همراه‌تان اندازه گیری کنید اکنون بر روی بیش از ۱۰۰ مدل دستگاه‌های اندروید و دستگاه‌های iOS موجود است. متن منتشر شده ما که نشان دهنده مطالعه اعتبارسنجی تجربی شده است مورد پذیرش برای انتشار قرار گرفته است.
امروز، ما یک حوزه تحقیق جدید را که بررسی می‌کند که چگونه میکروفون‌های داخلی تلفن‌های هوشمند می‌توانند صدای قلب را زمانی که بر روی سینه قرار گیرد، ضبط کنند را به اشتراک می‌گذاریم. گوش دادن به قلب و ریه‌های کسی با استفاده از استتوسکوپ، که به عنوان اسکولتیشن شناخته می‌شود، بخش اساسی از یک معاینه فیزیکی است. این می‌تواند به پزشکان در تشخیص اختلالات صمام قلب، مانند تنگی شریان آئور که اهمیت دارد که زود تشخیص داده شود، کمک کرد. اسکرینینگ برای تنگی شریان آئور به طور معمول نیازمند تجهیزات تخصصی است، مانند استتوسکوپ یا سونوگرافی، و ارزیابی حضوری.
تحقیقات اخیر ما بررسی می‌کند اینکه آیا یک تلفن همراه می‌تواند ضربان قلب و سوسان های صدایی را شناسایی کند. ما در حال حاضر در مراحل اولیه مطالعه بالینی هستیم، اما امیدواریم که کار ما بتواند افراد را به استفاده از تلفن همراه به عنوان یک ابزار اضافی برای ارزیابی سلامت قابل دسترس توانایی بخشد.

بخش چهارم: شراکت با دانشگاه پزشکی نورث‌وسترن برای استفاده از هوش مصنوعی در بهبود سلامت مادران

اولتراسونوگرافی یک روش تصویربرداری تشخیصی غیر تهاجمی است که از امواج صوتی با فرکانس بالا برای ایجاد تصاویر یا ویدیوهای زمان واقعی از اعضا داخلی یا سایر بافت‌ها، مانند عروق ونیادان‌ها و جنین‌ها، استفاده می‌کند.
تحقیقات نشان می‌دهد که اولتراسونوگرافی برای استفاده در مراقبت قبل از زایمان ایمن است و در شناسایی مشکلات در زمان زودبازی در حاملگی موثر است. با این حال، بیش از نیمی از والدینی که در کشورهای درآمد وسط و پایین زندگی می‌کنند دریافت اولتراسون نمی‌کنند، به خصوص به دلیل کمبود تخصص در خواندن اولتراسون. ما باور داریم که تخصص گوگل در یادگیری ماشین می‌تواند این مشکل را حل کند و اجازه دهد که بارداری‌های سالمتر و نتایج بهتری برای والدین و نوزادان به ارمغان بیاورد.
ما در حال کار بر روی مطالعات پایه و دسترسی باز به تحقیقات که اثبات می‌کند استفاده از هوش مصنوعی به کمک به انجام اولتراسون توسط ارائه دهندگان و انجام ارزیابی‌ها کمک می‌کند. ما خوشحالیم که با دانشگاه پزشکی نورث‌وسترن همکاری کنیم تا این مدل‌ها را برای استفاده گسترده‌تر در سطوح مختلف تجربه و فناوری توسعه دهیم. با ارزیابی های خودکار و دقیق تر از مخاطرات سلامتی مادر و جنین، ما امیدواریم برای کاهش موانع تشخیص مراقبت های به موقع در تنظیمات صحیح کمک کنیم.

دیدگاه کارشناس و نکات کلیدی:

این مقاله بهبودهای مهمی را در زمینه بهبود دسترسی به مراقبت‌های سلامتی با استفاده از هوش مصنوعی و فناوری‌ها نشان داده است. تلاش‌هایی که گوگل Health برای پشتیبانی از پزشکان و افراد در درک و تصمیم‌گیری بهتر درباره شرایط سلامتی خود انجام می‌دهد، می‌تواند بهبود چشم گیری بر روی سلامت عمومی داشته باشد. امیدواریم که پژوهش‌ها و تحقیقات جدید که انجام می‌شوند، بتوانند به نحو موثرتری به دسترسی به مراقبت‌های بهداشتی و درمانی کمک کنند.


منبع:
این مقاله در اصل در https://blog.google/technology/health/check-up-ai-developments-2022/ منتشر شده است.

به‌روزرسانی‌های Veo، Imagen و VideoFX، همراه با معرفی Whisk در Google Labs

اخبار جدیدی از گوگل منتشر شده است که شامل نسخه‌های به‌روز شده از مدل‌های تولید ویدیو و تصویر Veo 2 و Imagen 3 می‌شود. این مدل‌ها اکنون در ابزارهای لایه‌های سرعت VidoFX و ImageFX در گوگل لَبس (Google Labs) موجود است، همچنین یک ابزار جدید به نام Whisk معرفی شده است. Veo 2 ویدیوهای با کیفیت بالا را با بهبود واقع‌گرایی و درک سینماگرافی تولید می‌کند، در حالی که Imagen 3 تصاویر با روشنایی بیشتر و تنظیمات بهتر و در انواع و سبک‌های هنری مختلف تولید می‌کند.

معرفی Veo 2: تولید ویدیو به روز

ویدیو Veo 2 با کیفیت بسیار بالا در زمینه‌ها و سبک‌های گوناگون تولید می‌شود. Veo 2 در مقایسه با مدل‌های برتر توسط ارزیابان انسانی به نتایج به‌روزرسانی می‌رسد. این مدل بهترین درک از فیزیک دنیای واقعی و جزئیات و واقع‌بینی حرکت و ابرازات انسان را دارد که بهبودی در دقت و واقع‌گرایی کلی آن را کمک می‌کند. Veo 2 زبان منحصر به فرد سینماگرافی را می‌فهمد: از آن برای یک ژانر خواهید پرسید، عدسه‌ای مشخص کنید، اثرات سینمایی را پیشنهاد داده و Veo 2 آن‌ها را تحویل می‌دهد – با رزولوشن تا 4K و به طول دقایقی. درخواست کنید که یک فیلم کم زاویه ردیابی از میان یک صحنه راه بیابد، یا یک فیلم نزدیک از چهره یک دانشمندی که از میکروسکوپ خود خارج شده است، Veo 2 ایجاد خواهد کرد. در درخواست خود “لنز 18 میلیمتری” را ذکر کردید و Veo 2 می‌داند که باید فیلمی با زاویه پهن را تولید کند که این لنز شهرت دارد، یا پس‌زمینه‌ را تار کرده و بر روی موضوع خود تمرکز می‌کند. به این ترتیب ویدیوهای با کیفیت ویدیویی Veo 2 تولید می‌کند.

معرفی Imagen 3: تولید تصویر به روز

مدل تولید تصویر Imagen 3 نیز بهبود یافته و تصاویر با روشنایی بیشتر و تنظیمات بهتر تولید می‌کند. دقیقاترین انواع و سبک‌های هنری از واقع‌نمایی تا امپرسیونیسم، از آبستره تا آنیمه تولید می‌کند. این بهبود نیز به صورت دقیق‌تری به پیشنهادها پاسخ می‌دهد و جزئیات و بافت‌های غنی‌تری را تولید می‌کند. در مقایسه مستقیم خروجی‌های این مدل با مدل‌های تولید تصویر برتر توسط توسط تصمیم‌گیران انسانی، Imagen 3 به نتایج به‌روزرسانی می‌رسد.

معرفی Whisk: ابزار جدید برای تصویرسازی

Whisk، آخرین آزمایشگاه گوگل Labs، به شما امکان می‌دهد تصاویر ورودی یا ایجاد شده توسف که صحنه و سبک مورد نظر خود را منتقل می‌کنند. سپس شما می‌توانید آن‌ها را با هم ترکیب کرده و آن‌ها را بازخواهید به حالت خود، از یک لایه دیجیتالی تا یک پلاک انامل یا استیکر.

پایان مطلب
از این آپدیت‌های جدید گوگل می‌توان گفت که توانایی تولید ویدیو و تصویر در سطح بالا و به روزترین تکنولوژی‌ها را ارائه کرده است که این امر می‌تواند در زمینه‌های مختلفی از تولید محتوا تا استفاده در کسب و کارها و هنرها مورد استفاده قرار گیرد. این ابزارها با استفاده از هوش مصنوعی، جزئیات و حقایق بیشتری را تولید می‌کنند که این اتفاق می‌تواند کاربران را در بهبود روند خلاقیت و تولید محتوا یاری رساند. Whisk به‌عنوان یک آزمایش جدید، امکانات تصویرسازی پیشرفته را به کاربران ارائه می‌دهد و قابلیت‌های جدیدی را برای ادغام و میکس آپ تصاویر و سناریوها فراهم می‌کند.

با توجه به اینکه این امکانات جدید به سطح لاب‌های جوینده‌ها (Google Labs) معرفی شده‌اند، امکان استفاده از آن‌ها برای عموم فراهم شده است و این موضوع می‌تواند به گسترش استفاده و بهره‌وری از این ابزارها در میان کابران کمک کند.

نظرات ویژه شما و نکات کلیدی

با این آخرین به‌روزرسانی‌ها از گوگل، قدرت تولید ویدیو و تصویر به سطح بالاتری ارتقا یافته و مدل‌ها به‌روز شده‌ای که از توانایی‌های جدیدی از جمله تولید تصاویر روشن و تنظیمات بهتر برخوردار هستند، روانه بازار شده‌اند. استفاده از هوش مصنوعی در این ابزارها به جهت بهبود کیفیت و دقت به نتایج منجر شده است که این امر می‌تواند کمک بزرگی در فرآیندهای خلاقیت و تولید محتوا فراهم کند. این امکانات همچنین به صورت آزمایشی برای استفاده و ادغام آسان تر تصاویر و سناریوها در Whisk ارائه شده است که می‌تواند تجربه کاربری جدید و جذابی را برای کاربران فراهم کند.


منبع:
این مقاله در اصل در https://blog.google/technology/google-labs/video-image-generation-update-december-2024 منتشر شده است.

کشف منابع در NotebookLM: اضافه کردن تحقیقات وب به دفترچه یادداشت شما

از امروز، شما می‌توانید اطلاعات جدید و مربوط را به راحتی به دفترچه یادداشت خود اضافه کنید. NotebookLM اکنون به شما اجازه می‌دهد که منابع از وب را کشف کنید. تنها کافی است موضوع مورد نظر خود را توصیف کنید، و NotebookLM خواهد یافت و خلاصه کرد منابع مربوط برای شما. می‌توانید این منابع را با یک کلیک به دفترچه یادداشت خود اضافه کنید و از آن‌ها با سایر ویژگی‌های NotebookLM مانند فایل‌های بررسی و پرسش‌های متداول استفاده کنید.

معرفی عمومی

در حال حاضر، ویژگی جدید “کشف منابع” از NotebookLM به شما کمک می‌کند تا محتوای وب مرتبطی برای پروژه‌های خود پیدا کنید. فقط کافی است موضوع خود را توصیف کنید، و NotebookLM منابعی برای شما پیدا و خلاصه می‌کند. می‌توانید این منابع را با یک کلیک به دفترچه یادداشت خود اضافه کنید و از آن‌ها با ویژگی‌های دیگری مانند فایل‌های بررسی و پرسش‌های متداول استفاده کنید.

نحوه کارکرد

وقتی که موضوع خود را توصیف می‌کنید، NotebookLM صدها منبع ممکن را در چند ثانیه جمع‌آوری می‌کند. سپس آن‌ها را تحلیل می‌کند و براساس موضوع تعیین شده توسط شما، منابع مرتبط‌تر را انتخاب می‌کند. تا ۱۰ پیشنهاد منبع را ارائه می‌دهد، هر کدام با یک خلاصه اوصاف شرح داده شده است.

نظرات کارشناسی و نکات کلیدی

این ویژگی جدید کشف منابع در NotebookLM یک گزینه جدید و کاربردی برای شما ارائه می‌دهد تا به راحتی تحقیقات خود را گسترش دهید و اطلاعات معتبر و مرتبط با موضوع خود را به دفترچه یادداشت خود اضافه کنید. با این امکان، شما می‌توانید بسیار سریع و به راحتی یک مفهوم جدید را درک کنید یا مطالعات ضروری در مورد یک موضوع جمع‌آوری کنید.

ویژگی جالب دیگری که به شما ارائه شده است، دکمه “من احساس کنجکاوم” است که به شما امکان می‌دهد به سرعت کارکرد عامل کشف منابع محصول را مشاهده کنید.


منبع:
این مقاله در اصل در https://blog.google/technology/google-labs/notebooklm-discover-sources/ منتشر شده است.

پیشرفت تکنولوژی صوتی گوگل: اضافه شدن بیش از ۵۰ زبان به Audio Overviews

نقد و بررسی پیشرفت تکنولوژی صوتی گوگل

در تاریخ ۲۹ آوریل ۲۰۲۵، گوگل به صورت رسمی اعلام کرد که قابلیت Audio Overviews (خلاصه‌های صوتی) در بیش از ۵۰ زبان جدید از جمله ترکی، هندی و آفریقایی قابل دسترسی است. این قابلیت به شما این امکان را می‌دهد تا خلاصه‌های صوتی از یادداشت‌های خود را در زبان مورد نظرتان بشنوید، مانند یک پادکست درباره تحقیقاتتان.

قابلیت‌های جدید

با این به‌روزرسانی، امکان انتخاب زبان خروجی نیز به تنظیمات اضافه شده است که به شما این امکان را می‌دهد تا زبان مورد نظر خود را برای خلاصه‌های صوتی انتخاب کنید. این امکان به معلمان کمک می‌کند تا منابع درسی خود را به زبان‌های مختلف به دانش‌آموزان ارائه دهند و با شنوندگان مختلف بهتر ارتباط برقرار کنند.

نظرات ویژه

این به‌روزرسانی قابلیت جدید Audio Overviews در گوگل نشان از پیشرفت تکنولوژی در زمینه ترجمه و ارتباطات بین زبانی دارد. این امکان به کاربران جهانی کمک می‌کند تا به اطلاعات و محتواهای دیگر زبان‌ها دسترسی پیدا کنند و جامعه بین‌المللی زبانی را در دنیای دیجیتال تسهیل می‌کند.

نکات کلیدی

  • اضافه شدن بیش از ۵۰ زبان به خلاصه‌های صوتی گوگل
  • امکان انتخاب زبان خروجی برای خلاصه‌های صوتی
  • استفاده از تکنولوژی ترجمه برای شکستن موانع زبانی در ارتباطات

خلاصه این است که اضافه شدن بیش از ۵۰ زبان به Audio Overviews از یک راه حل نوین برای دسترسی به اطلاعات در دنیای چندزبانه است. این قابلیت به افراد بین‌المللی کمک می‌کند تا با تسهیل دسترسی به اطلاعات، ارتباطات بین‌زبانی را ترویج دهند و به جامعه جهانی آنلاین تنوع بیشتری بدهند.


منبع:
این مقاله در اصل در https://blog.google/technology/google-labs/notebooklm-audio-overviews-50-languages/ منتشر شده است.

ژول: عامل کدنویسی هوش مصنوعی خودران گوگل

**معرفی و ویژگی‌های عامل کدنویسی جدید گوگل**

معرفی ژول

[تاریخ: ۲۰ مه ۲۰۲۵]
گوگل به تازگی عامل کدنویسی خودران و هوش مصنوعی جدید خود، ژول، را به صورت بتای عمومی عرضه کرده است. این عامل می‌تواند کدهای شما را مطالعه کرده و وظایفی از قبیل نوشتن تست‌ها و رفع باگ‌ها را به صورت خودران انجام دهد. ژول به صورت ناهمزمان (asynchronous) در یک محیط ابری ایمن کار می‌کند و ویژگی‌هایی مانند تغییرات صوتی و ادغام با GitHub را ارائه می‌دهد.

ویژگی‌های ژول

ژول یک کمک کدهای انسانی (agentic) است که مستقیماً با مخازن موجود شما همگام می‌شود. این عامل کدها را به یک ماشین مجازی از Google Cloud منتقل کرده، سیاق کامل پروژه شما را درک می‌کند و وظایفی مانند نوشتن تست‌ها، ایجاد ویژگی‌های جدید، تهیه‌ی تغییرات صوتی، رفع باگ‌ها و به‌روز رسانی وابستگی‌ها را انجام می‌دهد. ژول به صورت ناهمزمان عمل می‌کند و به شما امکان می‌دهد در حالی که در پس‌زمینه کار می‌کند، بر روی وظایف دیگر خود متمرکز شوید.

امکانات ژول

– انجام وظایف بر روی کدهای واقعی بدون نیاز به محیط آزمایشی
– اجرای موازی: تسک‌ها داخل یک ماشین مجازی ابری اجرا می‌شود، امکان اجرای همزمان وظایف چندگانه را فراهم می‌کند
– توضیحات قابل مشاهده: ژول قبل از انجام تغییرات، برنامه خود و دلایلش را به شما نشان می‌دهد
– ادغام با GitHub: ژول در جایی کار می‌کند که شما همیشه کار می‌کنید، مستقیماً در جریان کار اصلی شما
– قابلیت کنترل توسط کاربر: قبل، حین و بعد از اجرا، شما می‌توانید برنامه ارائه شده تغییر دهید
– خلاصه‌های صوتی: ژول خلاصه‌های صوتی از تغییرات اخیر ارائه می‌دهد

نظر خودم

با وجود توسعه‌ی روزافزون هوش مصنوعی و افزایش نیاز به سرعت و دقت در فرآیند کدنویسی، عوامل کدنویسی مانند ژول می‌توانند به توسعه‌ی نرم‌افزارها کمک بزرگی کنند. اما نکته‌ی قابل توجه این است که به همراه پیشرفت تکنولوژی، نیاز به توجه به امنیت و حفظ حریم خصوصی همیشگی است و باید اطمینان حاصل شود که اطلاعات حساس کاربران در این فرآیند محافظت شده است.

نکات کلیدی

– ژول یک عامل کدنویسی هوش مصنوعی خودران است که به صورت ناهمزمان کار می‌کند
– این عامل وظایفی مانند نوشتن تست‌ها، ایجاد ویژگی‌های جدید و رفع باگ‌ها را انجام می‌دهد
– قابلیت ادغام با GitHub و ارائه‌ی خلاصه‌های صوتی از تغییرات اخیر
– دسترسی به سرویس ژول در مرحله‌ی بتای عمومی رایگان است، اما محدودیت‌های استفاده وجود دارد

I have rewritten the original article as requested. Let me know if you need any more assistance.


منبع:
این مقاله در اصل در https://blog.google/technology/google-labs/jules/ منتشر شده است.

همکاری DeepMind و Primordial Soup با کارگردان معروف در پروژه هوش مصنوعی فیلم‌سازی

همکاری بین DeepMind و Primordial Soup

امروز با اعلام همکاری بین Google DeepMind و Primordial Soup، یک ورودی جدید متعهد به نوآوری در داستان‌سرایی که توسط کارگردان نوآور درخشان Darren Aronofsky تأسیس شده، رونمایی می‌کنیم.
ویژن همکاری این دو شرکت این است که بهترین مدل تولید ویدیویی جهان را در دست تهیه‌کنندگان برتر فیلم قرار دهد و حدود تکنولوژی را برای داستان‌گویی خلاقانه و احساسی بیشتر گام بردارد.

فیلم‌های کوتاه تولیدی

Primordial Soup در حال تولید سه فیلم کوتاه با استفاده از مدل‌های هوش مصنوعی تولید ویدیویی، ابزارها و قابلیت‌های پیشرفته Google DeepMind، به ویژه Veo، می‌باشد. هر فیلم توسط یک فیلم‌ساز نوظهور تولید می‌شود که تحت راهنمایی آرونوفسکی و با حمایت تیم تحقیقاتی Google DeepMind قرار دارد.

فیلم اول: “ANCESTRA”

این فیلم توسط فیلم‌ساز برنده جوایز Eliza McNitt کارگردانی شده و در جشنواره تریبکا در تاریخ 13 ژوئن 2025 اکران خواهد شد. این فیلم از یک مدل تولید هیبریدی استفاده می‌کند که عملکرد زنده را با ابزارهای پیشرفته و تحقیقات هوش مصنوعی جدید یکپارچه می‌کند.

نظر کارشناسی و نکات کلیدی

این همکاری می‌تواند یک گام مهم در فرآیند تولید فیلم با استفاده از هوش مصنوعی و فناوری‌های پیشرفته باشد. ترکیب تجربیات کارگردانان معروف و تیم‌های تحقیقاتی باعث ایجاد فیلم‌هایی با داستان‌های عمیق‌تر و هیجان‌انگیز‌تر می‌شود. این همکاری نه تنها به کارگردانان جوان فرصتی برای یادگیری و توسعه مهارت‌های خود می‌دهد، بلکه به صنعت فیلم‌سازی به طرز قابل ملاحظه‌ای کمک خواهد کرد.


منبع:
این مقاله در اصل در https://blog.google/technology/google-labs/deepmind-primordial-soup-collaboration/ منتشر شده است.

گوگل مدل هوش مصنوعی Gemini 2.0 را معرفی می‌کند: یک مدل جدید برای دوران نماینده‌گری

گوگل طی گذشته‌ی سال پیشرفت‌های قابل توجهی در زمینه‌ی هوش مصنوعی داشته است. امروز، ما اولین مدل خانواده مدل‌های Gemini 2.0 را منتشر می‌کنیم: یک نسخه تجربی از Gemini 2.0 Flash. این مدلی است که با داشتن تاخیر کم و عملکرد بهبود یافته در حدود فناوری ما، در مقیاس‌های مختلف و با سرعتی بیش از پیش فعالیت می‌کند.

مدل Gemini 2.0 Flash

Gemini 2.0 Flash بر پایه‌ی موفقیت 1.5 Flash، محبوب‌ترین مدل ما برای توسعه دهندگان، با عملکرد بهبود یافته با زمان پاسخ مشابه سرعت. این مدل حتی نسخه 1.5 Pro را در آزمون‌های کلیدی برای خود در دو برابر سرعت پیشرفت داده است. 2.0 Flash همچنین با قابلیت‌های جدیدی همراه است. علاوه بر پشتیبانی از ورودی‌های چندگانه مانند تصاویر، ویدیو و صدا، 2.0 Flash اکنون حمایت از خروجی‌های چند گانه مانند تصاویر به صورت بومی تولیدی مخلوط با متن و صدای چندزبانه تلفظ‌پذیر. این همچنین می‌تواند به صورت بومی ابزارهایی مانند جستجو در گوگل، اجرای کد و همچنین توابع تعریف‌شده توسط کاربر استفاده کند.

هدف ما این است که مدل‌های خود را به صورت ایمن و سریع در دسترس توسعه‌دهندگان قرار دهیم. در گذشته‌ی گذشته، ما در میان توسعه‌دهندگان نسخه‌های آزمایشی زودرس Gemini 2.0 را به اشتراک گذاشتیم و بازخوردهای فوق‌العاده ای را از آن‌ها به دست آوردیم.
Gemini 2.0 Flash در حال حاضر به عنوان یک مدل آزمایشی برای توسعه‌دهندگان از طریق API Gemini در Google AI Studio و Vertex AI با ورودی چند گانه و خروجی متن برای تمام توسعه‌دهندگان و ورودی صدا و تولید تصویر بومی برای شرکای دسترسی زودرس در دسترس است. دسترسی عمومی به همراه اندازه‌های بیشتر مدل نیز در ژانویه ارائه خواهد شد.

برای کمک به توسعه‌دهندگان در ایجاد برنامه‌های پویا و تعاملی، ما همچنین یک API زنده چند گانه جدید را عرضه می‌کنیم که ورودی صوتی به صورت زمان واقعی، ویدیو استریم و توانایی استفاده از ابزارهای ترکیبی چندگانه را دارد. اطلاعات بیشتر درباره 2.0 Flash و API زنده چند گانه را می‌توانید در وبلاگ توسعه‌دهندگان ما پیدا کنید.

مدل Gemini 2.0 در نرم‌افزار Gemini، دستیار هوش مصنوعی ما

همچنین از امروز، کاربران Gemini در سراسر جهان می‌توانند به نسخه‌ی 2.0 Flash آزمایشی دسترسی داشته باشند. این مدل جدید را می‌توانند با انتخاب آن از لیست‌های پایینی در وب‌سایت و نمایشی تلفن همراه از نسخه‌ی دسکتاپ و وب موبایل در اپلیکیشن موبایل Gemini تجربه کنند. با این مدل جدید، کاربران می‌توانند تجربه‌ای حتی مفید‌تر از دستیار Gemini داشته باشند.

در اوایل سال آینده، ما قصد داریم از Gemini 2.0 بر روی محصولات بیشتر گوگل استفاده کنیم.

باز کردن تجارب نماینده‌گری با Gemini 2.0

قابلیت‌های اعمالی و کارگون شده‌ی اکشن‌های رابط کاربری بومی Gemini 2.0 Flash، همراه با بهبودهای دیگر مانند استدلال چندگانه، درک طولانی مدت، پیروی از دستورات پیچیده و برنامه‌ریزی، تشکیل وظایف کمپوزیتوری، استفاده از ابزار بومی و بهبود زمان پاسخگویی، همه با هم برای امکان فراهم کردن یک کلاس جدید از تجربیات نماینده‌گری کار می‌کنند.

هدف عملیاتی از نماینده‌های هوش مصنوعی یک حوزه پژوهشی پر از امکانات جذاب است. ما این مرز جدید را با سری از پروتو‌تایپ‌ها که به امکانات آینده‌ی یک دستیار یونیورسال هوش مصنوعی می‌پردازد، باز می‌کنیم؛ پروژه آسترا که دقیق‌تر به بررسی پروژه‌ها در زمینه‌ی نماینده‌گری پرداخته است؛ پروژه مارینر که به بررسی آینده‌ی تعامل انسان و نماینده روشن می‌کند؛ و ژول، یک نماینده‌ی کد پیشرفته که می‌تواند به توسعه‌دهندگان کمک کند.

با اینکه ما هنوز در مراحل اولیه توسعه هستیم، اما خوشحالیم که ببینیم چگونه ضامنان آزمایشی از این قابلیت‌های جدید استفاده می‌کنند و چه درس‌هایی می‌توانیم به دست آوریم تا بتوانیم آن‌ها را در آینده در محصولات به صورت گسترده‌تر قرار دهیم.

پروژه آسترا: نماینده‌ها با استفاده از درک چندگانه در دنیای واقعی

از زمان معرفی پروژه آسترا در I/O، ما از ضامنان آزمایشی استفاده آن در گوشی‌های Android یاد گرفته‌ایم. بازخوردات ارزشمند آنها به ما کمک کرده‌اند تا بهتر بفهمیم چگونه یک دستیار هوش مصنوعی یونیورسال در عمل کار کند، از جمله پیامدها برای ایمنی و اخلاق. بهبودهای موجود در آخرین ورژنی که با Gemini 2.0 ساخته شده است عبارت‌اند از:
بهبود دیالوگ: پروژه آسترا اکنون برای صحبت در چند زبان و صحبت در زبان‌های مختلط، با فهم بهتر اکسنت‌ها و کلمات غیرمعمول است.
استفاده از ابزارهای جدید: با Gemini 2.0، پروژه آسترا می‌تواند از جستجوی گوگل، لنز و نقشه‌ها استفاده کند که آن را مفیدتر در زندگی روزمره‌ی شما می‌کند.
حافظه بهتر: ما توانایی پروژه آسترا برای یادآوری چیزها را بهبود داده‌ایم در حالی که همچنان زیر کنترل شما هستیم. حالا این دارای حافظه تا ۱۰ دقیقه از حافظه نشست است و می‌تواند گفت‌وگوهای بیشتری که با آن داشته‌اید در گذشته را به یاد داشته باشد تا بهتر شخصی‌سازی شود.
کاهش زمان فعال: با قابلیت‌های جدید استریمینگ و درک صوتی بومی، نماینده می‌تواند به زبان را با زمان دقیقه‌ی صحبت انسان درک کند.

ما در حال کار هستیم تا این امکانات را به محصولات گوگل مانند نرم‌افزار Gemini، دستیار هوش مصنوعی ما، و به سایر طرح‌های مانند عینک‌ها برسانیم. و ما شروع به توسعه‌ی برنامه آزمایشی ضامنان به بیشتر مردم کرده‌ایم، از جمله گروه کوچکی که به زودی با پروتوتایپ عینک‌های آزمایشی پروژه آسترا را آزمایش خواهند کرد.

پروژه مارینر: نماینده‌ها که به شما کمک می‌کنند تا وظایف پیچیده را انجام دهید

پروژه مارینر یک پروتوتایپ پژوهشی اولیه است که با استفاده از Gemini 2.0، آینده‌ی تعامل انسان و نماینده را، از جهت ابتدایی از مرورگرتان آغاز می‌کند. به عنوان یک پروتوتایپ پژوهشی، می‌تواند درک و استدلال بر روی اطلاعات در صفحه‌ی مرورگر شما، از جمله پیکسل‌ها و عناصر وب مانند متن، کد، تصاویر و فرم‌ها، را به کار ببرد و سپس این اطلاعات را از طریق یک افزونه Chrome آزمایشی برای شما به پایان انجامد.

ژول: نماینده‌ها برای توسعه‌دهندگان

در مرحله‌ی بعد، ما به دنبال این هستیم که نماینده‌های هوش مصنوعی چگونه می‌توانند توسعه‌دهندگان را یاری نمایند با ژول – یک نماینده کد تجربی که مستقیماً در یک جریان کاری GitHub یکپارچه شده است. این تلاش قسمتی از هدف درازمدت ما برای ساختن نماینده‌های هوشی است که در تمام حوزه‌ها، از جمله کدزنی، مفید باشند.

در پایان، اطلاعات من راجع به ورودی متنی تبدیل شده است که فکر می‌کنم که شما باید یه مبحثی راجع به اون اضافه کنید.

نظریه:
این معرفی از مدل Gemini 2.0 برای دوران نماینده‌گری نشان می‌دهد که گوگل همچنان در حال پیشرفت در زمینه‌ی هوش مصنوعی است. این مدل با قابلیت‌های چندگانه و توانمندی‌های بیشت


منبع:
این مقاله در اصل در https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024 منتشر شده است.

گوگل I/O 2025: ژمینی به عنوان یک دستیار هوش مصنوعی یونیورسال

ویژگی‌های پروژه آسترا

گوگل در این راه سعی دارد تا اپلیکیشن ژمینی را به یک دستیار هوش مصنوعی یونیورسال تبدیل کند که وظایف روزانه ما را انجام دهد، از امور معمولی مونتاژ ما را به دست گیرد و پیشنهادات خوشایند و جدید را به ما معرفی کند تا ما تولیدی تر باشیم و زندگی‌مان را غنی‌تر سازیم. این آغاز از قابلیت‌هایی بود که ما سال گذشته در پیشتری تحقیقاتی خود در پروتوتایپ پروژه آسترا، مانند درک ویدئوها، به اشتراک گذاری صفحه نمایش و حافظه، را کاوش کردیم.

ساختن هوش مصنوعی که بتواند چند وظیفه را برای شما انجام دهد

همچنین، ما داریم که نطریه‌هایی دربارهء اینکه چگونه قابلیت‌های عملکردی می‌توانند به افراد در چند وظیفه‌ای کمک کنند، با پروژه مارینر کاوش می‌کنیم. این یک پروتوتایپ تحقیقاتی است که آینده تعامل انسان-عامل را بررسی می‌کند، از نیمهٔ دسامبر گذشته شروع کرد. ما اکنون یک سامانه از عامل‌ها داریم که می‌توانند تا ده وظیفه مختلف را همزمان انجام دهند. این عامل‌ها می‌توانند به شما در جستجوی اطلاعات کمک کنند، رزروی را پیدا نمایند، ارزان‌ترین قیمت‌ها را بیابند، تحقیق کنند و موارد بیشتر را انجام دهند – همه در همان زمان.

نظرات خود اولین و بلندیکه

این پیشرفت‌های بی‌نظیر ما نشان می‌دهد که ما در حال ساختن هوش مصنوعی‌ای هستیم که شخصی‌تر، پرخاستگارتر و قدرتمندتر است، زندگی‌مان را بهبود می‌دهد، تازه‌ترین درجات پیشرفت علمی را به جلو می‌برد و عصر طلایی تازه‌ای از کشف و تعجب را معرفی می‌کند. این به نظر منظور شخصی، یک گام بسیار حیاتی در توسعه نوع جدیدی از هوش مصنوعی است که قابلیت‌های ژمینی را استفاده‌گری جهانی از آن به عنوان یک دستیار هوش مصنوعی یونیورسال می‌دهد.

این مقاله درباره پیشبرد تحقیقات و توسعه AI توسط گوگل است که قرار است هوش مصنوعی‌ای جدید و کاملاً کاربردی را ارایه دهد. هدف از گوگل I/O 2025، تبدیل ژمینی به دستیاری هوش مصنوعی با قابلیت‌های جهانی است که بتواند برای شما برنامه‌ریزی کند و اقداماتی را به نیابت از شما انجام دهد. این پیشرفت‌های گران‌قیمت به نوعی نشان از توانائی گوگل در راه‌اندازی هوش مصنوعی بیشتر و با اهمیت است و می‌تواند یک فصل جدید در تکنولوژی و هوش مصنوعی به راه بیاورد.


منبع:
این مقاله در اصل در https://blog.google/technology/google-deepmind/gemini-universal-ai-assistant/ منتشر شده است.