بایگانی‌های یادگیری عمیق

نوشته‌ها

مجموعه داده MNIST Dataset

نوامبر 20, 2024/در مجموعه داده رایگان, یادگیری ماشین و هوش مصنوعی /توسط کامران محمودی

اگر به یادگیری عمیق (Deep Learning) یا بینایی ماشین علاقه‌مند هستید، مجموعه داده MNIST یکی از بهترین گزینه‌ها برای شروع است. این مجموعه شامل تصاویر دست‌نویس اعداد 0 تا 9 بوده و برای تمرین مدل‌های دسته‌بندی در یادگیری ماشین و یادگیری عمیق طراحی شده است.

توضیح کوتاه درباره مجموعه داده MNIST

نوع داده: تصاویر سیاه و سفید 28×28 پیکسلی از اعداد دست‌نویس.
تعداد نمونه‌ها:
- داده‌های آموزشی: 60,000 نمونه
- داده‌های تست: 10,000 نمونه
تعداد کلاس‌ها: 10 (اعداد 0 تا 9).

هدف از این مجموعه داده، دسته‌بندی صحیح تصاویر اعداد دست‌نویس است.

کاربردها و مزایا

شروع کار با شبکه‌های عصبی: برای درک اصول شبکه‌های عصبی، این مجموعه داده بسیار ایده‌آل است.
تمرین مدل‌های ساده و پیچیده: از الگوریتم‌های ساده مثل Logistic Regression تا مدل‌های پیچیده مانند CNN را می‌توان روی این داده آزمایش کرد.
سبک و سریع: پردازش و آموزش روی این مجموعه داده زمان زیادی نمی‌برد و نیاز به منابع سخت‌افزاری سنگین ندارد.

ساختار داده‌ها

هر تصویر در قالب آرایه‌ای 28×28 ارائه شده که هر مقدار نشان‌دهنده شدت روشنایی یک پیکسل است (مقداری بین 0 تا 255).

چگونه به این داده‌ها دسترسی پیدا کنید؟

این مجموعه داده به صورت رایگان در دسترس است. لینک دانلود مستقیم:
دانلود مجموعه داده MNIST

پیشنهادات برای پروژه‌های یادگیری

ساخت یک مدل ساده با استفاده از الگوریتم‌های پایه مانند KNN یا SVM.
پیاده‌سازی یک شبکه عصبی کانولوشن (CNN) برای دسته‌بندی تصاویر.
بررسی تأثیر کاهش ابعاد با PCA روی عملکرد مدل.
بهبود دقت با تکنیک‌های Data Augmentation.

مجموعه داده MNIST یک انتخاب کلاسیک برای ورود به دنیای بینایی ماشین و یادگیری عمیق است که مفاهیم اولیه را به بهترین شکل آموزش می‌دهد. 🚀

ایجاد عنوانی از کلمات کلیدی برای تصویر

می 11, 2024/در پایتون, مینی پروژه /توسط کامران محمودی

مدل های یادگیری عمیق امروزه در حل مسائل مختلف بر روی تصاویر و ویدیوها کاربرد فراوانی دارند. یکی از این مسائل، تولید عنوان بر اساس تصاویر ورودی است. در این مقاله، قصد داریم با استفاده از دو مدل یادگیری عمیق پیش آموزش داده شده، یک عنوان برای تصویر ورودی ایجاد کنیم.

مدل اول که از مدل ResNet50 بدون لایه‌ی کلاس بالا برای استخراج ویژگی‌ها استفاده می‌کنیم، برای تشخیص ویژگی‌های بصری از تصویر استفاده می‌شود. این مدل با استفاده از یک شبکه عصبی عمیق، ویژگی‌های بالادستی متصل به کلاس‌های مختلف تصاویر را استخراج می‌کند.

مدل دوم که از یک مدل شبکه عصبی عمیق به نام SSD300 برای تشخیص اشیاء در تصویر استفاده می‌کنیم. این مدل قادر است تا چندین شیء مختلف را در یک تصویر تشخیص دهد. برای اینکه مدل بتواند اشیاء را به درستی تشخیص دهد، از یک نقشه برچسب استفاده می‌کنیم که شاخص کلاس‌ها را به نام‌های اجسام مختلف نگاشت می‌کند.

با ادغام قابلیت‌های این دو مدل، ابتدا با استفاده از مدل ResNet50 ویژگی‌های تصویر را استخراج می‌کنیم. سپس با استفاده از مدل SSD300 اشیاء موجود در تصویر را تشخیص داده و نام آن‌ها را استخراج می‌کنیم. در نهایت، با استفاده از نام‌های اشیاء شناسایی شده، یک عنوان برای تصویر ایجاد می‌کنیم.

در مجموع، این روش ترکیب قابلیت‌های یک مدل برای استخراج ویژگی‌ها و یک مدل دیگر برای تشخیص اشیاء، منجر به ایجاد یک عنوان بر اساس اشیاء شناسایی شده در تصویر می‌شود.


import tensorflow as tf
from tensorflow.keras.applications import ResNet50
from tensorflow.keras.applications.resnet50 import preprocess_input, decode_predictions
import numpy as np

# Load pre-trained ResNet50 model
model = ResNet50(weights='imagenet')

def generate_title(image_path):
# Load and preprocess the image
img = tf.keras.preprocessing.image.load_img(image_path, target_size=(224, 224))
img_array = tf.keras.preprocessing.image.img_to_array(img)
img_array = np.expand_dims(img_array, axis=0)
img_array = preprocess_input(img_array)

# Make predictions
predictions = model.predict(img_array)
# Decode predictions
decoded_predictions = decode_predictions(predictions, top=10)[0]

# Extract labels from predictions
labels = [label for (_, label, _) in decoded_predictions]

# Generate title based on labels
title = " ".join(labels)

return title

# Example usage
image_path = "example_image.jpg"
title = generate_title(image_path)
print("Generated Title:", title)

آپاچی اسپارک

آوریل 17, 2024/0 دیدگاه /در کلان داده (بیگ دیتا), وبلاگ /توسط کامران محمودی

با افتخار اپاچی اسپارک (Apache Spark) را به عنوان یکی از معتبرترین و پرکاربردترین فریم‌ورک‌های پردازش داده توزیع‌شده معرفی می‌کنم. اسپارک نه تنها به عنوان یک ابزار برای پردازش داده بلکه به عنوان یک مجموعه از کتابخانه‌ها و ابزارهای توسعه نیز شناخته می‌شود.

چرا اسپارک مهم است؟

کارآیی بالا: اسپارک از مدل اجرای موازی و توزیع‌شده برای پردازش داده استفاده می‌کند، که به انجام پردازش‌های پیچیده بر روی داده‌های بزرگ با سرعت بسیار بالا کمک می‌کند. این به معنای اجرای سریع تر و کارآیی بهتر برای تحلیل داده‌هاست.
پشتیبانی از چندین زبان برنامه‌نویسی: اسپارک از زبان‌های متعددی از جمله Scala، Java، Python، و R پشتیبانی می‌کند. این امکان را فراهم می‌کند تا برنامه‌نویسان با زبانی که با آن آشنا هستند، به راحتی از این فریم‌ورک استفاده کنند.

معماری اسپارک

محیط اجرا (Runtime Environment): اسپارک بر روی یک کلاستر از کامپیوترها اجرا می‌شود. این کلاستر می‌تواند شامل چندین ماشین باشد و از طریق مدیریت کلاستر، اجرای پردازش‌ها را توزیع می‌کند.
مدل اجرای موازی: اسپارک از مدل MapReduce الهام گرفته است. کدهای برنامه شما به دسته‌های کوچک‌تر تقسیم شده و سپس بوسیله توابع map و reduce به همگام‌سازی و پردازش موازی انجام می‌شود.
توزیع متغیرها (Resilient Distributed Datasets – RDDs): از RDDs به عنوان یک مفهوم مهم در اسپارک برای نگهداری و پردازش داده‌ها استفاده می‌شود. RDDs تا زمانی که داده‌های توزیع‌شده را نمایندگی می‌کنند، امکان بازیابی و بازیابی داده در صورت خرابی را فراهم می‌کنند.

کاربردهای اسپارک

پردازش داده بزرگ: اسپارک به شرکت‌ها و سازمان‌ها این امکان را می‌دهد که داده‌های بزرگ را به بهره‌وری پردازش کنند. این امر در تحلیل داده‌ها، معدن‌کاری داده، پردازش و تحلیل لاگ‌های وب و بسیاری از دیگر کاربردها مفید است.
آموزش مدل‌های یادگیری عمیق (Deep Learning): اسپارک ابزارهایی مانند MLlib را ارائه می‌دهد که به برنامه‌نویسان امکان آموزش و اجرای مدل‌های یادگیری عمیق بر روی داده‌های خود را می‌دهد.
پردازش تصاویر و صدا: اسپارک قابلیت پردازش تصاویر و صدا را دارد و می‌تواند در کاربردهای مرتبط با تصاویر و ویدیوها مورد استفاده قرار گیرد.

خلاصه‌ی آخر

اپاچی اسپارک به عنوان یک فریم‌ورک قدرتمند برای پردازش داده‌های بزرگ و توزیع‌شده شناخته می‌شود. از کارآیی بالا، پشتیبانی از چندین زبان برنامه‌نویسی و معماری انعطاف‌پذیر اسپارک، تا کاربردهای متنوع و گسترده‌ای دارد. اگر به تحلیل داده‌های بزرگ و پردازش تصاویر، ویدئوها و یادگیری عمیق علاقه‌مند هستید، اسپارک یک ابزار بسیار مفید و قدرتمند برای شماست.

در طول زمان، اسپارک به یک اکوسیستم گسترده از کتابخانه‌ها و ابزارهای متنوع تبدیل شده است که برای کاربردهای مختلف توسعه داده می‌شوند. برخی از این ابزارها شامل:

MLlib: کتابخانه یادگیری ماشین برای اجرای الگوریتم‌های یادگیری ماشین و تحلیل داده.
GraphX: کتابخانه پردازش گراف برای تحلیل و مدیریت داده‌های گرافی.
Spark Streaming: برای پردازش و تحلیل داده‌های جریانی (Stream Data).
Spark SQL: برای اجرای کوئری‌ها و تحلیل داده‌ها با استفاده از SQL.
Structured Streaming: برای پردازش داده‌ها به صورت آنلاین و به روز رسانی مستمر.

در نهایت، اسپارک توسعه‌ی بهره‌وری و سرعت در پردازش داده‌های بزرگ را تا حد زیادی تسهیل می‌کند. از تحلیل داده‌های وب و شبکه‌های اجتماعی گرفته تا معدن‌کاری داده و آموزش مدل‌های یادگیری ماشین، اسپارک در میان بزرگترین شرکت‌ها و سازمان‌ها به عنوان یک ابزار اساسی برای پردازش داده‌های بزرگ شناخته می‌شود.

به طور کلی، اسپارک به عنوان یکی از مهمترین فریم‌ورک‌ها برای پردازش داده توزیع‌شده با توانمندی‌های بالا و امکانات گسترده تشخیص داده می‌شود. اگر در زمینه تحلیل داده فعالیت دارید یا به دنبال ابزاری برای پردازش داده‌های بزرگ هستید، اسپارک بسیار مناسب و حیاتی است.