سونامی داده‌های ویدیویی

استاندارد

این پست در واقع بخشی از مقدمه‌‌ پروژه کارشناسیم هست ( البته با کمی تغییر توی لحن و خود مقدمه ) که چون خودم به موضوعش علاقمندم و به نظرم جالبه گفتم اینجا هم بنویسمش .

در زمان نه چندان دور بخش عمده تولید محتواهای ویدیویی محدود میشد به بخش کوچکی از جامعه که شامل تولیدکنندگان فیلمهای سینمایی ، تولیدکنندگان برنامه های تلوزیونی و تبلیغات و … میشد . اما شروع رشد انفجاری شبکه‌های اجتماعی و ظهور تلفن‌های هوشمند با امکان ضبط تصاویر با کیفیت ، باعث شد تا هرکسی با یک گوشی هوشمند و دسترسی به اینترنت بتونه به یک تولیدکننده نسبتا بزرگ محتوا تبدیل بشه.

تا حالا شده فکر کنید که این خیل عظیم تولیدکنندگان محتوا در روز چه حجم از داده‌های ویدیو‌ای رو میتونند تولید کنند؟

از فیلم‌های هالیوودی و بالیوودی گرفته تا فیلم‌های خودمونی‌ (مثل دامسمش‌ها :دی) که با تلفن‌های هوشمندمون ضبط می‌کنیم و راهی شبکه‌های اجتماعیمون می‌کنیم و حتی تصاویر در حال ضبط به وسیله دوربین‌های مدار بسته و امنیتی و …  همه و همه داده‌های ویدیویی هستند که همه روزه توسط ما تولید میشن .

برای اینکه معیاری از این موضوع داشته باشیم بد نیست بدونید که در هر دقیقه به طور میانگین ۱۰۰ ساعت فیلم بروی سایت YouTube آپلود می‌شه !

Youtube-stats

خب حالا با توجه به این که این عدد فقط مقدار ویدیو‌های آپلود شده روی یک سایت هست میشه حدس زد که موضوع جستجو ، تحلیل ، بررسی و طبقه‌بندی این سونامی عظیم از داده‌های ویدیویی چقدر میتونه ترسناک باشه .

حالا راه حل برای کمتر ترسناک کردن این موضوع چیه ؟
بهترین‌ترین روشی‌ و راهکاری که میتونه این اتفاق رو از حالت ترسناک بودن در بیاره خلاصه سازیه ، البته مسلما نه به صورت دستی ، بلکه به صورت اتوماتیک و به وسیله الگوریتم‌های که تا حد ممکن می‌تونن این کار رو با دقت بالایی انجام بدن .
وقتی ما خلاصه‌ای با کیفیت از هر ویدیو مورد برسی داشته باشیم مسلما موضوعاتی مثل جستجو ، تحلیل ، بررسی و طبقه‌بندی این داده‌ها به شکل چشمگیری سریعتر و راحتر خواهد شد .

توی پستهای بعدی بیشتر راجع به روشهای و مدل‌های مختلف الگوریتم‌های خلاصه سازی و تجربیات خودم توی این موضوع مینویسم .