این پست در واقع بخشی از مقدمه پروژه کارشناسیم هست ( البته با کمی تغییر توی لحن و خود مقدمه ) که چون خودم به موضوعش علاقمندم و به نظرم جالبه گفتم اینجا هم بنویسمش .
در زمان نه چندان دور بخش عمده تولید محتواهای ویدیویی محدود میشد به بخش کوچکی از جامعه که شامل تولیدکنندگان فیلمهای سینمایی ، تولیدکنندگان برنامه های تلوزیونی و تبلیغات و … میشد . اما شروع رشد انفجاری شبکههای اجتماعی و ظهور تلفنهای هوشمند با امکان ضبط تصاویر با کیفیت ، باعث شد تا هرکسی با یک گوشی هوشمند و دسترسی به اینترنت بتونه به یک تولیدکننده نسبتا بزرگ محتوا تبدیل بشه.
تا حالا شده فکر کنید که این خیل عظیم تولیدکنندگان محتوا در روز چه حجم از دادههای ویدیوای رو میتونند تولید کنند؟
از فیلمهای هالیوودی و بالیوودی گرفته تا فیلمهای خودمونی (مثل دامسمشها :دی) که با تلفنهای هوشمندمون ضبط میکنیم و راهی شبکههای اجتماعیمون میکنیم و حتی تصاویر در حال ضبط به وسیله دوربینهای مدار بسته و امنیتی و … همه و همه دادههای ویدیویی هستند که همه روزه توسط ما تولید میشن .
برای اینکه معیاری از این موضوع داشته باشیم بد نیست بدونید که در هر دقیقه به طور میانگین ۱۰۰ ساعت فیلم بروی سایت YouTube آپلود میشه !
خب حالا با توجه به این که این عدد فقط مقدار ویدیوهای آپلود شده روی یک سایت هست میشه حدس زد که موضوع جستجو ، تحلیل ، بررسی و طبقهبندی این سونامی عظیم از دادههای ویدیویی چقدر میتونه ترسناک باشه .
حالا راه حل برای کمتر ترسناک کردن این موضوع چیه ؟
بهترینترین روشی و راهکاری که میتونه این اتفاق رو از حالت ترسناک بودن در بیاره خلاصه سازیه ، البته مسلما نه به صورت دستی ، بلکه به صورت اتوماتیک و به وسیله الگوریتمهای که تا حد ممکن میتونن این کار رو با دقت بالایی انجام بدن .
وقتی ما خلاصهای با کیفیت از هر ویدیو مورد برسی داشته باشیم مسلما موضوعاتی مثل جستجو ، تحلیل ، بررسی و طبقهبندی این دادهها به شکل چشمگیری سریعتر و راحتر خواهد شد .
توی پستهای بعدی بیشتر راجع به روشهای و مدلهای مختلف الگوریتمهای خلاصه سازی و تجربیات خودم توی این موضوع مینویسم .