پرش به محتوا

عصر داده های بزرگ

نوابغ جدید و ثروتمند در سیلیکون ولی، ابتدا در گوگل و اکنون در فیسبوک، ماهر در بهره‌برداری از داده‌های وب – جستجوهای آنلاین، پست‌ها و پیام‌ها – با تبلیغات اینترنتی هستند. در جلسه انجمن اقتصاد جهانی در ماه گذشته در داووس، سوئیس، داده‌های بزرگ یک موضوع مهم بود. در گزارشی که توسط این انجمن منتشر شد و با عنوان “داده‌های بزرگ، تأثیر بزرگ”، داده‌ها را یک دسته جدید از دارایی‌های اقتصادی، مثل ارز یا طلا، نامگذاری کردند.

ریک اسمولان، خالق مجموعه عکاسی “روز در زندگی”، قصد دارد در اواخر امسال یک پروژه به نام “چهره انسانی داده‌های بزرگ” راه‌اندازی کند که به مستندسازی جمع‌آوری و استفاده از داده‌ها می‌پردازد. آقای اسمولان به عنوان یک علاقه‌مند، می‌گوید که داده‌های بزرگ پتانسیلی دارد که “داشبورد انسانیت” باشد، یک ابزار هوشمند که می‌تواند در مبارزه با فقر، جرم و آلودگی به کار گرفته شود. مدافعان حریم خصوصی نگرشی منفی دارند و اخطار می‌دهند که داده‌های بزرگ معادل “برادر بزرگ” در لباس شرکتی است.

داده‌های بزرگ چیست؟ بدون شک، یک میم و یک اصطلاح بازاریابی است، اما همچنین اختصاری است برای روندهای پیشرفته در فناوری که درب را برای رویکردی جدید به درک جهان و تصمیم‌گیری‌ها باز می‌کند. داده‌های بسیاری وجود دارد و این روند در حال رشد با نرخ ۵۰ درصد در سال یا بیشتر از دو برابر شدن هر دو سال است، طبق برآورد یک شرکت تحقیقات فناوری به نام IDC.  این موضوع صرفاً درباره بیشتر شدن جریان‌های داده نیست، بلکه درباره عصری جدید است. به عنوان مثال، در حال حاضر سنسورهای دیجیتال بی‌شماری در سراسر جهان در تجهیزات صنعتی، خودروها، اندازه‌گیری‌های برقی و صندوق‌های حمل و نقل وجود دارند. آن‌ها قادرند موقعیت، حرکت، لرزش، دما، رطوبت، حتی تغییرات شیمیایی در هوا را اندازه‌گیری کنند و ارتباط برقرار کنند.

با اتصال این سنسورهای ارتباطی به هوش محاسباتی، شاهد ظهور آنچه به آن اینترنت اشیاء یا اینترنت صنعتی گفته می‌شود هستیم. دسترسی به اطلاعات بهبود یافته نیز در حال تحریک روند داده‌های بزرگ است. به عنوان مثال، داده‌های دولتی مانند آمارهای اشتغال و سایر اطلاعات به طور پیوسته در حال مهاجرتبه وب شد. در سال ۲۰۰۹، واشنگتن با راه‌اندازی سایت وب Data.gov، درب داده‌های دولتی را به صورت گسترده‌تری برای عموم باز کرد.

داده‌ها نه تنها در معرض دسترسی بیشتری قرار می‌گیرند، بلکه برای کامپیوترها نیز قابل فهم‌تر خواهند شد. اکثر افزایش داده‌های بزرگ مربوط به داده‌های نامنظم است – چیزهایی مانند کلمات، تصاویر و ویدیوها در وب و آن جریان‌های داده سنسورها. آنها به عنوان داده‌های ناپیوسته شناخته می‌شوند و معمولاً در پایگاه‌های داده سنتی مورد استفاده قرار نمی‌گیرند.

منبع: مجله نیویورک تایمز