عصر داده های بزرگ
نوابغ جدید و ثروتمند در سیلیکون ولی، ابتدا در گوگل و اکنون در فیسبوک، ماهر در بهرهبرداری از دادههای وب – جستجوهای آنلاین، پستها و پیامها – با تبلیغات اینترنتی هستند. در جلسه انجمن اقتصاد جهانی در ماه گذشته در داووس، سوئیس، دادههای بزرگ یک موضوع مهم بود. در گزارشی که توسط این انجمن منتشر شد و با عنوان “دادههای بزرگ، تأثیر بزرگ”، دادهها را یک دسته جدید از داراییهای اقتصادی، مثل ارز یا طلا، نامگذاری کردند.
ریک اسمولان، خالق مجموعه عکاسی “روز در زندگی”، قصد دارد در اواخر امسال یک پروژه به نام “چهره انسانی دادههای بزرگ” راهاندازی کند که به مستندسازی جمعآوری و استفاده از دادهها میپردازد. آقای اسمولان به عنوان یک علاقهمند، میگوید که دادههای بزرگ پتانسیلی دارد که “داشبورد انسانیت” باشد، یک ابزار هوشمند که میتواند در مبارزه با فقر، جرم و آلودگی به کار گرفته شود. مدافعان حریم خصوصی نگرشی منفی دارند و اخطار میدهند که دادههای بزرگ معادل “برادر بزرگ” در لباس شرکتی است.
دادههای بزرگ چیست؟ بدون شک، یک میم و یک اصطلاح بازاریابی است، اما همچنین اختصاری است برای روندهای پیشرفته در فناوری که درب را برای رویکردی جدید به درک جهان و تصمیمگیریها باز میکند. دادههای بسیاری وجود دارد و این روند در حال رشد با نرخ ۵۰ درصد در سال یا بیشتر از دو برابر شدن هر دو سال است، طبق برآورد یک شرکت تحقیقات فناوری به نام IDC. این موضوع صرفاً درباره بیشتر شدن جریانهای داده نیست، بلکه درباره عصری جدید است. به عنوان مثال، در حال حاضر سنسورهای دیجیتال بیشماری در سراسر جهان در تجهیزات صنعتی، خودروها، اندازهگیریهای برقی و صندوقهای حمل و نقل وجود دارند. آنها قادرند موقعیت، حرکت، لرزش، دما، رطوبت، حتی تغییرات شیمیایی در هوا را اندازهگیری کنند و ارتباط برقرار کنند.
با اتصال این سنسورهای ارتباطی به هوش محاسباتی، شاهد ظهور آنچه به آن اینترنت اشیاء یا اینترنت صنعتی گفته میشود هستیم. دسترسی به اطلاعات بهبود یافته نیز در حال تحریک روند دادههای بزرگ است. به عنوان مثال، دادههای دولتی مانند آمارهای اشتغال و سایر اطلاعات به طور پیوسته در حال مهاجرتبه وب شد. در سال ۲۰۰۹، واشنگتن با راهاندازی سایت وب Data.gov، درب دادههای دولتی را به صورت گستردهتری برای عموم باز کرد.
دادهها نه تنها در معرض دسترسی بیشتری قرار میگیرند، بلکه برای کامپیوترها نیز قابل فهمتر خواهند شد. اکثر افزایش دادههای بزرگ مربوط به دادههای نامنظم است – چیزهایی مانند کلمات، تصاویر و ویدیوها در وب و آن جریانهای داده سنسورها. آنها به عنوان دادههای ناپیوسته شناخته میشوند و معمولاً در پایگاههای داده سنتی مورد استفاده قرار نمیگیرند.
منبع: مجله نیویورک تایمز