گوگل 9 ساله و داده های پنهان
سالانه در سراسر جهان چندین هزار پژوهش علمی در سطوح مختلف انجام می شه ولی تنها اون تعدادی که نتیجه ی مثبت دارن منتشر می شن و به دید عموم می رسن. پس این وسط به سر اون همه پژوهشی که به نتایج مطلوب نمی رسن چی میاد؟ تمام داده های این پژوهش ها توی بایگانی آزمایشگاه ها و سازمان های پژوهشی برای همیشه خاک می خورن. حاصل این رویه اینه که داده هایی که ممکنه برای پژوهش های دیگه کاملا حیاتی و مشکل گشا باشن کنار گذاشته میشن بدون اینکه کسی بهشون دسترسی داشته باشه یا حتی از وجودشون مطلع باشه. به این جور داده ها در اصطلاح "داده های تاریک" یا "داده های پنهان "می گن.
یه عده از دانشمندها معتقدن که باید این داده ها منتشر بشن ولی مشکلات زیادی بر سر راه این ایده هست. یکی از بزرگ ترین مشکلات جمع آوری ، استاندارد سازی و ذخیره ی این داده هاست. داده هایی که نه تنها در فرمت های متفاوت و با استاندارد های مختلف به دست اومدن بلکه اکثرا بسیار حجیم هستن. به طور مثال داده های یک پژوهش ساده در مورد مطالعه ی رفتار کوازارها گاهی چندین تترابایت حجم دارن. منابعی که هم به فضای کافی برای ذخیره و هم به امکانات بررسی و آنالیز تمام داده ها دسترسی داشته باشن بسیار محدودن.
گوگل در نهمین سال فعالیتش به همراه چند سازمان پژوهشی دیگه، امکان ذخیره و اشتراک داده های حجیم و غول آسا رو به صورت مجانی فراهم کرده. گوگل اعلام کرده که هنوز این داده ها قابل جستجو نخواهند بود ولی شاید با تصویب قانون جدید این امکان در آینده فراهم بشه. اگه علاقه دارین بیشتر در مورد این پروژه ی گوگل بدونین اینجا رو کلیک کنید.
یه عده از دانشمندها معتقدن که باید این داده ها منتشر بشن ولی مشکلات زیادی بر سر راه این ایده هست. یکی از بزرگ ترین مشکلات جمع آوری ، استاندارد سازی و ذخیره ی این داده هاست. داده هایی که نه تنها در فرمت های متفاوت و با استاندارد های مختلف به دست اومدن بلکه اکثرا بسیار حجیم هستن. به طور مثال داده های یک پژوهش ساده در مورد مطالعه ی رفتار کوازارها گاهی چندین تترابایت حجم دارن. منابعی که هم به فضای کافی برای ذخیره و هم به امکانات بررسی و آنالیز تمام داده ها دسترسی داشته باشن بسیار محدودن.
گوگل در نهمین سال فعالیتش به همراه چند سازمان پژوهشی دیگه، امکان ذخیره و اشتراک داده های حجیم و غول آسا رو به صورت مجانی فراهم کرده. گوگل اعلام کرده که هنوز این داده ها قابل جستجو نخواهند بود ولی شاید با تصویب قانون جدید این امکان در آینده فراهم بشه. اگه علاقه دارین بیشتر در مورد این پروژه ی گوگل بدونین اینجا رو کلیک کنید.
من که خیلی با شنیدن این خبر خوشحال شدم. به نظر من این پروژه راه پیشرفت های علمی به خصوص در زمینه های زیست شناسی - که منابع تحققیقی محدودی دارن_ رو بیشتر باز می کنه.