Thursday, September 27, 2007

گوگل 9 ساله و داده های پنهان


سالانه در سراسر جهان چندین هزار پژوهش علمی در سطوح مختلف انجام می شه ولی تنها اون تعدادی که نتیجه ی مثبت دارن منتشر می شن و به دید عموم می رسن. پس این وسط به سر اون همه پژوهشی که به نتایج مطلوب نمی رسن چی میاد؟ تمام داده های این پژوهش ها توی بایگانی آزمایشگاه ها و سازمان های پژوهشی برای همیشه خاک می خورن. حاصل این رویه اینه که داده هایی که ممکنه برای پژوهش های دیگه کاملا حیاتی و مشکل گشا باشن کنار گذاشته میشن بدون اینکه کسی بهشون دسترسی داشته باشه یا حتی از وجودشون مطلع باشه. به این جور داده ها در اصطلاح "داده های تاریک" یا "داده های پنهان "می گن.
یه عده از دانشمندها معتقدن که باید این داده ها منتشر بشن ولی مشکلات زیادی بر سر راه این ایده هست. یکی از بزرگ ترین مشکلات جمع آوری ، استاندارد سازی و ذخیره ی این داده هاست. داده هایی که نه تنها در فرمت های متفاوت و با استاندارد های مختلف به دست اومدن بلکه اکثرا بسیار حجیم هستن. به طور مثال داده های یک پژوهش ساده در مورد مطالعه ی رفتار کوازارها گاهی چندین تترابایت حجم دارن. منابعی که هم به فضای کافی برای ذخیره و هم به امکانات بررسی و آنالیز تمام داده ها دسترسی داشته باشن بسیار محدودن.
گوگل در نهمین سال فعالیتش به همراه چند سازمان پژوهشی دیگه، امکان ذخیره و اشتراک داده های حجیم و غول آسا رو به صورت مجانی فراهم کرده. گوگل اعلام کرده که هنوز این داده ها قابل جستجو نخواهند بود ولی شاید با تصویب قانون جدید این امکان در آینده فراهم بشه. اگه علاقه دارین بیشتر در مورد این پروژه ی گوگل بدونین
اینجا رو کلیک کنید.


من که خیلی با شنیدن این خبر خوشحال شدم. به نظر من این پروژه راه پیشرفت های علمی به خصوص در زمینه های زیست شناسی - که منابع تحققیقی محدودی دارن_ رو بیشتر باز می کنه.

6 comments:

Naser said...

گوگل عشق است.
منظورم اینه که عالیه!
راستی خبر داری که توی وبلاگت مثل ما درباره ی مطالب علمی کم نوشته داری؟
فکر کنم شروع خوبیه!

Anonymous said...

مطلب خيلي جالبي بود. گوگل بي ترديد بي نظيره. هر روز يه پروژه ي جديد كه آدم از شنيدنش كيف مي كنه.
راستي تا اين مطلبتو خوندم و ديدم يه كامنت داري مطمئن شدم كه كامنت از ناصره ;)

Forough said...

مریم جان ممنون از لطفت. ناصر جان علت این که تا حالا مطلب علمی توی وبلاگم نداشتم اینه که به نظر خودم اخبار علمی رو افراد از منابع اصلی و مناسب دریافت می کنن و کسی به وبلاگ من واسه گرفتن این اطلاعات دست دوم سر نمی زنه. این خبر رو هم به دو دلیل نوشتم: اول این که خودم از شنیدنش خیلی خوش حال شدم. دوم این که روزی که خبر رو نوشتم روز تولد 9 سالگی گوگل بود. بازم مرسی به خاطر توجهت. دوست دارم نظرتو در مورد این موضوع هم بدونم.

علی فتح‌اللهی said...

آخه مگه گوگل جقدر داده های تحقیقاتی در اختیار داره؟ بیشتر تحقیقات ناموفق که میگی تو دانشگاها انجام میشه. خود من اگه ازم بخوان که بشینم تحقیقات قبلیم رو در اختیار دیگران بذارم باید بگم شرمنده نه اینکه نخوام چون وقتشو ندارم به مستند کردن تحقیقات موفقم به سختی میرسم. مشکل دانشگاها اینه که پول و وقت، تحقیقات رو هدایت میکنه و این یعنی معمولا بیشتر تحقیقات گم میشن مگراینکه آدم پیله ای پیدا بشه ... نمیدونم به هر حال ایده بدی نیست شایدم اصلا خودش بشه یه موضوع تحقیق جدید مثلا تو شاخه علوم کتابخونه ای و یه کسانی هم پیدا بشن که توش پول بذارن. اونقدر تو تحقیقات خودم برخوردم به کارای جالبی که دیگران کردن و الان اصلا نمیشه هیچ منبعی مرجعی درموردش پیدا کردن چون محققش مثلا یه دانشجوی دکترا بوده که حالا فارغ التحصیل شده یه کرسی ثابت دانشگاهی گرفته و سر ماه پولشو میزنه به جیب اصلا به تحقیق قبلی خودشم فکر هم نمیکنه

Naser said...

قبول دارم که وبلاگت یه وبلاگ علمی نیست ولی ساختن یه وبلاگ دیگه که کاری نداره! البته و صد البته می دونم که اصلا وقت اضافی نداری. می دونی که اگه وبلاگت به زبان انگلیسی باشه می تونی یه مقدار کمی ازش پول دربیاری. مثلا با تبلیغاتی که به گوگل اجازه می دی بذارن توی وبلاگت. البته فکر نکنم پول زیادی ازش دربیاد ولی خیلی ها رو دیدم که با چند ساعت کار روی وبلاگشون پول مکفی درمی یارند.
حالا از قضیه ی پول دراوردن از وبلاگ که بگذریم، منظورم دقیقا مطالب علمی محض نبود. می دونی منظورم اینه که اگه چیزی توی اینترنت پیدا می کنی که یه جورهایی ربط داره به تکنولوژی (مثلا یه جورهایی مربوط به رشته ی خودت یا کلا وب) بد نیست که بنویسی درباره شون. مثل کاری که بعضی وقتها علی فتح اللهی می کنه بعضی وقتها.
البته من خودم اگه بخوام همچین مطالبی بذارم، دوست دارم خیلی شسته و رفته باشه و کلی وقت می گیره ازم.
دیگه همین.
یه ایده هایی هم دارم. مثلا فرض کن چند تا وبلاگ تکنولژی وب خوب که توی اینترنت می شه پیدا کرد (فرض کن بهترن هاش)، یه تیم باشه که فقط و فقط اونها رو ترجمه کنه به فارسی. می دونی کسایی که چنین مطالبی می نویسن قبول نمی کنند که خیلی وقتها بهترین راه ترجمه ست. به قول مراد فرهادپور که می گه اصل و اساس فضای فکری ایران مبتنی بر ترجمه است از اول تا آخر (و البته من کاملا قبول دارم و درباره اش هم نوشتم). نامجو یه جایی توی این ویدئویی که گذاشت می گه خلاصه اش این که هرکاری که بخواهیم بکنیم، قبلا کردن؛ خدا شاهده (از این قسم اخرش خیلی خوشم می یاد). مشکل لعنتی اینه که خوب چطور از این قضیه می شه پول دراورد لااقل به اندازه ی زمانی که می ذاری؟ سهیل یه بررسی های اولیه ای کرده در اینباره.
دیگه همین. کلی ایده داری که فکر می کنی ایکاش بتونی به یه جایی برسونی شون.
من یه کم با علی موافقم نه خیلی. باید قبول کرد که توی بازار امروز وب (بخصوص وب) این ایده ست که ارزش اصلی رو داره و نه سرمایه ی اولیه. تو یه ایده ی خوب داشته باش و شروع کن به کار. درواقع چند تا ایده ی خوب داشته باش و شروع کن. اگه یکیش بگیره، کارت گرفته. جنم خیلی مهمه. من مطمئن نیستم که آدم هایی که رضایت می دن به کرسی دانشگاه، اصلا علاقه و جاه طلبی و شاید شجاعت لازم برای گسترش کارشون رو حتما داشته باشن. البته گفتم یه کمی. یادمون نره که سرور اولیه ی گوگل توی اتاق خوابگاه دانشگاهی شون بوده و نه توی کمپانی معظم فعلی.

Anonymous said...

من هم اضافه كنم كه با گذاشتن چنين مطلب هايي توي وبلاگ كه خوب هم جالبن و هم به قول خودت خوشحال كننده موافقم از اين بابت كه اونهايي كه دنبال مطالب علمي هستن حسابشون جداست. اونها شايد حتا دنبال چيزهايي سواي اين جور مطالب خبري هم باشن. ولي براي يه سري افراد كه سر زدن به سايت هاي علمي براشون زياد عادي نيست يا حتا كسل كننده ست خوندن همچين مطلب (به قول ناصر) شسته رفته اي توي يه وبلاگ مي تونه جالب باشه