دادههای دولتی آزاد
حاضر و آماده
انقلاب دادههای آزاد، هنوز انتظارات را برآورده نکرده است. اما این تازه شروع کار است.
انقلاب دادههای آزاد، هنوز انتظارات را برآورده نکرده است. اما این تازه شروع کار است.
سال قبل، یک شب، جیم ریچ از یک مسابقه بسکتبال در تگزاس با پایی به شدت دردناک به خانه آمد. همسر او، رزماری، که پرستار است میترسید او بیشتر از یک کوفتگی شدید آسیب دیده باشد. او نشانههای بالینی جیم را در اپلیکیشن iTriage وارد کرد و شواهدی از سندرم عصبی-عضلانی (compartment syndrome) را یافت که ممکن است به فلج یا قانقاریا، منجر شود. خانم ریچ میگوید: این مساله همسرش را مجاب کرد که سریعاً به بیمارستان برود. چند ساعت بعد او تحت عمل جراحی اورژانس قرار گرفت. اپلیکیشنی که کمک به حفظ پای آقای ریچ کرد، یکی از چندین اپلیکیشنی است که دادههای دولتی را یکپارچهسازی میکنند -که در این مورد، به وسیله چهار آژانس تندرستی تامین شدهاند. شش سال پیش آمریکا تبدیل به اولین کشوری شد که تمام دادههایی را که از سوی دولت جمعآوری شده بود، به غیر از اطلاعات شخصی و مسائل مربوط به امنیت ملی، به صورت پیشفرض در دسترس عموم قرار داد. قریب به 200 هزار مجموعه داده از 170 سازمان مختلف در وبسایت data.gov قرار داده شده است. حدود 70 کشور دیگر نیز تاکنون دادههای خود را در دسترس قرار دادهاند: بیشتر آنها کشورهایی ثروتمند و دارای حکمرانی خوب
هستند ولی البته چند مورد هم مانند هند، اینگونه نیستند. بنیاد علم باز،The Open Knowledge Foundation ، یک گروه مستقر در لندن، محاسبه کرده است که بیش از یک میلیون مجموعه داده بر روی پرتالهای داده باز، با استفاده از نرمافزار CKAN آن شرکت که در سال 2010 ساخته شده، منتشر شدهاند.
سیل برنامههای زمانی حمل و نقل، سوابق جنایی، دادههای آلودگیهای زیستی، پروندههای مالیاتی و مانند آن، بسان نعمتی بوده است. آنها اجازه دادهاند که دولتها به شهروندانشان بهتر خدمترسانی کنند، کسب و کارهای خلاقانه تازه را قدرت دادهاند و زندگی مردم را بهبود بخشیدهاند. اما هنوز روشن نیست که آیا این مساله تاثیری در حد و اندازه یک تغییر بزرگ دارد یا خیر. برای ایجاد آن تغییر، شور و شوقی که باعث شده اطلاعات بسیار زیادی بهطور آنلاین خلق شود، باید به بلوغ رسیده و به سمت یک عملگرایی با آرامش حرکت کند.
در کالاهای رایگان هم پول هست
تعداد کمی شرکت به علت دادههای آزاد، تاکنون رشد زیادی کردهاند. زیلو (Zillow) یک وبسایت املاک، و گارمین (Garmin) یک شرکت هفت میلیارددلاری که نرمافزارها و سختافزارهای راهبری تولید میکند، با استفاده از دادههای رایگان دولتی شکل گرفتهاند. اما به نظر میرسد شرکتهای کوچک، بیشترین سود را در این میان بردهاند. این را لائر لاچسی (Laure Lucchesi) از ایتالب (Etalab) یک مجموعه مشاور که از سوی دولت فرانسه تشکیل شده است، میگوید. برای مثال کسی که در نظر دارد یک کافیشاپ در نیویورک باز کند، اکنون میتواند اطلس تجاری شهر را برای مکانهای مناسب، بررسی کند. نقشه تعاملی نشان میدهد چه نقاطی توسط افراد پیاده بیشتر اشغال است یا مکانهایی را که تعداد ساکنان جوان یا رستورانهای جدید در آنها در حال افزایش هستند، مشخص میکند.
در صدها شهر، عابران از اپلیکیشنهای رایگان تلفنهای هوشمند استفاده میکنند تا زمان ورود اتوبوسها را بفهمند یا چگونگی پیاده رفتن از نقطه الف به ب را. بعضی از اپلیکیشنها مانند Citymapper، همچنین برای هر مسیر، هزینه و حتی میزان کالری سوختهشده در سفر پیاده را مشخص میکنند. حسابرسیهای کیفی بیمارستانها و نتایج پزشکان خصوصی به اپلیکیشنها این قدرت را میدهند که به بیماران کمک کنند که تصمیم بگیرند در کجا به درمان بپردازند. اپ Chek That Bike! میتواند مشخص کند که دوچرخهای دزدی است یا خیر. جیپیاسها، سیستم ناوبری نظامی آمریکا، در هر چیزی، از اپلیکیشنهای دوستیابی تا ریزتراشههای مخفی در قلاده سگها میتوانند یافت شوند.
بسیاری از شهرها بهطور فزایندهای برای گزارش دادن چالههای خیابان یا چراغهای خراب یا مانند آنها، به ساکنان خود اتکا میکنند تا با گوشیهای همراهشان این موارد را گزارش دهند. کمی پیشتر در سال جاری، داوطلبان برای OpenStreetMap، نوعی ویکیپدیای نقشهها، به مقامات فرانسوی کمک کردند تا یک پایگاه داده نشانی ملی ایجاد کنند. این کار قهرمانانه شامل انطباق 25 میلیون آدرس که در میان پروندههای شش موسسه دولتی پراکنده بود، با مختصات جغرافیاییشان میشد. دولتها صرفهجوییهایی هم [با استفاده از دادههای آزاد] انجام دادهاند. بعد از آنکه دولت بریتانیا در سال 2010 پرونده تمام قراردادهایش را منتشر کرد، یک مقام رسمی دریافت که گزارشهای تحلیلی مشابهی در چند سازمان وجود دارد. این دوبارهکاریها دستکم چهار میلیون پوند یا شش میلیون دلار، هزینه میتراشید. اسلواکی و اوکراین هم با ارائه این اطلاعات، افزایش شرکتهای حاضر در مناقصههای دولتی را شاهد بودند. مقامات سانفرانسیسکو تخمین زدند که کاهش استعلامهای تماس، پس از اعلام عمومی دادههای حمل و نقل، بیش از یک میلیون دلار، صرفهجویی ایجاد کرده است. عمومی کردن دادهها، همچنین
میتواند با فساد نیز مقابله کند. سال گذشته، IMCO، یک اندیشکده در مکزیک، کشف کرد که بیشتر از 1400 معلم در یک روز در سال 1912 متولد شدهاند، که سریعاً باعث پایشی در سیستمهای پرداخت حقوق شد. مقامات بریتانیا و نیجریه، دادههای ثبتی املاک و شرکتها را که از سوی چندین دولت منتشر شدهاند، برای بررسی پولشویی، استفاده کردهاند. وبسایت OpenCorporates، مالکان بیش از 90 میلیون شرکت را، بهوسیله یکپارچهسازی اطلاعات ثبتی از بیش از 100 منطقه، لیست کرده است. کاربران این وبسایت، بازرسان، شرکتهای حقوقی و ماموران مالیاتی هستند.
تمام اینها باعث مسرت است. اما با نگاهی به مقیاس عظیم دادههای فاش و عمومیشده، معقول است که بپرسیم چرا پیشرفت بیشتری نداشتهایم؟ چهار پاسخ برای این مورد وجود دارد. اول، دادههایی که در دسترس قرار میگیرند، در اغلب مواقع، غیرقابل استفاده هستند. دوم آنکه هدایت درست مهندسان داده و کارآفرینانی که احتمالاً قادر باشند دادهها را تماماً به محصولات مفید و تجاری تبدیل کنند، سخت است. سوم، تعداد بسیار کمی از افراد قادر به دادهکاوی برای حصول به نتایج و مصارف مناسب هستند. و در انتها، غلبه بر نگرانیها در مورد حیطه خصوصی، سخت است.
جوئل گورین از شرکت مرکز دادههای باز، اندیشکدهای در واشنگتن، میگوید: احتمالاً چهارپنجم دادههایی که منتشر میشوند (در مورد افشای عمومی) بهطور مشخص سودمند نیستند. ذخایر هنوز نهفته آمریکا، برای مثال شامل یک لیست از آخرین حرفهای کسانی میشود که در ایالت تگزاس اعدام شدهاند. در مورد بقیه موارد، بیشتر [این موارد فاشنشده] فاقد «شبهداده» (metadata) هستند، برچسبهای توصیفیای که بدون آنها اطلاعات خام بیمعنا میشوند. در برخی کشورهای در حال توسعه، دادههای رسمی آنچنان سرهمبندی شده و متظاهرانه هستند که کسب و کارها ترجیح میدهند خود اطلاعات را جمعآوری کنند. جستوجوی پرتالهای «دادههای باز» (open data)، اغلب کاری طاقتفرساست. فهم اینکه کدام منبع مفید است، وقتی تعداد زیادی از آنها اطلاعات یکسانی دارند، پیچیده است. موارد ثبتیای که تاکنون تنها برای اهداف اداری ایجاد شدهاند، هنوز برای تبدیل به پایگاههای دادهای که توانایی طبقهبندی، تحلیل و مقابله با دیگر دادهها را داشته باشند، بازطراحی نشدهاند. برخی مجموعهها در پورتالها بهروز نگه داشته نشدهاند که این برای مثال مشکل مشترکی برای دادههایی است که توسط
دولت تامین مالی میشوند.
گاوین استارکس از موسسه داده باز، یک اندیشکده دیگر، به کمبود مهارتهای کار با دادهها در بین ماموران دولتی، فعالان اجتماعی و روزنامهنگاران اشاره میکند. او میگوید مساله تنها این نیست که تعداد کمی از افراد مهارتهای تخصصی دارند، بلکه بسیاری از این افراد توانایی کافی در تفسیر اعداد و مقادیر را ندارند. آقای استارکس مثالی از اعضای پارلمان بریتانیا میزند، جایی که اغلب آنان نمیتوانند یک مساله ساده ریاضی شامل دو احتمال را حل کنند. در حال حاضر سختترین مشکل برای دادههای باز یا عمومی، حریم خصوصی است. مارتین تیسن از «شبکه امیدیار» که یک شرکت بشردوستانه است، هشدار میدهد دولتهایی که به سرعت به افشای اطلاعاتی در ابعاد بسیار خصوصی مانند پروندههای مالیاتی، پزشکی یا تحصیلی مشغولاند، در یک میدان مین راه میروند. اینگونه دادهها، در زمره باارزشترین دادهها هستند: بهعنوان نمونه آنها میتوانند دقت پزشکی را افزایش دهند، که به بهبود درمان بیماران کمک میکند. اما یک رسوایی [در استفاده نابجا از] حریم خصوصی میتواند باعث یک عقبگرد و واکنش شدید در برابر تمام دادههای آزاد شود. اخیراً یک اعتراض عمومی، سرویس سلامت ملی
بریتانیا را مجبور کرد در برنامههایش درباره در دسترس قرار دادن اطلاعات بیماران به صورت ناشناس، تجدیدنظر کند. فعالان دادههای آزاد، به جمع نیروهای دیوانسالار و کارآفرین، برای دستهبندی تمامی این مشکلات ملحق شدهاند. راهحلهای آنها شروع به کار کردهاند و مقادیر فزایندهای از دادهها در حال قرارگیری برای استفاده مناسب هستند. در ابتدای کار، مقامات در قرار دادن اطلاعات آزاد به صورت آنلاین سرعت و اشتیاق داشتند، بدون آنکه چندان نگران کیفیت آنها باشند. اکنون اما این مساله در حال تغییر است. طرفدارانی مانند «بنیاد دانش آزاد»، لیستی از باارزشترین مجموعه دادهها و مشخصههایی که دادهها را به صورت حقیقی آزاد و در معرض عموم میگذارد، مانند یک گواهی آزاد یا یک فرمت قابل خوانش توسط ماشین، تهیه کردهاند. بسیاری از دولتها هنگام تصمیمگیری برای انتخاب دادههایی که میخواهند عمومی کنند، از این لیستها استفاده میکنند.
رویدادها و مراسم آشناییای که سرپرستان دادهها را به تحلیلگران، برنامهنویسان و دیگر خبرگان پیوند میدهند، در حال رواج بیشتر هستند. کاربران دادهها، فرامیگیرند که بهترین منابع [اطلاعاتی] کدامند؛ و مقامات رسمی هم یاد میگیرند که چطور آنها را مفید سازند. هکاتونهای [نوعی گردهمایی کوتاهمدت بین برنامهنویسان و متخصصان سختنرمافزار و مدیران برای تشریکمساعی و توسعه و ایجاد نرمافزار] دادههای باز، اکنون در هر جلسه صدها داوطلب و کارآفرینان آیندهدار را جذب میکنند. در 21 فوریه، که هواداران آن را روز جهانی داده باز معرفی کردهاند، این گردهماییها در بیش از 200 شهر برگزار شدند. سرمایهگذاران بیشتر و بیشتر در چنین رویدادهایی حاضر میشوند که خود بخت تبدیل ایدههای روشن به کسب و کارهای موفق را افزایش میدهند. «دیتا پالوزا»ی سلامت در آمریکا [نامی که به همایش سالانه طرفداران دادههای باز برای استفاده در بهبود بهداشت همگانی دادهاند] که توسط وزارت بهداشت کشور در سال 2010 برگزار شد، 45 نفر را به خود جذب کرد؛ دو سال بعد، 230 شرکت، 100 جایگاه را برای ارائه ابتکارات و اختراعاتشان به جمعیتی بالغ بر 1500 نفر اشغال
کردند.
برخی رویدادها، صرفاً از افکار عمومی میخواهند بهترین ایدههایشان را ارائه کنند. (دولت بریتانیا ملتمسانه، یکی از رقابتها را «راه بهتری نشانمان دهید» نامید.) دیگران روی مسائل مشخص تمرکز میکنند. امسال، آژانسهای دولتی آمریکا، رقابتهایی برگزار کردند تا ایدههایی در کمک به تامینکنندگان بیمههای سلامتی در رفع چاقی و تهیه اقلام بصری برای آلودگی مواد مغذی منابع آبی بیابند و کاوش میلیونها صفحه روزنامههای قرن نوزدهم را سادهتر کنند و موارد دیگر. جمعیتی از موسسات غیرسودده (غیرانتفاعی) سعی میکنند تا مهارتهای کار با دادههای مردم را بهبود بخشند. آنها کتابهای راهنما منتشر میکنند، آموزشهایی را سامان میدهند و ابزارهایی را معرفی میکنند که چکیده دادههای بصری قابل فهمی را تولید میکنند. باجایت (BudgITT)، استارتآپی که اسناد بودجهای غیرگستردهای را به اینفوگرافیهای ساده فشرده میکند، در حال آموزش به سیاستمداران نیجریهای است تا از ابزارهای آنلاین آن برای رهگیری تکمیل پروژههایی که در بودجههای کشوری منظور شده بودند، استفاده کنند. چنین تلاشهایی گاه از سوی موسسات غیرانتفاعی و آژانسهای توسعهای کشورهای
ثروتمند، تامین مالی میشوند.
نگهداری رازها
مشکل حوزه خصوصی پیچیدهتر است. برخی محققان و فعالان، مطرح میکنند که تقریباً همه دادهها میتوانند بهطور هوشمندانه بههمریخته شوند تا از لحاظ شناسایی، گمنام شوند. دیگران در اینکه این موضوع میتواند بدون اشکال انجام شود، شک میکنند: به موازات انتشار اطلاعات بیشتر، تطبیق و مقابله از میان منابع گوناگون برای تشخیص هویت سادهتر میشود. در پایان، آقای گورین میگوید: مساله به آنجا ختم میشود که چه مقدار از حوزه خصوصی ارزش ریسک کردن دارد تا برای مثال به درمانهای پزشکی بهتری برسیم. کشورهای مختلف به نتایج گوناگونی میرسند: در سوئد برای مثال، پرونده مالیات بر درآمد هر فرد به صورت آنلاین به همراه اسم شخص موجود است. غیرممکن است که پیشبینی کنیم انقلاب دادههای باز به چه چیزی منجر خواهد شد. در سال 1983 رونالد ریگان؛ بعد از آنکه یک موشک شوروی یک هواپیمای کره جنوبی را که به حریم هوایی شوروی وارد شده بود، سرنگون کرد، دادههای جیپیاس آمریکا را برای جهان در دسترس قرار داد. در آن زمان، کسی نمیتوانست حدس بزند، که این مساله [دادههای باز] میتواند روزی به رانندگان در پیدا
کردن مسیرشان، به مجردان در یافتن عشقشان و به کسانی که حیوان خانگی خود را گم کردهاند، در یافتن همدم از دست رفتهشان، کمک کند.
منبع: اکونومیست
دیدگاه تان را بنویسید