امروزه صحّت و دقّت اطّلاعات برای تصمیمگیریهای سطوح خرد تا کلان، حائز اهمیت است چرا که آلودگیهای مربوط به داده و اطّلاعات، میتوانند مشکلات زیادی را در این فرایند ایجاد نمایند. علاوه بر این، مدیریت هوشمندانه اطّلاعات ، نیازمند در اختیار داشتن اطّلاعات سالم و با کمترین میزان آلودگی است. بنابراین، شناخت مفهوم آلوده شدن داده و اطلاعات و سعی در مقابله با آن، بسیار حیاتی به نظر میرسد.
اکنون در عصر فنّاوریهای اطّلاعاتی و ارتباطی هستیم و افق پیشرفت کشور عزیزمان نیز همسو با این مقوله است، بایستی راهکارهایی عملی و مفید برای حلّ مشکلات تولید اطّلاعات، نگهداری اطّلاعات، دادهکاوی و مسائلی از این دست یافته شود تا هزینههای مادی و معنوی این امور، کاهش یافته و در ازای آن سرعت نیل به هدف اصلی نظام یعنی توسعه دانایی محور افزایش یابد.
در شرایط تحریم اقتصادی و اطّلاعاتی ، باید بتوانیم از منابع اطّلاعاتی موجود، نهایت بهره را ببریم تا در شرایط خاص از هرگونه تهاجم اطّلاعاتی و فرهنگی در امان بوده و تصمیماتی صحیح، دقیق و مناسب اتّخاذ کنیم.
در این راستا، تحقیقات فراوان و مطالعات شایسته و بایستهای در امور مدیریت دانش، مدیریت سیستمهای اطّلاعاتی، هوشمندی کسب و کار و … انجام گردیده است و روند رو به رشدی را در چرخهی تولید محتوای علمی و فنّی شاهد بودهایم.
امّا نکتهای که معمولاً از دید مخفی میماند، پاکبودن این محتوا و دانش حاصله از آن از هرگونه آلودگی اطّلاعاتی است، به طوری که در واقعیّت درصد بالایی از اطّلاعات موجود در نظام اطّلاعاتی سازمانها و ارگانهای دولتی و غیر دولتی، دچار آلودگیهایی از انواع مختلف همچون تکراری بودن، ناقص بودن، به روز نبودن، نامعتبر بودن و … هستند.
با نگاهی عمیقتر به موضوع، به سهولت میتوان فهمید که از بین بردن اینگونه آلودگیها، تا حد زیادی میتواند در پیشبرد اهدافی همچون تصمیمگیریهای کلان سازمانی ، مدیریت دانش و ایجاد نظام اطّلاعاتی هوشمند در سازمان مفید واقع شود.
سیر تحوّلات داده را از ابتدای شکلگیری یک مفهوم در ذهن بشر، تا تبدیل آن به دانش، که ابزار برتری اقوام و ملّتها بر دیگران در عصر حاضر به شمار میرود، میتوان به پنج بخش کلّی تقسیم نمود.
- آنچه که برای اوّلین بار در ذهن بشر شکل میگیرد و موجودیّت مییابد، مفهوم نام دارد. مفهوم میتواند نام یک شیء، بیان یک احساس و یا هر چیز دیگری از این دست باشد. در مورد تعریف مفهوم در دایره المعارف انکارتا آمده است : هر چیزی که بر مبنای تجربه، خلّاقیّت و یا تصویرسازی و فرضیهپردازی توسّط ذهن بوجود آید مفهوم نامیده می شود .
- مفهومی که در ذهن ایجاد شده است بایستی توسّط یکی از ابزارهای ارتباطی انسان، که آنها را “زیسترسانه” نام نهادهاند، به دیگران منتقل شود. مثلاً از طریق سخن، دستنوشته، حرکات بدن و یا به هر صورت دیگر ولی در هر حال، چیزی که بر این اساس به وجود میآید، داده نام دارد .
- دادهی خام، بایستی توسّط یک ابزار عملگر و یا در حین یک فرایند، مورد بررسی، تغییر و تکمیل قرار گیرد تا برای انسان ارزش استفاده داشته باشد . این فرایند را پردازش یا پروسه مینامند. محصول این فرایند، موجودیّتی غنیتر از داده است که قابلیّت استفاده دارد و به آن، فراداده یا اطّلاعات میگویند.
- پس از کسب اطّلاعات کافی در یک مورد، به شناخت از آن مورد دست مییابیم. شناخت یا آگاهی ، حالتی است که به ما، امکان بررسی یک موضوع و تصمیمگیری در قبال نحوهی مواجهه با آن را میدهد. شناخت نیز در سطحی بالاتر از اطّلاعات قرار دارد امّا همانند موجودیّتهای قبل از خود ( که به نحوی، پیشنیازهایش نیز به شمار میروند )، در برخی موارد، تمایز آن با موجودیّت قبل و بعد ممکن نیست.
- دانش یا خرد ، سطح عالی آگاهی از یک موضوع است و زمانی حاصل میشود که شناخت ما در مورد چند موضوع متفاوت، در کنار هم قرار گیرد و به نتیجهای سودمند منتهی شود که خارج از محدودهی درک شناختی ما از یک پدیده است. دانش را اینگونه تعریف میکنند: شناخت کاملی از یک موضوع که بر پایهی تجربه و تحلیل ذهنی بوجود میآید .
از بین موارد ذکر شده، دو مورد وجود دارند که مطلقاً مختص انسان بوده و از دسترس رایانهها و ماشینها، هرچند هوشمند و قدرتمند، به دور هستند. آن دو مورد، مفهوم و دانش هستند.
تولید مفهوم و دستیابی به دانش، چیزی است که هوش مصنوعی امروزی نتوانسته است به قلمرو آن وارد شود و متعالیترین آرزوی دانشمندان این عرصه، همواره این بوده است که ماشینی تولید کنند که مفاهیم ذهنی بشر را درک کرده، مفهوم تولید نماید و دانش برخورد با مشکلات را دارا باشد.
آنچه که امروزه در علم هوشمندی ماشینآلات بدان تکیه داریم، تنها تصمیمگیری بر اساس موقعیّت مکانی و زمانی و بر پایهی شبیهسازی رفتار انسانی است و نه ایجاد مفهوم و دارابودن دانش .
البته سیستمهای پشتیبانی از تصمیمگیری و سیستمهای خبره، از این دست پیشرفتها هستند که البتّه مدّت زیادی نیست که در علوم رایانه وارد شدهاند.
مفاهیم مربوط به آلودگی
آلودگی به معنای هرگونه تغییر ناخوشایند در موجودیّت یک پدیده است و اصولاً هر مقولهی اطلاعاتی که با فعّالیّتهای بشری درگیر شود، به نوعی آلودگی مبتلا خواهد شد .
به عنوان مثال میتوان از مواردی همچون آلودگی هوا، آلودگی خاک، آلودگی آب، آلودگی محیط زیست، آلودگی صوتی، آلودگی رفتار اجتماعی که منجر به سوء رفتارها میشوند، آلودگی اطّلاعات و موارد بیشمار دیگر نام برد.
سازمانها ارکان متفاوتی دارند و به اشکال مختلفی اداره میشوند امّا ۴ رکن اصلی زیر در تمامی سازمانها مشترکاً وجود دارند:
- از دید اکثر نظریهپردازان، اصلیترین رکن هر سازمان، مشتریان آن هستند. مشتریانی که یا محصولی را از یک سازمان دریافت میکنند و یا خدمتی از آن سازمان میگیرند، با خود، پول، پویایی، شهرت و اعتبار و به معنای واقع کلمه، زندگی و ادامهی حیات را برای یک سازمان به ارمغان میآورند و اگر نباشند، موجودیّت و هویّت سازمان نیز معنایی نخواهد داشت.
- ابزارها، سخت افزارها و ماشینآلات نیز بخش مهم دیگری از سازمان هستند. بدون وجود این وسایل، نیرویی برای انجام کارهای یک سازمان وجود ندارد. در این مورد، توضیح بیشتری لازم به نظر نمیرسد چرا که همهی ما به نیاز بشر به ماشینآلات برای تولید و عرضهی محصول و یا خدمت واقف هستیم و میدانیم که یکی از بازوهای اصلی انجام امور در هر سازمان یا ارگان، همین سخت افزارها هستند.
- در این میان، نیروی انسانی یک سازمان، بازوی دوّم و رکن اساسی سوّم در یک سازمان به شمار میرود. اینکه با توجه دانش فعلی بشر، بدون وجود و دخالت جسمی و یا ذهنی انسان، هیچ امری ( حتّی کوچکترین امور ) پیش نخواهد رفت بر کسی پوشیده نیست و حتّی مدافعان سرسخت و حامیان اصلی سیستمهای مبتنی بر هوش مصنوعی نیز، نمیتوانند دنیای بدون دخالت انسان را تصوّر کنند.۴- و امّا اطّلاعات؛ چهارمین ستون برپایی یک سازمان در دنیای امروز، وجود اطّلاعات دقیق، کامل و صحیح در آن سازمان است. به طوری که رقابت بین شرکتها و برندهای سطح اوّل در دنیا، از رقابت سخت افزاری و تجهیزاتی به رقابت اطّلاعاتی مبدّل شده است. گاهی این رقابت در دستیابی هرچه سریعتر به اطّلاعات نمود پیدا میکند و گاهی، دقّت و صحت اطّلاعات بدست آمده، مورد مناقشه و موضوع رقابت واقع میشود. در هر صورت، میتوان گفت که اطّلاعات برگ برندهی سازمانها، بالأخص سازمانهایی که اصل کار آنها بر روی اطّلاعات است، همانند شرکتهای رایانهای، حقوقی و … به حساب میآید و این سازمانها با صرف هزینههای هنگفت ، میکوشند تا در این رقابت اطّلاعاتی برنده باشند.
-
تعریف آلودگی اطّلاعات
با توجّه به تعاریف پیشین، به راحتی میتوان معنا و مفهوم عبارت آلودگی اطّلاعات را متوجّه شد. ما در این نوشته، هرگونه اطّلاعات ناخواسته، تکراری و ناکارآمد را نوعی از اطّلاعات آلوده در نظرگرفته و پدیدهی حاصل را آلودگی اطّلاعات مینامیم و برهمین اساس، سیستمی را که دچار آلودگی اطّلاعات باشد، یک سیستم بیمار نامیده و میگوییم که این سیستم دچار بیماری اطّلاعاتی شده است.
-
انواع آلودگیاطّلاعات
آلودگیهای اطّلاعاتی از انواع مختلفی وجود دارند که ما در این مطلب به برخی از مهمترین آنها اشاره میکنیم :
- ناقص شدن : بدین مفهوم که مجموعهای از اطّلاعات که در کنار هم قرار دارند، بواسطهی از بین رفتن و یا گمشدن یک فایل یا بیشتر، دچار نقص شود و عملکرد کاملی از خود نشان ندهد.
- ناخوانا شدن : نوع دیگری از نقص در بین مجموعهای از فایلهاست با این توضیح که فایل یا فایلهایی در مجموعه وجود دارند که به هر علّتی، ناخوانا و یا مخدوش هستند و سیستم را دچار اختلال میکنند.
- ناخالص بودن : بدین مفهوم که خلوص اطّلاعات در یک سیستم از بین برود. یعنی اطّلاعات موجود در یک سیستم با اطّلاعات سیستمهای دیگر اختلاط پیدا کرده و نتوان تصمیمات دقیقی مبتنی بر اطّلاعات موجود در سیستم هدف اتخاذ نمود. در مواردی حتّی ممکن است این دو سیستم به هم مربوط باشند، اما در هر حال تداخل اطّلاعات، ما را دچار دردسر کند.
- به روز نبودن : یکی دیگر از مظاهر آلودگی اطّلاعات در سیستمهای اطّلاعاتی است که به علّت سرعت پیشرفت در تولید اطّلاعات، برطرف کردن آن، بسیار حیاتی نیز به نظر میرسد. معنی و مفهوم به روز نبودن این است که اطّلاعات، قدیمی و در عین حال بی مصرف شده باشند. لازم به ذکر است که به هر نوع اطّلاعات قدیمی نمیتوان برچسب به روز نبودن را چسباند چون ممکن است هنوز کارایی مفید خود را حفظ کرده باشند.
- دروغین بودن : چیزی که امروزه در ایمیلهای تبلیغاتی ناخواسته و هرزنامهها مشاهده میشود، نوعی از اطّلاعات آلوده است و به این دلیل ایجاد شده است که محتوای این نوع فایلها، دروغین و به درد نخور هستند.
- نامربوط بودن : اینکه اطّلاعاتی در سیستم وارد شود که به آن ارتباطی ندارد. مثلاً در تحقیقی مربوط به قارّهی آسیا، اطّلاعات ناکاربردی در مورد قارّه اروپا در بین فایلها موجود باشند. گاهی اوقات این نوع از آلودگی اطّلاعات مضر به نظر نمیرسد امّا در این تحقیق، ما آن را مضر میدانیم و در صدد رفع آن هستیم.
- چند زبانه بودن : نوعی دیگر از آلودگی اطّلاعات است که اکثر اوقات آن را به حساب نمیآوریم. فایلی به زبان فارسی را در نظر بگیرید که لغات انگلیسی فراوانی در آن به چشم میخورند، یعنی معادلهای فارسی مناسبی برای آنها درنظر نگرفتهایم. این نوع فایل نیز دچار آلودگی اطّلاعات است که در اکثر موارد نادیده گرفته میشود امّا در برخی سیستمها ممکن است برای کاربران و تصمیمگیری آنها مشکلاتی را پدید آورد.
- نامعتبر بودن : اگر درجهی اعتبار سازندهی یک فایل که میزان اعتبار محتویات آن را مشخّص میکند، معلوم نباشد، نمیتوان بر اساس آن اطّلاعات تصمیمگیری نمود. فایلهای نامعتبر، سیستم اطّلاعاتی ما را دچار آلودگی میکنند.
- تکراری بودن : اطّلاعات تکراری، مثلاً کپیهای متعدّد از یک فایل، فضای سیستم ما را بدون هیچ گونه مزیّتی، اشغال میکنند. بنابراین آنها را به عنوان نوعی از آلودگی اطّلاعات به حساب میآوریم و بایستی نسخههای تکراری را از سیستم حذف کنیم.
روند افزایش آلودگی اطّلاعات بر اساس مراحل تکامل داده، سیر افزایشی دارد (توجه شود که گفته نشده است سیر لزوماً افزایشی). بدین معنا که مفاهیم ذهنی انسان از آلودگی کمتری نسبت به داده، داده از آلودگی کمتری نسبت به اطّلاعات، اطّلاعات از آلودگی کمتری نسبت به شناخت و شناخت از آلودگی کمتری نسبت به دانش برخوردارند.
منظور این نیست که لزوماً در گذر از هر مرحله به آلودگی اطّلاعات افزوده میشود، بلکه معنای حرف ما این است که ممکن است چنین چیزی رخ دهد. عموماً و اصولاً، هر سیستمی که اطّلاعات موجود در آن از زیر دست بشر عبور نمایند و پردازشی بر روی آنها انجام شود، دچار آلودگی اطّلاعات میگردد.
-
مضرّات آلودگیاطّلاعات
آلودگی اطّلاعات مشکلات و معضلات بسیاری را برای ما و سیستمهای اطّلاعاتی که با آنها سر و کار داریم ایجاد میکند که برخی از مهمترین آنها عبارتنداز:
- سرعت جستجو را پایین میآورد.
- دقّت جستجو کاهش مییابد.
- فضای زیادی برای ذخیرهسازی فایلهای آلوده به هدر میرود.
- هزینهی گزافی برای نگهداری به مصرف میرسد.
- ایجاد کپی و نسخههای پشتیبان سخت شده و هزینه بیشتری از حالت معمول خواهد داشت.
- تصمیمگیری سخت میشود.
- نسخههای متفاوتی از اطّلاعات شکل میگیرند و ما را سردرگم میکنند.
- و موارد متعدّد دیگر …
تمامی موارد بالا ( و دیگر موارد موجود ) به طور مستقیم یا غیر مستقیم با سه مقولهی سرمایه، سرعت و فضا در ارتباط هستند و به نحوی یک یا چند مورد از این سه مقوله را مورد تأثیر خود قرار میدهند و به دلیل اینکه افزایش هزینه، افزایش زمان، و افزایش فضای مورد نیاز برای نگهداری، برای ما خوشایند نیستند در صدد رفع آلودگیهای اطّلاعات هستیم. شکل زیر روند تأثیر آلودگی اطّلاعات در تصمیمگیری ها را نمایش میدهد:
همانگونه که در شکل مشخّص است، اگر آلودگی اطّلاعاتی در سطوح پایین تصمیمگیری وجود داشته باشد، در گذر هر مرحله به مراحل کلانتر، این آلودگی منتقل شده و تصمیمات عمده و کلان را نیز مورد هجوم خود قرار خواهد داد.
اگر تصمیمات کلّی و مهم دچار نقصی مبتنی بر آلودگیاطّلاعات باشند، نتایج بهدستآمده از اعمال آنها در جوامع اطّلاعاتی نیز نتایج مثبتی نخواهدبود و منجر به تصمیمگیریهای نادرست و زیانبار خواهد شد. نمودار زیر، بررسی غیر موثقی از میزان آلودگی اطلاعات در ۳ بخش از دنیا را نشان میدهد:
همانطور که از شکل بر میآید، سیر آلودگی اطلاعات در اروپا و آسیا در حال افزایش و در کشور امریکا در حال کاهش است. دلیل این امر ممکن است به در نظر گرفتن صحت و کیفیت دادهها در امریکا بازگردد. به طوری که تا قبل از سال ۲۰۰۹ همواره اروپا وضعیت بهتری در کنترل آلودگی اطلاعات داشته اما در سال ۲۰۰۹ امریکا از اروپا در این امر پیشی گرفته است.
به هر حال، آلودگی اطلاعات مقولهای است که کشورهای تولید کنندهی علم در جهان به آن توجه بیشتری نشان داده و سعی در بهبود خلوص و پاکی اطلاعات در نظامهای اطلاعاتی خود دارند.