داده
داده
به طور کلی، میتوان همهٔ دانستهها، آگاهیها، داشتهها، آمارها، شناسهها، پیشینهها و پنداشتهها را داده یا دیتا (به انگلیسی: Data) نامید. انسان برای ثبت و درک مشترک هر واقعیت و پدیده از نشانههای ویژهٔ آن بهره گرفتهاست.
انسان برای نمایاندن دادهها نخست از نگاره و در ادامهٔ سیر تکاملی آن از حروف، شمارهها و نشانهها کمک گرفت. برای بازنمودن دادهها از این موارد کمکی یا ترکیبی از آنها استفاده میشود
در رایانه
به اعداد، حروف و علائم که جهت درک و فهم مشترک از انسانها یا رایانه سرچشمه میگیرند داده میگویند. دادهها معمولاً از سوی انسانها بصورت حروف، اعداد، علائم و در رایانه به صورت نمادهایی (همان رمزهای صفر و یک) قراردادی ارائه میشوند. اصطلاح داده یک عبارت نسبی است یعنی اگر موجب درک و فهم لازم و کامل دراین مرحله شدهاست به عنوان آگاهی یا اطلاعات از آن نام میبرند و چنانچه موجب درک و فهم کامل نگردد به عنوان همان داده به شمار میآیند و چون هدف نهایی آگاهی و اطلاعات است باید از سوی دستاندرکاران (انسان یا رایانه) دستکاری یا پردازش شوند. منظور از دستکاری یا پردازش دادهها انجام عملیاتی از قبیل جمع، تفریق، ضرب، تقسیم، مقایسه وغیرهاست.
دادهها مجموعهای از نمادها (برای انسان حروف، اعداد، علائم و برای رایانه رمزهای صفر و یک) هستند که حقایق را نشان میدهند و برای انسان از طریق رسانههای وی (بینایی، شنوایی، چشایی، بویایی، بساوایی) و برای رایانه از طریق لوازم ویژه (صفحه کلید موس و غیره) به دست میآیند.
دادهها امروزه فقط از سوی انسان یا رایانه پردازش میشوند یعنی کارهایی روی آنها صورت میگیرد. در پردازش دادهها (دادهپردازی) در رایانه ابتدا دادهها به رایانه وارد میشوند. این دادهها درابتدا ذخیره شده و روی آنها عملیاتی (جمع، تفریق، ضرب، تقسیم و...) صورت میگیرد. پس از این که این عملیات (پردازش) صورت گرفت معمولاً دادهها به یک رایانه دیگر یا دوباره به انسانها منتقل میشود. در اغلب گزارشها و یادداشتهای سازمانی، دادهها به چشم میخورند. برای نمونه، تاریخ و مقدار یک صورتحساب یا چک، جزئیات فهرست حقوق، تعداد وسایل نقلیهای که از نقطهٔ خاصی در کنار جاده گذشتهاند،... نمونههایی از دادهها هستند.
انواع دادهها از نظر ساختیافتگی
دادههای ساختیافته
دادههای نیمهساختیافته
دادههای زمانی
در بسیاری از کاربردهای مبتنی بر دادهها و اطلاعات ذخیرهسازی و بازیافت حالا ت و وضعیتهای سیستم در طی زمان اهمیت مییابد.
دادههای نیمهساختیافته
دادههای نیمه-ساختیافته شکلی از دادههای ساختیافتهای هستند که از ساختار رسمی از جداول و مدلهای دادهای وابسته به پایگاهِ دادههایِ رابطهای مطابقت نمیکنند، اما با این وجود شامل برچسبها یا علامتها و شاخصهایی هستند که عناصر معنایی را از یکدیگر جدا میکنند و سلسله مراتبی از رکوردها و فیلدها را بین دادهها ایجاد میکنند.
دادههای مکانی
دادههای مکانی (geospatial data ) به مجموعهای از دادهها گفته میشود که بیان کننده موقعیت جغرافیایی یک عارضه(طبیعی یا مصنوعی) بر روی زمین باشند. دادههای مکانی معمولاً به صورت موقعیت و یا روابط هندسی ذخیره شده و قابل نمایش در نقشهها میباشند. دادهها مکانی بیشتر در سامانههای اطلاعات مکانی نگهداری شده، قابل دسترسی و پردازش میباشند.
پردازش رایانهای دادهها
پردازش رایانهای دادهها هر فرایندی است که از برنامهای رایانهای برای واردسازی دادهها، خلاصهبندی، تحلیل و در غیر اینصورت تبدیلداده به اطلاعات قابل استفاده استفاده میکند.
علوم و فناوری پردازش دادهها دارای وسعت، گوناگونی، و پیچیدگی فراوانی بوده، و این زمینه از دانش به شاخهها و زیر شاخههای متعددی تقسیم میشود، که برخی از آنها عبارت است از:
پردازش علائم
پردازش علائم (سیگنالها) را باید یکی از شاخههای وسیع و پر کاربرد در پردازش دادهها به حساب آورد.
پردازش تصاویر
پردازش تصاویر یکی از زمینههای عمده و خاص در پردازش علائم به حساب میآید که در آن دادههای مورد پردازش و عملآوری تصاویر و سیگنالهای دو بعدیست.
پردازش متون
یکی از مسائل عمده در پردازش متون و به طور عمومیتر در پردازش زبانهای طبیعی عملیات و فرایندهای مربوط به مدلسازی دادهها است.
فشردهسازی دادهها
کدگذاری منبع روشهای فشردهسازی یک منبع اطلاعات را مطالعه میکند. منابع اطلاعاتی طبیعی، مانند گفتار یا نوشتار انسانها، دارای افزونگی است؛ برای مثال در جمله «من به خانهمان برگشتم» ضمایر «مان» و شناسه «م» در فعل جمله را میتوان از جمله حذف نمود بدون اینکه از مفموم مورد نظر جمله چیزی کاسته شود. این توضیح را میتوان معادل با انجام عمل فشرده سازی روی اطلاعات یک منبع اطلاعات دانست؛ بنابراین منظور از فشرده سازی اطلاعات کاستن از حجم آن به نحوی است که محتوی آن دچار تغییر نامناسبی نشود.
در علوم کامپیوتر و نظریه اطلاعات، فشرده سازی دادهها یا کد کردن دادهها، در واقع فرایند رمزگذاری اطلاعات با استفاده از تعداد بیتهایی (یا واحدهای دیگر حامل داده) کمتر از آنچه یک تمثال رمزگذاری نشده از همان اطلاعات استفاده میکند و با به کار گرفتن روشهای رمزگذاری ویژهای است.
مانند هر ارتباطی، ارتباطات با اطلاعات فشرده، تنها زمانی کار میکند که هم فرستنده و هم گیرندهٔ اطلاعات، روش رمزگذاری را بفهمند. به عنوان مثال این نوشته تنها زمانی مفهوم است که گیرنده متوجه باشد که هدف پیادهسازی با استفاده از زبان فارسی بوده. به همین ترتیب، دادهٔ فشرده سازی شده تنها زمانی مفهوم است که گیرنده روش رمزگشایی آن را بداند.
فشرده سازی به این دلیل مهم است که کمک میکند مصرف منابع با ارزش، مانند فضای هارد دیسک و یا پهنای باند ارسال، را کاهش دهد. البته از طرفی دیگر، اطلاعات فشرده سازی شده برای اینکه مورد استفاده قرار بگیرند باید از حال فشرده خارج شوند و این فرایند اضافه ممکن است برای بعضی از برنامههای کاربردی زیان آور باشد. برای مثال یک روش فشرده سازی برای یک فیلم ویدئویی ممکن است نیازمند تجهیزات و سختافزار گرانقیمتی باشد که بتواند فیلم را با سرعت بالایی از حالت فشرده خارج سازد که بتواند به طور همزمان با رمزگشایی پخش شود (گزینهای که ابتدا رمزگشایی شود و سپس پخش شود، ممکن است به علت کم بود فضای برای فیلم رمزگشایی شده حافظه امکانپذیر نباشد). بنابراین طراحی روش فشرده سازی نیازمند موازنه و برآیندگیری بین عوامل متعددی است. از جمله این عوامل درصد فشرده سازی، میزان پیچیدگی معرفی شده (اگر از یک روش فشرده سازی پر اتلاف استفاده شود) و منابع محاسباتی لازم برای فشرده سازی و رمزگشایی اطلاعات را میتوان نام برد. فشرده سازی به دو دسته فشردهسازی اتلافی (فشردهسازی با اتلاف) و فشردهسازی بهینه فشردهسازی بیاتلاف اطلاعات تقسیم میشوند. کدگذاری منبع، علم مطالعه روشهای انجام این عمل، برای منابع متفاوت اطلاعاتی موجود است.
فشرده سازی بهینه در مقابل اتلافی
الگوریتمهای فشرده سازی بهینه معمولاً فراوانی آماری را به طریقی به کار میگیرند که بتوان اطلاعات فرستنده را اجمالی تر و بدون خطا نمایش دهند. فشرده سازی بهینه امکانپذیر است چون اغلب اطلاعات جهان واقعی دارای فراوانی آماری هستند. برای مثال در زبان فارسی حرف "الف" خیلی بیش تر از حرف "ژ" استفاده میشود و احتمال اینکه مثلاً حرف "غین" بعد از حرف "ژ" بیاید بسیار کم است. نوع دیگری از فشرده سازی، که فشرده سازی پر اتلاف یا کدگذاری ادراکی نام دارد که در صورتی مفید است که درصدی از صحت اطلاعات کفایت کند. به طور کلی فشرده سازی اتلافی توسط جستجو روی نحوهٔ دریافت اطلاعات مورد نظر توسط افراد راهنمایی میشود. برای مثال، چشم انسان نسبت به تغییرات ظریف در روشنایی حساس تر از تغییرات در رنگ است. فشرده سازی تصویر به روش JPEG طوری عمل میکند که از بخشی از این اطلاعات کم ارزش تر "صرف نظر" میکند. فشرده سازی اتلافی روشی را ارائه میکند که بتوان بیشترین صحت برای درصد فشرده سازی مورد نظر را به دستآورد. در برخی موارد فشرده سازی شفاف (نا محسوس) مورد نیاز است؛ در مواردی دیگر صحت قربانی میشود تا حجم اطلاعات تا حد ممکن کاهش بیابد.
روشهای فشرده سازی بهینه برگشت پذیرند به نحوی که اطلاعات اولیه قابلیت بازیابی به طور دقیق را دارند در حالی که روشهای اتلافی، از دست دادن مقداری از اطلاعات را برای دست یابی به فشردگی بیشتر میپذیرند. البته همواره برخی از داده وجود دارند که الگوریتمهای فشرده سازی بهینهٔ اطلاعات در فشرده سازی آنها ناتوان اند. در واقع هیچ الگوریتم فشرده سازی ای نمیتواند اطلاعاتی که هیچ الگوی قابل تشخیصی ندارند را فشرده سازی کند. بنابراین تلاش برای فشرده سازی اطلاعاتی که قبلاً فشرده شدهاند معمولاً نتیجهٔ عکس داشته (به جای کم کردن حجم، آن را زیاد میکند)، هم چنین است تلاش برای فشرده سازی هر اطلاعات رمز شدهای (مگر حالتی که رمز بسیار ابتدایی باشد).
در عمل، فشرده سازی اتلافی نیز به مرحلهای میرسد که فشرده سازی مجدد دیگر تأثیری ندارد، هرچند یک الگوریتم بسیار اتلافی، مثلاً الگوریتمی که همواره بایت آخر فایل را حذف میکند، همیشه به مرحلهای میرسد که دیگر فایل تهی میشود.
نظریه
سابقهٔ نظری فشرده سازی برای فشرده سازیهای بهینه توسط نظریهٔ اطلاعات (که رابطه نزدیکی با نظریهٔ اطلاعات الگوریتمی دارد) و برای فشرده سازیهای اتلافی توسط نظریهٔ آهنگ-پیچیدگی ( Rate–distortion theory) ارائه شدهاند. این شاخههای مطالعاتی در اصل توسط کلوده شانون( Claude Shannon)، که مقالاتی بنیادی در این زمینه در اواخر دههای ۱۹۴۰ و اوایل دههٔ ۱۹۵۰ به چاپ رسانده است به وجود آمده. "رمزنگاری" و "نظریهٔ رمزگذاری" نیز رابطه بسیار زیادی با این زمینه دارند. ایدهٔ فشرده سازی رابطهٔ عمیقی با آمار استنباطی دارد.
اطلاعات
اطّلاع یا آگاهش (و با نگرسوی آشکارتر ابزاری نیز آگاهِه) در کوتاه ترین تعریف، "دادههای پردازش شده" است. داده ها(data) مواد خام بالقوه معنی داری هستند که ما آنها را در راستای شناختن و فهمیدن و حتی تفسیر چیزها، کالاها، رویدادها یا هرگونه هستی ای که در جهان واقعیت و یا دنیای خیال یافت میشوند، به واسطه روشهای پژوهشی، ابزارهای شناختی مانند دستگاه زبان، احساسات پنج گانه، ذهن و مغز و حتی تجربه خود به دست میآوریم. اطلاعات، آگاهیهای به دست آمده از عنصرها و رویدادهای جهان هستی است. به زبان محدود تکنیکی، مجموعهای از نمادهای زبانی معنی دار و پیوسته درباره موجودات است. اطلاعات در زبان انگلیسی(information)از نظمی ساختاری و ذاتی خبر میدهد.
از منظر فلسفه، اطّلاعات مفهومی چندشکلی (polymorphic) و چندمعنایی (polysemantic) است.
نظریه اطلاعات
نظریّهٔ اطّلاعات مدلی ریاضی از شرایط و عوامل موثر در انتقال و پردازش دادهها و اطّلاعات فراهم میآورد. نظریهٔ اطلاعات با ارائهٔ روشی جهت «کمّی سازی و اندازهگیری عددی اطلاعات» به موضوعاتی مانند ارسال، دریافت، و ذخیرهسازی بهینهٔ دادهها و اطلاعات میپردازد. تمرکز اصلی این نظریّه بر روی محدودیتهای بنیادین که در ارسال و تحلیل دادهها وجود دارد میباشد، و کمتر به نحوهٔ عملکرد دستگاههای خاص میپردازد. پیدایش این نظریه عموماً به مهندس برقی به نام کلاود شانون در سال ۱۹۴۸ میلادی نسبت داده میشود. نظریه اطلاعات مورد استفاده خاص مهندسین مخابرات بوده، هرچند برخی از مفاهیم آن در رشتههای دیگری مانند روانشناسی، زبانشناسی،کتابداری و اطلاع رسانی، و اطلاعات و دانش شناسی نیز مورد استفاده قرار گرفتهاست. مفهوم اطلاعاتی که توسط شانون مطالعه شد اطلاعات از دید آمار و احتمالات بوده و با مفاهیم روزمره از اطلاعات مانند «دانش» و یا استفادههای روزمره از آن در زبان طبیعی مانند «بازیابی اطلاعات»، «تحلیل اطلاعات»، «چهارراه اطلاعات» و غیره تفاوت میدارد. اگر چه نظریه اطلاعات رشتههای دیگر مانند روانشناسی و فلسفه را تحت تأثیر قرار داده، ولی بدلیل مشکلات تبدیل «مفهوم آماری اطلاعات» به «مفهوم معنایی دانش و محتوا» تأثیراتش بیشتر از نوع القای احساساتی نسبت به مفهوم اطلاعات بودهاست.
تاریخچه
خلق تلگراف و تلفن توجه و علاقه نسبت به مفهوم اطلاعات و انتقال آن را افزایش داد. در سال ۱۸۴۴ میلادی، ساموئل مورس خط تلگرافی بین شهرهای واشنگتن و بالتیمور در آمریکا ساخت. مورس هنگام ارسال اطلاعات به مشکلات عملی الکتریکی برخورد. او متوجه شد که خطوطی که از زیر زمین کشیده شدهاند مشکلات بیشتری از خطوطی که هوایی از طریق تیر منتقل میشوند دارند و این خود زمینهای برای تحقیقات بعدی شد. با اختراع تلفن توسط الکساندر گراهام بل در سال ۱۸۷۵ میلادی و گسترش شدید آن، برخی از دانشوران به بررسی مشکلات انتقال اطلاعات پرداختند. اکثر این تحقیقات از تبدیل فوریه استفاده جسته ولی تمرکز آنها بیشتر به جنبه عملی و مهندسی موضوع بود.
شروع تحقیق در مورد نظریه اطلاعات اولین بار در سال ۱۹۲۴ توسط هری نایکوئیست در مقالهای به نام «عوامل خاصی که سرعت تلگراف را تحت تأثیر قرار میدهند» انجام شد. نایکویست وجود نرخ ماکزیمم ارسال اطلاعات را متوجه شده و فرمولی جهت محاسبه این نرخ ماکزیمم ارائه کرد. کار مهم دیگر در این زمان مقاله «انتقال اطلاعات» در سال ۱۹۲۸ میلادی توسط هارتلی بود که اولین پایههای ریاضی نظریه اطلاعات را بنا گذاشت.
تولد واقعی نظریه اطلاعات را به مقاله «نظریه ریاضی مخابرات» توسط کلاود شانون نسبت داد. یکی از نکات اصلی مقاله شانون توجه به این نکته بود که بررسی سیگنالهای مخابراتی را باید از بررسی معانی ای که آن سیگنالها حمل میکنند جدا کرد، در حالی که پیش از او اطلاعات موجود در یک سیگنال الکتریکی از پیغامی که آن سیگنال منتقل میکند جدا در نظر گرفته نمیشد. شانون همچنین به این نکته توجه کرد که طول یک سیگنال همیشه متناسب با میزان اطلاعات آن نیست. مثلاً نقل شدهاست که در نامهای که ویکتور هوگو به ناشرش نوشت، فقط نماد «؟» را نوشته بود. در پاسخ نامهای دریافت کرد که فقط حاوی نماد «!» بود. این دو نماد برای هر دو طرف حاوی اطلاعات زیادی میباشد، هرچند از دید ناظری که معانی آنها را نداند، بی معنی هستند. مثال دیگر این جملهای طولانی است که به زبان فارسی نوشته شده باشد، ولی برای یک انگلیسی زبانی که فارسی نمیداند مفهومی ندارد. بدین سان شانون پیشنهاد نمود که مسئله ارسال سیگنالها را از ارسال معانی موجود در آنها جدا کرده، و برای موضوع اول نظریه ریاضی ای تولید نمود.
شانون در آن زمان در آزمایشگاه بل* مشغول به کار بود و سعی در تعبیه خطوط تلفن با ضریب اعتماد بالا داشت. پیش از شانون عوامل موثر در استفاده بهینه از خطوط تلفن شناخته نشده بود و تعداد حداکثر مکالمات تلفنی که میتوان روی خطوط تلفن موجود انجام داد نامشخص بود. شانون پس از ارائه تعریفی ریاضی از کانال مخابراتی، ظرفیتی به کانال مخابراتی نسبت داد که بیانگر میزان حداکثر اطلاعاتی است که روی کانال میتوان مخابره کرد. فرمول ظرفیت کانال شانون نه تنها به کانالهای بدون اغتشاش (بدون نویز)، بلکه حتی به کانالهای با اغتشاش واقعی نیز قابل اعمال بود. شانون فرمولی ارائه کرد که نحوه تاثیر پهنای باند کانال، و نسبت توان سیگنال ارسالی به اغتشاش (نسبت سیگنال به نویز) بر ظرفیت کانال را را آشکار میکرد.
مفهوم اطلاعات و راههای اندازهگیری آن
مفهوم اطلاعاتی که توسط شانون مطالعه شد اطلاعات از دید آمار و احتمالات بوده و با مفاهیم روزمره از اطلاعات مانند «دانش» و یا استفادههای روزمره از آن در زبان طبیعی مانند «بازیابی اطلاعات»، «تحلیل اطلاعات»، «چهارراه اطلاعات» و غیره تفاوت میدارد. اگر چه نظریه اطلاعات رشتههای دیگر مانند روانشناسی و فلسفه را تحت تأثیر قرار داده، ولی بدلیل مشکلات تبدیل «مفهوم آماری اطلاعات» به «مفهوم معنایی دانش و محتوا» تأثیراتش بیشتر از نوع القای احساساتی نسبت به مفهوم اطلاعات بودهاست.
آمار و احتمالات نقشی حیاتی و عمده در ظهور و رشد نظریه اطلاعات برعهده دارد.
آنتروپی اطلاعات
قضایای شانون
در این نظریه، کلاود شانون نحوهٔ مدلسازی مسئله ارسال اطلاعات در یک کانال مخابراتی را به صورت پایهای بررسی نموده، و مدل کاملی برای مدلسازی ریاضی منبع اطلاعات، کانال ارسال اطلاعات و بازیابی آن ارائه نمودهاست. او مسالهٔ ارسال اطلاعات از یک منبع به یک مقصد را به کمک علم احتمالات بررسی و تحلیل نمود. دو نتیجهٔ بسیار مهم، معروف به قضیههای شانون، عبارتاند از:
۱- حداقل میزان نرخی که میتوان نرخ فشرده کردن اطلاعات یک منبع تصادفی اطلاعات را به آن محدود نمود برابر با آنتروپی آن منبع است؛ به عبارت دیگر نمیتوان دنباله خروجی از یک منبع اطلاعات را با کمتر از آنتروپی آن منبع ارسال نمود.
۲- حداکثر میزان نرخی که میتوان بر روی یک کانال مخابراتی اطلاعات ارسال نمود به نحوی که قادر به آشکارسازی اطلاعات در مقصد، با احتمال خطای در حد قابل قبول کم، باشیم، مقداری ثابت و وابسته به مشخصات کانال است، که به آن ظرفیت کانال میگوئیم. ارسال با نرخی بیشتر از ظرفیت یک کانال روی آن منجر به خطا میشود.
این زمینه از علم مخابرات، به زیربخشهای کدگذاری منبع و کدگذاری کانال تقسیم میگردد. مباحث رمزنگاری مطرح شده توسط شانون نیز از این بنیان ریاضی بهره جستهاست. از زیر شاخههای مرتبط با آن میتوان نظریه کدینگ جبری کانال را نام برد.
معماری اطلاعات
معماری اطلاعات (به انگلیسی: Information Architecture و به اختصار: IA) هنر و علم سازماندهی اطلاعات در وبسایتها، اینترانتها، نرمافزارها، و واسطهای کاربر است. معماری اطلاعات، عبارت است از طراحی ساختاری سامانههای اشتراک اطلاعات، که با هدف ارتقای یافتپذیری و کاربردپذیری انجام میشود. معماران اطلاعات، چارچوبی برای چیدمان اطلاعات تعریف میکنند تا کاربر به سرعت و سهولت به اطلاعات مورد نظر خود دست یابد.
معماری اطلاعات و کتابداری و اطلاع رسانی
عصر حاضر در مقایسه با اعصار گذشته دیگر به دلیل ابداعات و اختراعات گوناگون با سرعتی وصف ناپذیر به سمت کشف مجهولات حرکت میکند و اگر انسان گذشته یک اختراع و اکتشاف را طی نسلهای متمادی با خود همراه میدید ، انسان امروزی چندین و چند اختراع و نوآوری را در عصر خود تجربه میکند . به دلیل همین حقایق انکار ناپذیر است که امروزه دانشمندان علوم مختلف عصر حاضر را " عصر انفجار اطلاعات " نامیدهاند .
امروزه مقوله « اطلاعات » نقش اساسی و بنیادین را در عصر ما بر عهده دارد . هیچ سازمان ، نهاد ، جامعه ... یافت نمیشود که حتی در جزیی ترین امور خود از دسترسی به اطلاعات بی بهره باشد .انتظارات و نیازهای کاربران با توجه به میزان دسترسی آنها به اطلاعات به طور اساسی تغییر یافته و این خود سبب قطع ارتباط میان چگونگی استفاده کاربران از وب سایتهای کتابخانهای و چگونگی طراحی آنها شده است . در این میان نقش معماری اطلاعات به عنوان وسیلهای جهت برنامه ریزی ، سازماندهی و توسعه کاربرد فناوری اطلاعات بسیار برجسته است .
تعریف معماری
هر جا که نیاز به طراحی موجودیت یا سیستمی باشد که ابعاد یا پیچیدگی آن از یک واحد معین فراتر رفته ، یا نیازمندیهای خاصی را تحمیل نماید ، نگرشی ویژه و همه جانبه را لازم خواهد داشت که در اصطلاح به آن معماری گفته میشود . معماری ترکیبی است از علم ، هنر ، تجربه که در رشتههایی نظیر ساختمان دارای قدمتی چند هزار ساله است . و همچنین معماری یعنی ارائه توصیفی فنی از یک سیستم که نشان دهنده ساختار اجزای آن ، ارتباط بین آنها و اصول و قواعد حاکم بر طراحی و تکامل آنها در گذر زمان باشد . در فرهنگ معماری اطلاعات ، یافت پذیری ( Findability) شاخصهای است که قابلیت یافتن یک موضوع یا شی خاص را بیان میکند .به عبارت دیگر یافت پذیری ، کیفیتی است که قابلیت یافته شدن و مکان یابی را نشان میدهد .هرگاه جستجو و یافتن یک چیز آسان باشد گویند که یافت پذیر است .
تاریخچه
اصطلاح معماری اطلاعات برای نخستین بار در سال ۱۹۷۵ توسط Richrd soul war man مطرح گردید . وی در رشته مهندسی معماری تحصیل کرده بود اما به موضوع چگونگی گردآوری اطلاعات و سازماندهی و نمایش صورتهای مختلف آن علاقمند شد . تعریفی که او از معماری اطلاعات ارائه داده چنین بود : « سازماندهی الگوها در قالب دادهها و ارائه این دادها به صورتی واضح و در عین حال پیچیده » این اصطلاح در سال ۱۹۹۶ توسط دو نفر از محققان علوم کتابداری و اطلاع رسانی به نامهای Peter Morvile و Lous Rosenfeld مدیران شرکت Argus Associate که در دانشکده کتابداری و اطلاع رسانی دانشگاه میشیگان تدریس میکردند ، مجددا مطرح گردید . در همین سال (۱۹۹۶) قانونی در کنگره آمریکا به تصویب رسید که به قانون " کلینگر کوهن " معروف شد . مطابق این قانون ، همه وزارتخانهها و سازمانهای فدرال آمریکا ملزم شدند معماری IT خود را تنظیم نمایند .مسئولیت تدوین ، اصلاح و اجرای معماری IT یکپارچه در هر سازمان مطابق این قانون بر عهده مدیران ارشد اطلاعاتی (CIO) آن سازمان قرار گرفت . قانون کلینگر کوهن معماری اطلاعات را چنین تعریف میکرد : « یک چارچوب یکپارچه برای ارتقاء یا نگهداری فناوری موجود و کسب فناوری اطلاعاتی جدید برای نیل به اهداف راهبردی سازمان و مدیریت منابع آن . »
به دنبال تصویب قانون کلینگر کوهن ، که مهمترین سند قانونی در مورد الزام تنظیم معماری اطلاعاتی در سازمانهای دولتی آمریکاست ، سازمان مدیریت و بودجه ریزی آمریکا ( OMB) نیز رهنمودی که در سال ۱۹۶۶ منتشر ساخت ، بر لزوم هماهنگی طرحها و هزینههای انجام شده توسط موسسات فدرال آمریکا ، از جمله وزارتخانهها ، سازمانها ، نیروهای نظامی و دانشگاههایی که از بودجه دولتی استفاده میکنند ، پروژههایی را برای تنظیم و تدوین معماری اطلاعاتی خود به انجام رساندهاند .
مفهوم معماری اطلاعات
اصطلاح معماری اطلاعات در سالهای اخیر به عنوان واژهای تازه در طراحی نظامهای اطلاعاتی و طراحی وب راه یافته اما هنوز هم متخصصین در ارائه تعریفی واحد از آن شک دارند . Martin White معماری اطلاعات را همچون اطلاع رسانی مجموعهای از ابزارها و روشها میداند که توسط متخصصین در مقیاسی وسیع برای حل مشکلات مدیریت اطلاعات استفاده میشود . Iain Barker در تعریف معماری اطلاعات میگوید : « معماری اطلاعات اصطلاحی است جهت توصیف ساختار یک سیستم ، یعنی شیوهای که در آن اطلاعات سازماندهی ، کد گذاری و منتقل میشوند . » D.Grant Campell در تشریح این اصطلاح میگوید : « معماری اطلاعات شباهت کمی با موضوعات دارای رویکرد ذهنی دارد و بیشتر شبیه به رویکردهای فلسفی مثل پدیده شناسی و ساختار گرایی است . » قانون کلینگر کوهن تصریح میدارد که معماری اطلاعات یک چارچوب یکپارچه برای ارتقاء یا نگهداری فناوری موجود و کسب فناوری اطلاعاتی جدید برای نیل به اهداف راهبردی سازمان و مدیریت منابع آن فراهم مینماید . هر تعریفی که از معماری اطلاعات ارائه کنیم ، باید بپذیریم که رویکرد معماری در برنامه ریزی و توسعه فناوری اطلاعات در یک سازمان ، نهاد یا دولت نقشی اساسی دارد . میتوان چنین گفت که معماری اطلاعات قادر است با سازماندهی اصولی اطلاعات به کاربران اجازه شناخت ، جستجو و استفاده از اطلاعات را بدهد .
امروزه لفظ معماری اطلاعات اغلب به امر سازماندهی اطلاعات در تار جهانگستر ( www ) اطلاق میشود . Gillian Davis خاطر نشان میسازد که علیرغم اینکه Marville و Rosenfeld هر دو کتابدار بودند ، اما هیچگاه به این موضوع نیندیشیدند که کتابداران میتوانند بهترین قشر در امر معماری اطلاعات باشند . میتوان به نوعی چنین ادعا نمود که پیش داشتهها و آموزشهای ارائه شده در دوره کارشناسی کتابداری نیست که شما را برای انجام کار آماده میسازد ، بلکه آنچه سبب پیشرفته تان در این حرفه میگردد ، نوع رویکرد و نگرش شما ، توانایی تان جهت ابداع و نوآوری و علاقه شما جهت استفاده از مهارتهایتان در مسیرهای جدید است . کتابداران دارای دیدی وسیع دریافتهاند که قادرند مهارتها و تخصص هایشان را در زمینههای جدیدی که با دسترسی به منابع اطلاعاتی چاپی کاملا متفاوت است ، بکار برند . با چنین نگرشی کتابداری به رشتهای تبدیل میگردد که در پی کسب مهارت در زمینه معماری اطلاعات خواهد بود .
امروزه اغلب مهارتهای معماری اطلاعات نیازمند مهارت بالای تکنولوژی است و کتابدارانی که از مدارس و دانشکدههای جدید کتابداری و اطلاع رسانی فارغ التحصیل میگردند بایستی توانایی بالایی در کار با اینترنت ، طراحی پایگاههای اطلاعاتی و HTML داشته باشند .
اصول راهبردی معماری اطلاعات
۱. بهینه سازی بودجه سازمانی از طریق برنامه ریزی و هماهنگی منابع مدیریت اطلاعات بین برنامهها ، بخشها و ادارات مختلف ۲. تسهیل تصمیم گیری مناسب از طریق تامین اطلاعات کارآمد ۳. پاسخگویی سریع به نیازهای اطلاعاتی از طریق سازماندهی پایگاهها و سیستمهای اطلاعاتی با هدف تامین حداکثر دسترسی ، تغییر و ارئه گزارش . ۴. حل مسائل سازمانی با راه حلهای سازمانی از طریق به حداقل رساندن افزونگی و دوباره کاریهای اطلاعاتی ۵. بهینه سازی سرمایه گذاری سازمانی در IT از طریق تدوین برنامهها و معماری جامع فناوری اطلاعات ۶. مدیریت صحیح و کارآمد پروژههای فناوری اطلاعات ۷. پاسخگویی به شرایط در حال تغییر
امروزه برای ایجاد معماری اطلاعات موثر از : مدیران و طراحان اینترنت ، مدیران و طراحان وب سایت ، طراحان رسانههای تصویری ، برنامه نویسان ، کتابداران و اطلاع رسانان ، محققان فنی و سایر افرادی که به نوعی در طراحی سیستمهای اطلاعاتی نقش دارند ، استفاده میکنند .
فلسفه اطلاعات
فلسفهٔ اطّلاعات (Philosophy of information) به آن دسته از پژوهشهای فلسفی و انتقادی اطلاق میگردد، که به منظور تبیین و روشنسازی مفاهیم، معانی، سرچشمهها، اصول، و مبادی بنیادین اطّلاعات انجام پذیرد.
مطالعات و بررسیهای فلسفی برروی مفاهیم اطلاعات معنایی هنوز در ابتداییترین مراحل آن قرار دارد، به طوری که حتی در مورد راهها و شیوههای طرح مسئله هم تا کنون توافقی حاصل نشده است.
تعریف اطّلاعات
گرچه تا کنون تعریفی فراگیر و همهجانبه از اطّلاعات میسّر نگردیدهاست، پدیدههای گوناگونی را میتوان بر حسب زمینه و موضوع، اطّلاعات نامداد. معمولاً از سه نوع پدیده به نام اطّلاعات یاد میشود:
اطّلاعات به عنوان یک فرایند شناختمحور
اطّلاعات به عنوان دانشی که ارائه گردیدهاست
از دادهها، اسناد، تصاویر، و موارد همانند آنها بهعنوان اطّلاعات یاد میشود
هر چند اطّلاعات به خودی خود مهمّ است، اهمّیّت واقعی آن به سبب دانشی است که میتواند از آن ناشی گردد. شایان اشاره و تأکید است که همچون تمامی موارد دیگر جهان، اطّلاعات، و دانش برآمده ازآن اطّلاعات هم مشمول ترازهای تجریداند:
آنچه که در این لایه دانش نامیده میشود، خود اطّلاعات است برای دانشی که در تراز بلافاصله بالاتر از آن واقع است. شاید سادهترین مثال را بشود ارتباط چکیدهٔ (مجرّدشده) یک مقاله با خود آن دانست: هر چند خود مقاله میتواند پاسخگوی پارهای از سوالات باشد، و لذا، از نوع دانش، برای چکیدهٔ خود به عنوان اطّلاعات عمل خواهد نمود.
دانش محاسبات و فلسفه
تعاملات و داد و ستدهای علمی مابین دانشمندان علوم رایانه و اندیشمندان وادی فلسفه به هیچ وجه امروزی نیست. فلسفهٔ تولّد و ظهور کامپیوترهای ارقامی در اواسط قرن بیستم (م) را در واقع میشود در حوزهٔ بزرگتر فلسفهٔ علوم، سیبرنتیک، علوم نرم، و نیز در مجموعهٔ علل و انگیزههای مربوط به آغاز تفکرّات سیستمی و کلیّاتنگر، و نیز در منشأ و بخش مشترک تمامی آنها - پیچیدگی - نشان گرفت.
آلودگی اطلاعات
آلودگی انفورماسیون یعنی آلودن اطلاعات درست به نادرست. به تعبیر دیگر از بین بردن ارزش، کیفیت، صحّت و محتوای اطلاعات بر اثر دخالت اطلاعات نادرست را آلودگی اطلاعات گویند (نوروزی، ۱۳۷۸). رسانههای گروهی، از جمله رادیو، تلویزیون، اینترنت و در رأس آن وب (وبنوشتها و وبگاهها) امروزه با انتشار اطلاعات نادرست و تبلیغات منفی موجب آلوده شدن جریان اطلاعات میشوند یا آنها را از مسیر صحیح منحرف میسازند. کشورها یا گروههای خاص با انتشار تبلیغات منفی و اطلاعات ضد و نقیض و نادرست موجب آلودگی اطلاعات میشوند.
روشهای مهم آلوده کردن اطلاعات عبارتند از:
حذف یا سانسور برخی اطلاعات
وارونه سازی اطلاعات بدون آگاهی مخاطب
تاخیر در ارسال پیام به مخاطب
ترکیب یا آمیختن اطلاعات درست و غلط به گونهای که تشخیص آنها ممکن نباشد.
اقتصاد اطلاعات
بحث دربارة نقش اطلاعات در اقتصاد، از بازاندیشی و زیر سؤال بردن یکی از فرضهای نظریة رقابت کامل در بازار شروع شد. این فرض بر این مبنا است که تمام شرکت کنندگان در بازار، از تمام قیمتها و تمام اطلاعات فناورانه مربوط، اطلاعات کامل دارند. بدین معنا که از یک سو، بنگاهها، قیمتهای تمام کالاهایی را که احتمالاً میتوانند تولید کنند و فناوری تولید این کالاها و نیز قیمتی که در آن میتوانند نهادههای لازم را خریداری کنند، می دانند. از سوی دیگر، تمام افراد هم از قیمتهایی که در آن میتوانند تمام کالاها را خریداری کنند و منابع شان را به طورکلی و به خصوص نیروی کارشان را بفروشند، آگاه هستند. به عبارت دیگر فرض میشود که مصرف کنندگان، صاحبان منابع و بنگاههایی که در بازار هستند، دربارة وضعیت حال وآیندة قیمتها و هزینهها و فرصتهای اقتصادی بازار، اطلاعات کامل دارند؛ بنابراین مصرف کنندگان قیمتی بیش از آنچه لازم است، برای کالا نمیپردازند. تفاوت قیمتها به سرعت از بین میرود و در سراسر بازار برای هر کالا تنها یک قیمت مطرح میشود. منابع به پیشنهاد دهندة بالاترین قیمت، فروخته میشود و با داشتن اطلاعات کامل از جریان قیمتها و هزینهها در حال و اینده، تولیدکنندگان به طور دقیق می دانند که چه میزان باید تولید کنند.
حال اگر اطلاعات بدین گونه برای طرفین آشکار و مهیا نباشد چه میشود؟ پاسخ به این سوال اساسی و تحلیل واقعیتهای موجود در دنیای واقع موضوعی را تحت عنوان اقتصاد اطلاعات پدید آورد که در ذیل به طور خلاصه به توضیح چندوچون این کار خواهیم پرداخت.
کوتاه سخن آنکه منظور از اقتصاد اطلاعات، بررسی چگونگی توزیع اطلاعات بین عاملان اقتصادی و نحوه تأثیرگذاری وجود یا عدم وجود این اطلاعات بر رفاه عاملان اقتصادی است. منظور از رفاه در این تعریف منافع عمومی عاملان اقتصادی است که به عنوان مثال در مورد مصرف کننده به مطلوبیت و در مورد بنگاه به سود اشاره میکند. مباحثی از قبیل اطلاعات ناکامل و اطلاعات نامتقارن از جمله مباحثی هستند که در این حوزه مورد بررسی قرار میگیرند.
تاریخچه
فردریش هایک در مقاله پیشگام خود در سال ۱۹۴۵ معتقد است: «ما باید به نظام قیمت به عنوان مکانیزم انتقال اطلاعات بنگریم» (هایک، ۱۹۴۵: ص۵۲۶). هایک در ادامه ذکر میکند که: چه مسألهای را میخواهیم حل کنیم وقتی تلاش میکنیم که نظم اقتصادی منطقی بسازیم؟ یک پاسخ این است که اگر ما همه اطلاعات مربوط را داشتیم و میتوانستیم از نظام معین ترجیحات شروع کنیم و نیز اگر از ابزارهای موجود آگاهی کامل داشتیم، تنها یک مسئله باقی میماند و آن پاسخ به این پرسش است که بهترین راه استفاده از ابزارهای موجود، چیست.
اما «آگاهی» از شرایط مورد استفاده هیچگاه به شکل متمرکز یا ادغام شده، وجود ندارد ؛ بلکه این آگاهی صرفاً به صورت اجزای (ذرههای) پخش شده، ناقص است و تمام افراد جدا از هم، آن را در اختیار دارند. بنابراین مسئله اقتصادی جامعه این است که چگونه منابع «معین» را با استفاده از اطلاعات تخصیص دهیم، درحالیکه به هیچکس کل آن اطلاعات داده نشدهاست. برنامهریزی برای تخصیص منابع موجود، مبتنی بر «اطلاعاتی» است که باید به برنامهریز داده شود و از قبل در اختیار او نیست.
چهکسی باید برنامهریزی کند؟ اختلاف نظردرباره این نیست که آیا برنامه ریزی باید انجام شود یا نه؛ بلکه در این مورد است که آیا برنامه ریزی برای کل نظام اقتصادی باید مرکزی باشد یا باید میان تعداد زیادی از افراد تقسیم شود. اصطلاح «برنامهریزی» که در ادبیات اقتصادی متداول است، به معنای برنامهریزی مرکزی است؛ یعنی هدایت کل نظام اقتصادی طبق یک برنامة یکپارچه انجام شود. رقابت به معنای برنامهریزی غیر متمرکز است و تعداد زیادی از افراد، جداگانه، آن را انجام میدهند. اینکه کدامیک از این دو نظام، کارایی بیشتری دارد، عمدتاً به پاسخ این پرسش بستگی دارد که کدام یک از «اطلاعات» موجود در جامعه کاملتر استفاده میکنند. در یک نظام اقتصادی متمرکز باید تمام اطلاعات به مقامات برنامهریز مرکزی منتقل شود؛ اطلاعاتی که ابتدا میان تعداد زیادی از افراد مختلف پخش شده بود. راه دیگر، انتقال «اطلاعات اضافی» به افراد برحسب نیازشان است تا بتوانند برنامههایشان را با برنامه دیگران هماهنگ کنند. اگر توافق کنیم که مسئلة اقتصادی جامعه عمدتاً انطباق با تغییرات در شرایط زمان و مکان است، در اینصورت تصمیمات نهایی باید به افرادی واگذار شود که با این شرایط آشنا باشند و تغییرات و منابع موجود انجام آنرا میشناسند. نمیتوانیم انتظار داشته باشیم که با انتقال این آگاهی به یک هیئت مرکزی و ادغام تمام اطلاعات، فرامین هیئت صادر شود؛ بلکه باید این مسئله را با عدم تمرکز حل کنیم. با عدم تمرکز این اطمینان حاصل میشود که اطلاعات مربوط به مقتضیات خاص زمان و مکان، بلافاصله مورد استفاده قرار میگیرد.
نظام قیمت، مکانیزمی برای انتقال اطلاعات است. مهمترین واقعیت نظام قیمت، اطلاعاتی است که براساس آن عمل میشود. هر شرکتکننده در نظام قیمت، به طور انفرادی اطلاعات اندکی لازم دارد تا بتواند اقدام درست را انجام دهد. حل مسائل نظام قیمت با تعامل افرادی است که هر یک تنها «اطلاعات جزئی» دارند. اطلاعات انسان کامل نیست و به کسب مستمر و انتقال اطلاعات نیاز دارد.
هایک در سخنرانی دریافت جایزة نوبل (۱۹۷۴)، بازار را یک «نظام اطلاعاتی» دانست که برای استفاده از اطلاعات پخش شده، در مقایسه با هر مکانیزم دیگری که بشر آگاهانه طراحی کردهاست، مکانیزم کاراتری دارد. هر چند نظریة نئوکلاسیک به محدودیتهای اطلاعاتی توجه نکردهاست و در واقع اطلاعات نقشی در این نظریه ندارد؛ اما هایک، مکرر، از اطلاعات صحبت کردهاست.
پیدایش رشته اقتصاد اطلاعات
رشته «اقتصاد اطلاعات» با انتشار دو مقاله در سال ۱۹۶۱، یکی توسط ویلیام ویکری (William Vickrey) و دیگری توسط جرج استیگلر (George Stigler)، متولد شد. اولین مقاله، «اقتصاد اطلاعات» تألیف جورج استیگلر و دومین مقاله، «سفتهبازی متقابل، حراجها و مناقصههای رقابتی مهرومومشده» به قلم ویلیام ویکری است. ویلیام ویکری حالتی را در نظر میگیرد که مقولة غیرقابل تقسیم و منحصربهفردی قرار است به یکی از خریداران بالقوه فروخته شود. ویکری نشان میدهد که با ارزشهای خصوصی مستقل و مزایدهگزاران همگن، قیمت مورد انتظار معامله در روش حراج از نوع انگلیسی و هلندی یکی است. او سپس مفهوم حراج مزایده مهر و موم شده قیمت دوم را وارد میکند و نشان میدهد که معادل روش حراج انگلیسی است. ویکری برتری روش حراج انگلیسی برحراج هلندی را در شرایط ریسک پذیری، وجود مزایدهگزاران بیتجربه و سایر مواردی که باعث دورشدن از فرضهای استاندارد میشود، نشان میدهد که در آن روش حراج انگلیسی، بهینة پارتو است.
جورج استیگلر در مقاله خود مدل سادهای برای جستوجو ارائه کرد؛ این مدل شامل اطلاعات بود. او نظریة استاندارد اقتصادی را به کار گرفت تا به طور درونزا مشخص کند که کارگزاران اقتصادی چه میزان اطلاعات باید کسب کنند. نقش استیگلر، مدلسازی صریح به منظور فعالیت برای کسب اطلاعات در چهارچوب مارشالی موجود بود. استیگلر از این واقعیت شروع میکند که هیچ خریداری از قیمتهایی که فروشندگان مختلف در هر زمان معین اعلام میکنند، آگاهی ندارند. در نتیجه خریداران برای پی بردن به مطلوب ترین قیمت، باید از فروشندگان مختلف نظرخواهی کنند. استیگلر این «نظرخواهی» را مدلسازی میکند. خریداری که به دنبال یک واحد از کالای همگن است، n پیشنهاد مستقل جمعآوری میکند که از توزیع مشترک f به دست آمدهاست. هزینة هر پیشنهاد، c است و از آنجا که مسئلة جستوجوی خریدار خنثی نسبت به ریسک، صرفاً انتخاب اندازة نمونة n بهگونهای است که مجموع قیمت مورد انتظار پرداخت شده برای کالا به اضافة هزینة جستوجو را حداقل سازد، اندازة بهینة جستوجو از شرط مرتبة اول محاسبه شدهاست. از این مطالب دو نتیجة مهم به دست میآید: اول اینکه پیشبینی میشود پخش قیمت اتفاق بیفتد که به معنای نقض قانون یک قیمتی است؛ در این صورت تفاوت در قیمتهای معاملات برای کالای همگن تحقق پیدا میکند. دوم اینکه منابع بیکار پیشبینی شدهاست. فعالیت جستوجو نشاندهندة سرمایهگذاری در حصول قیمت فروش یا اجاره بالاتر است. علاوه بر آن مدل جستوجوی استیگلر راه دیگری فراهم میکند که منجر به شناخت فرایند شکلگیری قیمت میشود.
چند تن از افراد تاثیرگذار در اقتصاد اطلاعات
استیگلر(George Stigler)
آکرلف (George Akerlofe)
ویکری (William Vickrey)
میرلس(James Myles)
مفاهیم پایه
اطلاعات
اطلاعات یا آگاهش در کوتاه ترین تعریف، "دادههای پردازش شده" است. دادهها (data) مواد خام بالقوه معنی داری هستند که ما آنها را در راستای شناختن و فهمیدن و حتی تفسیر چیزها، کالاها، رویدادها یا هرگونه هستی ای که در جهان واقعیت و یا دنیای خیال یافت میشوند، به واسطه روشهای پژوهشی، ابزارهای شناختی مانند دستگاه زبان، احساسات پنچ گانه، ذهن و مغز و حتی تجربه خود به دست میآوریم. اطلاعات، آگاهیهای به دست آمده از عنصرها و رویدادهای جهان هستی است. به زبان محدود تکنیکی، مجموعهای از نمادهای زبانی معنی دار و پیوسته درباره موجودات است. اطلاعات در زبان انگلیسی(information)از نظمی ساختاری و ذاتی خبر میدهد.
انقلاب اطلاعات
انقلاب اطلاعات موضوع نسبتاً جدیدی در ادبیات علمی است. بسیاری از صاحبنظران انقلاب اطلاعات راچیزی شبیه انقلاب صنعتی ارزیابی کردهاند واساسا انقلاب ابررسانه واطلاعات را بعد از انقلاب صنعتی انقلاب برق انقلاب نفت و انقلاب الکترونیک، پنجمین انقلاب علمی بشر بعد از رنسانس می دانند و اعتقاد دارند که این تحول، شیوهٔ تولید، توزیع و مصرف اطلاعات را دگرگون ساختهاست. یکی از جنبههای مهم و اساسی این انقلاب اقتصاد اطلاعات است زیرا اثرات اقتصادی انقلاب اطلاعات بسیار شگرف بودهاست.
ارزش اطلاعات
نقطهٔ آغازین تحلیل اقتصادی مشاهدهٔ این نکتهاست که اطلاعات ارزش اقتصادی دارد، چرا که اطلاعات به افراد اجازه میدهد تا انتخابی انجام دهند که عایدی انتظاری و یا مطلوبیت انتظاری آنها را نسبت به زمانی که اطلاعات وجود ندارد حداکثر سازند.
مکانیزم تعیین قیمت اطلاعات
خصوصیات و ماهیت کاملاً متفاوت فناوری اطلاعات نسبت به سایر کالاها و خدمات موجب شدهاست که برای بررسی بعد اقتصادی اطلاعات، روشهای تحلیل جدید (البته نه نوع جدیدی از تحلیل) بکار گرفته شود. لذا در بررسی و تحلیل بازاراطلاعات در عین حال که از روشهای کاملاً جدیدی استفاده میشود عواملی مثل سلیقهٔ افراد، فناوری تولید و ساختار بازار در چگونگی کارکرد این بازار نقش مبنایی ایفا میکند. بخش عمدهای از اقتصاد اطلاعات بر مکانیزم تعیین قیمت اطلاعات جهت استفادهٔ کارا و موثر از منابع اختصاص دارد. در این زمینه همانطور که در بالا اشاره شد هایک کار را آغاز کرد و دیگر اقتصادانان (همچون افراد نامبرده در بالا) این مسیر را ادامه دادند.
تقارن و عدم تقارن اطلاعات
اینکه اطلاعات چگونهاست در تعیین مکانیزم قیمت اطلاعات و رسیدن به کارایی اهمیت دارد اگر اطلاعات در دسترس همگان یکسان بوده و همهٔ افراد حاضر در بازار موردنظر اطلاعات یکسانی داشته باشند گوییم فرض تقارن اطلاعات برقرار بوده و هیچکس به علت نداشتن اطلاعات در معرض عدم دستیابی به کارایی قرار نخواهد گرفت. ضمن آنکه برقراری اطلاعات متقارن یکی از فروض تشکیل بازار رقابت کامل است.
وجود اطلاعات متقارن ضرورتی برای مطرح شدن اقتصاد اطلاعات ایجاد نمیکند. از آنجاکه در واقعیت افراد حاضر در بازار خاص نسبت به امر مورد نظر اطلاعات یکسانی ندارند لذا افراد با عدم تقارن اطلاعات مواجه بوده و از این ناحیه امکان عدول از بهینهٔ پرتو به آسانی امکان پذیر خواهد بود. به دلیل آنکه عدم تقارن اطلاعات موضوع اصلی اقتصاد اطلاعات است در ذیل جداگانه به آن خواهیم پرداخت.
اطلاعات نامتقارن
اطلاعات نامتقارن در واقع حالت خاصی از اطلاعات ناکامل است که در اکثر مسائل اقتصادی شایع است. عمده بحثها در اقتصاد اطلاعات به مسالهٔ اطلاعات نامتقارن مربوط میشود یعنی موقعیتی که در آن یک عامل اقتصادی در مورد مبادلهٔ خود اطلاعات خاصی دارد که طرف دیگر مبادله آن اطلاعات را ندارد. مثلاً کارگر در فروش نیروی کار خود به کارفرما در مورد نحوه و میزان تلاش و بهرهوری خود از اطلاعات بیشتری برخوردار است تا کارفرما. از این جهت رفتار عاملان اقتصادی در شرایط عدم تقارن اطلاعات بطور حتم با تعاملهای استراتژیک همراهاست. نکتهای که در اینجا باید تاکید شود این است که معمولاً طرف مبادله با اطلاعات بیشتر میخواهد فرد کمتر مطلع را استثمار کند. این رفتار فرصت طلبانه منجر به از بین رفتن ویژگیهای خوب بازار رقابت کامل و بروز عجز و نقص بازار رقابت ناقص میشود. در کل میتوان گفت که اطلاعات نامتقارن موجب بروز دو نوع رفتار فرصتطلبانهٔ انتخاب بد (کژگزینی) و مخاطرهٔ اخلاقی (کژمنشی) میشود.(این موارد و شیوههای رفع این مشکلها به صورت خیلی کوتاه در ذیل توضیح داده میشود و برای مطالعهٔ توضیح کاملتر در هر مورد به صفحهٔ مربوطه ارجاع داده میشود).
انتخاب بد و نامناسب (کژگزینی)
کژگزینی نوعی رفتار فرصت طلبانهاست که در موقعیتی رخ میدهد که در آن یک فرد با اطلاعات بیش تر از مبادله سود بردهو مزیت کسب میکند یا اساساً در جایی بروز میکند که یک فرد مطلع با یک فرد با اطلاعات کمتر در مورد یک مشخصهٔ خاص غیر قابل مشاهده از وی (فرد مطلع) قرارداد میبندد. مثلاً افرادی که با درجهٔ معینی از ریسک از بانکها اعتبار میگیرند در مورد اندازهٔ ریسک و وضعیت خود بیش از بانکها مطلعاند. برای حل این مشکل از روشهایی استفاده میشود که منجر به برابرسازی اطلاعات شوند: علامت دهی و غربال کردن.
علامت دهی
علامت دادن (signaling) اقدامی است که توسط فرد مطلع انجام میشود تا برای فرد کمتر مطلع در مبادله اطلاعات بفرستد تا از این طریق از بروز کژگزینی جلوگیری شود. مانند کارگرانی که در موقع استخدام سعی میکنند تا به کارفرما بفهمانند که دارای توانایی لازم هستند. حتی در مصاحبهٔ استخدام سعی میکنند که با سر و وضع مناسب حاضر شوند، به موقع حاضر شوند، آدامس نجوند و با ارائه مدارک مربوط به آموزشها در مورد سابقه و تجربهٔ خود به کارفرما علامت بدهند تا در کل مشکل کژگزینی رخ ندهد.
غربال کردن
غربال کردن (screening) اقدامیاست که توسط فرد غیر مطلع انجام میشود تا وی به تمام یا بخشی از اطلاعاتی که فرد مطلع دارد دست یابد. مانند خریدار ماشین دست دومی که قبل از خرید چند بار سوار ماشین میشود تا از کیفیت آن مطلع شود. از این طریق طرفهای نامطلع سعی میکنند عدم مزیت اطلاعاتی خود را از طریق غربال کردن و جمعآوری اطلاعات در مورد مشخصات مشاهده نشدهٔ افراد مطلع، از بین ببرند. بنابراین افرادی که اطلاعات کمتری دارند و پس از غربال کردن، اطلاعات بیشتری کسب میکنندچه بسا از امضا قرارداد امتناع کرده یا شرایط آن را تغییر داده و یا مثلاً قیمت را تعدیل کنند.
مخاطرات اخلاقی (کژمنشی)
کژمنشی وقتی اتفاق میافتد که طرفی که اقدامات وی قابل مشاهده نیست احتمال رخداد حوادث را تحت تاثیر قرار دهد یا احتمال پرداخت توسط طرف دیگر را افزایش میدهد. کژمنشی موجب استفادهٔ ناکارا از منابع میشود.
مثال
در قرارداد میان مدیر و کارگزار، مدیر با کارگزاری قرارداد میبندد که اقدامی انجام دهد که به نفع مدیر باشد. اما کارگزار ممکن است در صورت عدم نظارت مستقیم مدیر، این اقدام تعهد نموده را خوب انجام ندهد. و مرتکب کژمنشی شود. مثلاً کارفرما با کارگر قرارداد میبندد که به ازا هر ساعت ارائه خدمات کار، دستمزد معینی به وی بپردازد. کارگر هم متعهد میشود که تلاش خود را حین کار انجام دهد اما وقتی تحت نظارت مستقیم نباشد ممکن است کمکاری کند و تعهد خود را انجام ندهد.
بازیابی اطلاعات
بازیابی اطلاعات (به انگلیسی: Information Retrieval) به فناوری و دانش پیچیدهٔ جستجو و استخراج اطلاعات، دادهها، فرادادهها در انواع گوناگون منابع اطلاعاتی مثل بانک اسناد، مجموعهای از تصاویر، و وب گفته میشود.
با افزایش روزافزون حجم اطلاعات ذخیره شده در منابع قابل دسترس و گوناگون، فرایند بازیابی و استخراج اطلاعات اهمیت ویژهای یافته است. اطلاعات مورد نظر ممکن است شامل هر نوع منبعی مانند متن، تصویر، صوت و ویدئو باشد. بر خلاف پایگاه دادهها، اطلاعات ذخیره شده در منابع اطلاعاتی بزرگ مانند وب و زیرمجموعههای آن مانند شبکههای اجتماعی از ساختار مشخصی پیروی نمیکنند و عموماً دارای معانی تعریف شده و مشخصی نیستند. هدف بازیابی اطلاعات در چنین شرایطی، کمک به کاربر برای یافتن اطلاعات مورد نظر در انبوهی از اطلاعات ساختارنایافته است.
جستجوگرهای گوگل، یاهو و بینگ سه نمونه از پراستفادهترین سیستمهای بازیابی اطلاعات هستند که به کاربران برای بازیابی اطلاعات متنی، تصویری، ویدئویی و غیره کمک میکنند.
«بازیابی اطلاعات» در برخی منابع فارسی به اشتباه به جای ذخیره و بازیابی دادهها که به معنای دانش شناخت رسانههای ذخیرهسازی فیزیکی است، به کار رفته است.
مدلسازی اطلاعات
مدلسازی مفهومی اطلاعات، یکی از فنون تجزیه و تحلیل و تشریح اطلاعات مورد نیاز کاربران سیستم است. در تجزیه و تحلیل اطلاعات باید ذهن خود را بر شناخت مفهومی اطلاعات متمرکز ساخت. در تشریح ماهیت اطلاعات باید از جملات موجز، دقیق و خوانا استفاده کرد. از آنجایی که تشریح اطلاعات، راهنمای طراحی پایگاه اطلاعاتی بشمار میآید باید برای کاربران، برنامه نویسان و سایر متخصصان فنی خوانا باشد. زیرا راهنمای طراحی پایگاه اطلاعاتی بشمار میآید. از آنجایی که هر سیستم کاربران متعددی دارد و آنان نیز از داده و بازدادههای گوناگون استفاده میکنند و همچنین تحلیلگر معمولاً با سیستم آشنا نیست و ضمن تجزیه و تحلیل و تشریح با آن آشنا میشود تشریح اطلاعات برای سیستم دشوار است. تشریح اطلاعات برای پاسخگویی به نیازهای «فرایند سیستم» باید به صورت تفضیلی صورت پذیرد و در عین حال از کلیتی برخوردار باشد که به تشکیل یک پایگاه اطلاعاتی منجر شود و نیازهای کلی سازمان را در بعد اطلاعات برآورده سازد. و چون تا این مرحله به اندازه کافی کار طراحی آسان شده است تحلیلگر باید تشریح اطلاعات را در محدوده زمانی و بودجهای پروژه مکتوب نماید. اکنون این پرسش ممکن است مطرح شودکه چرا «نمودار جریان اطلاعات» شرح کاملی از اطلاعات ارائه نمیدهد؟ پاسخ این است که نمودار جریان اطلاعات تنها چگونگی بکارگیری اطلاعات در فرایندهای سیستم را نشان میدهد و روابط مورد نیاز میان موجودیتهای سازمان را به نمایش نمیگذارد. بدین ترتیب پایگاه اطلاعاتی مبتنی بر یک نمودار جریان اطلاعات نمیتواند از شاخص روانی سازمانی برخوردار باشد. از سوی دیگر، مدل مفهومی اطلاعات، تحلیلگر را تشویق مینماید تا تحلیل اطلاعات را بر مبنای نیازهای سازمان و از دید کاربرای یا نحوه تجسم ذهنی آنان قرار دهد. شرح تفصیلی نیازهای اطلاعاتی سیستم مانند بازدادهها و غیره بعداً به مدل افزوده خواهد شد. از انجایی که مدل مفهومی، اطلاعات را از دید سازمان تشریح میکند نه از دید فرایندهای تفصیلی سیستم بنابراین پایگاه اطلاعاتی حاصل از آن با نیازهای اطلاعاتی سازمان قابلیت انطباق بیشتری خواهد داشت. تشریح اطلاعات با استفاده از مدل مفهومی مستلزم موارد زیر است: ۱- مجموعهای از ساختهها (موجودیت، رابطه، صفت، نشانگر، وابستگی) برای تعریف اطلاعات. ۲- قوانینی برای کنترل چگونگی ترسیم ساختهها در شکل دهی مدل. ۳- روشی برای ساختن مدل مفهومی اطلاعات با استفاده از ساختهها، و قوانین برای نمایش ساختهها، قوانین و روش ساختن مدل مفهومی اطلاعات.
نخستین گام در بازیابی اطلاعات، مدلسازی اطلاعات و توصیف و تعریف ارتباط موجود میان اجزاء منبع اطلاعاتی با نیازهای اطلاعاتی کاربر است. سه مدل مهم در حوزهٔ بازیابی اطلاعات عبارت است از:
مدل دودویی (یا دوگانی): در مدل دودویی (یا دوگانی) هر سند (document) به صورت کیفی پر از کلمات (bag of words) در نظر گرفته میشود.
مدل بُرداری: در مدل بُرداری، هر سند به صورت برداری از کلمات در یک فضای برداری چند بُعدی در نظر گرفته میشود که ابعاد آنرا کلمات تشکیل میدهند. مولفههای این بردار سند، در واقع وزنهایی هستند که نشان میدهند هر یک از کلمات چقدر در متمایز کردن آن سند دخیل هستند.
مدل احتمالاتی: در مدل احتمالاتی، به هر سند احتمالی اختصاص داده میشود که مربوط بودن آن مستند را به نیاز کاربر به صورت احتمال بین صفر و یک بیان میکند.
تعیین میزان ربط هر سند به نیاز اطلاعاتی کاربر
بعد از تعریف مدل، سیستم آمادهٔ دریافت نیاز اطلاعاتی کاربر است. معمولاً کاربران نیاز اطلاعاتی خود را در قالب یک «پُرسه» برای سیستم بیان میکند که معمولاً شامل چندین کلمات یا عبارات است. سیستم سپس بر اساس مدلی که اطلاعات بر اساس آن تعریف شدهاند، میزان ربط هر سند را با پُرسهٔ کاربر محاسبه میکند، و سندهایی را که از همه باربط تر تشخیص داده شدهاند به عنوان نتیجهٔ بازیابی باز میگرداند.
مدل دودویی
در مدل دودویی، نیاز اطلاعاتی کاربر به صورت عبارتی منطقی با عملگرهای AND و OR و NOT بیان میشود و هر سندی که این عبارت در مورد آن صحیح باشد بازیابی میشود. مثلاً اگر نیاز اطلاعاتی به صورت Iran AND Oil بیان شود، تمامی اسنادی که هردو کلمهٔ Iran و Oil را دربردارند به کاربر نمایش داده میشوند. در مدل دودویی سند یا باربط است یا نیست، و هیچ معیاری برای سنجش میزان (درجهٔ) ربط وجود ندارد. مثلاً دو سند را در نظر بگیرید که یکی تماماً دربارهٔ ایران و نفت بحث میکند، و دیگری در مورد اقتصاد جهانی صحبت میکند و فقط از نام ایران و نفت به عنوان مثالی در یک جمله استفاده کرده است. سیستمی که از مدل دودویی استفاده کرده تفاوتی بین این دو سند قائل نخواهد شد. در صورتیکه در واقع سند اول بیشتر به نیاز کاربر مربوط است.
مدل بُرداری
در مدل برداری، برای سنجش میزان ربط اسناد و نیاز اطلاعاتی کاربر، سیستم اسناد موجود و پُرسهٔ کاربر را در فضای چند بعدی مدلسازی میکند. در نتیجه برای سنجش میزان شباهت میان بُردار پُرسه و بردار هر سند میتوان از زاویهای که این دو بردارها با هم میسازند استفاده کرد. اسنادی که بردارشان با بردار پرسهٔ کاربر زاویه کوچکتری میسازد بیشتر با نیاز اطلاعاتی کاربر هم جهت هستند و در نتیجه مرتبطتر خواهند بود. برتری این مدل این است که به سیستم امکان درجهبندی میزان ارتباط اسناد با پرسه را میدهد.
مدل احتمالاتی
این مدل نخستین بار توسط استیو رابرتسن و کارن اسپارک جونز در سالهای ۱۹۷۰ معرفی شد. این مدل به لحاظ اینکه مدارک و پرسشها را به صورت بردار عرضه میکند شبیه مدلبرداری است، اما به جای بازیابی مدارک براساس میزان مشابهت با پرسش، مدارک را براساس احتمال ارتباطشان با پرسش بازیابی میکند. احتمال ربط مدرکی خاص به پرسش را میتوان با جمع اوزان ربط اصطلاحات آن مدرک، یعنی برآورد احتمال ظهور اصطلاحات موجود در پرسش و در مدرک مرتبط، و نه در مدرک غیرمرتبط، محاسبه کرد. در مدل بازیابی کلاسیک احتمالی، این احتمالات اصطلاح از طریق مجموعهای نمونه از مدارک و پرسشها همراه با قضاوت مرتبط مربوط به آن تخمین زده میشود. با وجود این، اجرای فرایند تخمین به صورت عملیاتی مشکل است، زیرا جمعآوری دادههای ربط لازم قبل از جستجوی واقعی عملاً غیرممکن است. در نتیجه، برای تخمین احتمال اصطلاح، معمولاً، در این مدل از بازخورد ربط استفاده میکنند.
در مدل احتمالاتی هم به ازای هر نیاز اطلاعاتی، تمامی اسناد بر اساس احتمال این که با نیاز اطلاعاتی مرتبط باشد مرتب میشوند و لیست اسناد در نهایت به صورت درجهبندی شده (مانند مدل برداری) به کاربر نمایش داده میشود، به نحوی که اولین سندی که کاربر میبیند از همه بیشتر احتمال دارد که به نیاز او ربط داشته باشد.
تفاوت بازیابی داده و بازیابی اطلاعات
بین بازیابی اطلاعات و بازیابی داده تفاوتهای زیادی وجود دارد. دادهها ابهام ندارند، اما اطلاعات نیاز به تفسیر دارد و در نتیجه مبهم میشوند. سیستمی که برای بازیابی داده طراحی شده نیازی به رفع این ابهامها ندارد، اما در سیستم بازیابی اطلاعات باید هر چه بهتر اطلاعات را مدل کرد تا ابهام در درک اطلاعات توسط سیستم کمتر شوند. به همین علت بر خلاف سیستمهای بازیابی داده که در آن کارایی سیستم از نظر سرعت و فضا به عنوان معیار ارزیابی در نظر گرفته میشود، در سیستمهای بازیابی اطلاعات، معیار دقت (precision) و بازخوانی (recall) و معیارهایی شبیه به آنها به عنوان معیارهای اصلی ارزیابی به کار میروند.
معیارهای ارزیابی
معیار دقت: به حاصل تقسیم «تعداد مستندات بازیابی شدهٔ واقعاً باربط» بر «تعداد کل مستندات بازیابی شده» گفته میشود.
معیار صحت: به مقدار دقیق اطلاعات و صحیح که مورد جستجو قرار گرفته است گفته میشود.
پردازش اطلاعات
به مفهوم کلّی، پردازش موازی اطلاعات عبارت است از دریافت دادهها، ایجاد فرایند مقایسه و در نهایت تغییر یا عدم تغییر اطّلاعات موجود به صورتی دیگر. بدین ترتیب، هر آنچه که در جهان رخ میدهد، میتواند به نوعی پردازش اطّلاعات تلقی گردد.
داده کاوی چیست
داده عبارت است از هر شکل، نمودار، عدد، متن، عکس و... که پیام زیادی منتقل نمیکند، و برای استفاده از آن باید آن را پردازش کرد. برای مثال نتایج حاصل از یک آمارگیری، داده در نظر گرفته میشود چراکه اعداد حاصل از آمارگیری اطلاعات چندانی در اختیار قرار نمیدهد و باید آن را پردازش کرد تا شاخصهای آماری و سایر اطلاعات مورد نیاز بتوانند ویژگیهای جامعه را بیان کنند.
بانک اطلاعات
به نتایج پردازش داده، اطلاعات میگویند. کسب اطلاعات در واقع هدف از جمع آوری داده و پردازش آن میباشد تا بتوان با استفاده از آن به نتایج مطلوب دسترسی پیدا کرد. معمولاً اطلاعات برای مخاطب ارزش بسیار بیشتری دارد و میتواند مطالب بیشتری از آن دریافت کند. این تعاریف بطور نسبی مطرح میشوند و ممکن است داده یک سیستم، اطلاعات سیستم دیگر باشد و بالعکس.
به طور کلی، میتوان همهٔ دانستهها، آگاهیها، داشتهها، آمارها، شناسهها، پیشینهها و پنداشتهها را داده یا دیتا (به انگلیسی: Data) نامید. انسان برای ثبت و درک مشترک هر واقعیت و پدیده از نشانههای ویژهٔ آن بهره گرفتهاست.
انسان برای نمایاندن دادهها نخست از نگاره و در ادامهٔ سیر تکاملی آن از حروف، شمارهها و نشانهها کمک گرفت. برای بازنمودن دادهها از این موارد کمکی یا ترکیبی از آنها استفاده میشود
در رایانه
به اعداد، حروف و علائم که جهت درک و فهم مشترک از انسانها یا رایانه سرچشمه میگیرند داده میگویند. دادهها معمولاً از سوی انسانها بصورت حروف، اعداد، علائم و در رایانه به صورت نمادهایی (همان رمزهای صفر و یک) قراردادی ارائه میشوند. اصطلاح داده یک عبارت نسبی است یعنی اگر موجب درک و فهم لازم و کامل دراین مرحله شدهاست به عنوان آگاهی یا اطلاعات از آن نام میبرند و چنانچه موجب درک و فهم کامل نگردد به عنوان همان داده به شمار میآیند و چون هدف نهایی آگاهی و اطلاعات است باید از سوی دستاندرکاران (انسان یا رایانه) دستکاری یا پردازش شوند. منظور از دستکاری یا پردازش دادهها انجام عملیاتی از قبیل جمع، تفریق، ضرب، تقسیم، مقایسه وغیرهاست.
دادهها مجموعهای از نمادها (برای انسان حروف، اعداد، علائم و برای رایانه رمزهای صفر و یک) هستند که حقایق را نشان میدهند و برای انسان از طریق رسانههای وی (بینایی، شنوایی، چشایی، بویایی، بساوایی) و برای رایانه از طریق لوازم ویژه (صفحه کلید موس و غیره) به دست میآیند.
دادهها امروزه فقط از سوی انسان یا رایانه پردازش میشوند یعنی کارهایی روی آنها صورت میگیرد. در پردازش دادهها (دادهپردازی) در رایانه ابتدا دادهها به رایانه وارد میشوند. این دادهها درابتدا ذخیره شده و روی آنها عملیاتی (جمع، تفریق، ضرب، تقسیم و...) صورت میگیرد. پس از این که این عملیات (پردازش) صورت گرفت معمولاً دادهها به یک رایانه دیگر یا دوباره به انسانها منتقل میشود. در اغلب گزارشها و یادداشتهای سازمانی، دادهها به چشم میخورند. برای نمونه، تاریخ و مقدار یک صورتحساب یا چک، جزئیات فهرست حقوق، تعداد وسایل نقلیهای که از نقطهٔ خاصی در کنار جاده گذشتهاند،... نمونههایی از دادهها هستند.
انواع دادهها از نظر ساختیافتگی
دادههای ساختیافته
دادههای نیمهساختیافته
دادههای زمانی
در بسیاری از کاربردهای مبتنی بر دادهها و اطلاعات ذخیرهسازی و بازیافت حالا ت و وضعیتهای سیستم در طی زمان اهمیت مییابد.
دادههای نیمهساختیافته
دادههای نیمه-ساختیافته شکلی از دادههای ساختیافتهای هستند که از ساختار رسمی از جداول و مدلهای دادهای وابسته به پایگاهِ دادههایِ رابطهای مطابقت نمیکنند، اما با این وجود شامل برچسبها یا علامتها و شاخصهایی هستند که عناصر معنایی را از یکدیگر جدا میکنند و سلسله مراتبی از رکوردها و فیلدها را بین دادهها ایجاد میکنند.
دادههای مکانی
دادههای مکانی (geospatial data ) به مجموعهای از دادهها گفته میشود که بیان کننده موقعیت جغرافیایی یک عارضه(طبیعی یا مصنوعی) بر روی زمین باشند. دادههای مکانی معمولاً به صورت موقعیت و یا روابط هندسی ذخیره شده و قابل نمایش در نقشهها میباشند. دادهها مکانی بیشتر در سامانههای اطلاعات مکانی نگهداری شده، قابل دسترسی و پردازش میباشند.
پردازش رایانهای دادهها
پردازش رایانهای دادهها هر فرایندی است که از برنامهای رایانهای برای واردسازی دادهها، خلاصهبندی، تحلیل و در غیر اینصورت تبدیلداده به اطلاعات قابل استفاده استفاده میکند.
علوم و فناوری پردازش دادهها دارای وسعت، گوناگونی، و پیچیدگی فراوانی بوده، و این زمینه از دانش به شاخهها و زیر شاخههای متعددی تقسیم میشود، که برخی از آنها عبارت است از:
پردازش علائم
پردازش علائم (سیگنالها) را باید یکی از شاخههای وسیع و پر کاربرد در پردازش دادهها به حساب آورد.
پردازش تصاویر
پردازش تصاویر یکی از زمینههای عمده و خاص در پردازش علائم به حساب میآید که در آن دادههای مورد پردازش و عملآوری تصاویر و سیگنالهای دو بعدیست.
پردازش متون
یکی از مسائل عمده در پردازش متون و به طور عمومیتر در پردازش زبانهای طبیعی عملیات و فرایندهای مربوط به مدلسازی دادهها است.
فشردهسازی دادهها
کدگذاری منبع روشهای فشردهسازی یک منبع اطلاعات را مطالعه میکند. منابع اطلاعاتی طبیعی، مانند گفتار یا نوشتار انسانها، دارای افزونگی است؛ برای مثال در جمله «من به خانهمان برگشتم» ضمایر «مان» و شناسه «م» در فعل جمله را میتوان از جمله حذف نمود بدون اینکه از مفموم مورد نظر جمله چیزی کاسته شود. این توضیح را میتوان معادل با انجام عمل فشرده سازی روی اطلاعات یک منبع اطلاعات دانست؛ بنابراین منظور از فشرده سازی اطلاعات کاستن از حجم آن به نحوی است که محتوی آن دچار تغییر نامناسبی نشود.
در علوم کامپیوتر و نظریه اطلاعات، فشرده سازی دادهها یا کد کردن دادهها، در واقع فرایند رمزگذاری اطلاعات با استفاده از تعداد بیتهایی (یا واحدهای دیگر حامل داده) کمتر از آنچه یک تمثال رمزگذاری نشده از همان اطلاعات استفاده میکند و با به کار گرفتن روشهای رمزگذاری ویژهای است.
مانند هر ارتباطی، ارتباطات با اطلاعات فشرده، تنها زمانی کار میکند که هم فرستنده و هم گیرندهٔ اطلاعات، روش رمزگذاری را بفهمند. به عنوان مثال این نوشته تنها زمانی مفهوم است که گیرنده متوجه باشد که هدف پیادهسازی با استفاده از زبان فارسی بوده. به همین ترتیب، دادهٔ فشرده سازی شده تنها زمانی مفهوم است که گیرنده روش رمزگشایی آن را بداند.
فشرده سازی به این دلیل مهم است که کمک میکند مصرف منابع با ارزش، مانند فضای هارد دیسک و یا پهنای باند ارسال، را کاهش دهد. البته از طرفی دیگر، اطلاعات فشرده سازی شده برای اینکه مورد استفاده قرار بگیرند باید از حال فشرده خارج شوند و این فرایند اضافه ممکن است برای بعضی از برنامههای کاربردی زیان آور باشد. برای مثال یک روش فشرده سازی برای یک فیلم ویدئویی ممکن است نیازمند تجهیزات و سختافزار گرانقیمتی باشد که بتواند فیلم را با سرعت بالایی از حالت فشرده خارج سازد که بتواند به طور همزمان با رمزگشایی پخش شود (گزینهای که ابتدا رمزگشایی شود و سپس پخش شود، ممکن است به علت کم بود فضای برای فیلم رمزگشایی شده حافظه امکانپذیر نباشد). بنابراین طراحی روش فشرده سازی نیازمند موازنه و برآیندگیری بین عوامل متعددی است. از جمله این عوامل درصد فشرده سازی، میزان پیچیدگی معرفی شده (اگر از یک روش فشرده سازی پر اتلاف استفاده شود) و منابع محاسباتی لازم برای فشرده سازی و رمزگشایی اطلاعات را میتوان نام برد. فشرده سازی به دو دسته فشردهسازی اتلافی (فشردهسازی با اتلاف) و فشردهسازی بهینه فشردهسازی بیاتلاف اطلاعات تقسیم میشوند. کدگذاری منبع، علم مطالعه روشهای انجام این عمل، برای منابع متفاوت اطلاعاتی موجود است.
فشرده سازی بهینه در مقابل اتلافی
الگوریتمهای فشرده سازی بهینه معمولاً فراوانی آماری را به طریقی به کار میگیرند که بتوان اطلاعات فرستنده را اجمالی تر و بدون خطا نمایش دهند. فشرده سازی بهینه امکانپذیر است چون اغلب اطلاعات جهان واقعی دارای فراوانی آماری هستند. برای مثال در زبان فارسی حرف "الف" خیلی بیش تر از حرف "ژ" استفاده میشود و احتمال اینکه مثلاً حرف "غین" بعد از حرف "ژ" بیاید بسیار کم است. نوع دیگری از فشرده سازی، که فشرده سازی پر اتلاف یا کدگذاری ادراکی نام دارد که در صورتی مفید است که درصدی از صحت اطلاعات کفایت کند. به طور کلی فشرده سازی اتلافی توسط جستجو روی نحوهٔ دریافت اطلاعات مورد نظر توسط افراد راهنمایی میشود. برای مثال، چشم انسان نسبت به تغییرات ظریف در روشنایی حساس تر از تغییرات در رنگ است. فشرده سازی تصویر به روش JPEG طوری عمل میکند که از بخشی از این اطلاعات کم ارزش تر "صرف نظر" میکند. فشرده سازی اتلافی روشی را ارائه میکند که بتوان بیشترین صحت برای درصد فشرده سازی مورد نظر را به دستآورد. در برخی موارد فشرده سازی شفاف (نا محسوس) مورد نیاز است؛ در مواردی دیگر صحت قربانی میشود تا حجم اطلاعات تا حد ممکن کاهش بیابد.
روشهای فشرده سازی بهینه برگشت پذیرند به نحوی که اطلاعات اولیه قابلیت بازیابی به طور دقیق را دارند در حالی که روشهای اتلافی، از دست دادن مقداری از اطلاعات را برای دست یابی به فشردگی بیشتر میپذیرند. البته همواره برخی از داده وجود دارند که الگوریتمهای فشرده سازی بهینهٔ اطلاعات در فشرده سازی آنها ناتوان اند. در واقع هیچ الگوریتم فشرده سازی ای نمیتواند اطلاعاتی که هیچ الگوی قابل تشخیصی ندارند را فشرده سازی کند. بنابراین تلاش برای فشرده سازی اطلاعاتی که قبلاً فشرده شدهاند معمولاً نتیجهٔ عکس داشته (به جای کم کردن حجم، آن را زیاد میکند)، هم چنین است تلاش برای فشرده سازی هر اطلاعات رمز شدهای (مگر حالتی که رمز بسیار ابتدایی باشد).
در عمل، فشرده سازی اتلافی نیز به مرحلهای میرسد که فشرده سازی مجدد دیگر تأثیری ندارد، هرچند یک الگوریتم بسیار اتلافی، مثلاً الگوریتمی که همواره بایت آخر فایل را حذف میکند، همیشه به مرحلهای میرسد که دیگر فایل تهی میشود.
نظریه
سابقهٔ نظری فشرده سازی برای فشرده سازیهای بهینه توسط نظریهٔ اطلاعات (که رابطه نزدیکی با نظریهٔ اطلاعات الگوریتمی دارد) و برای فشرده سازیهای اتلافی توسط نظریهٔ آهنگ-پیچیدگی ( Rate–distortion theory) ارائه شدهاند. این شاخههای مطالعاتی در اصل توسط کلوده شانون( Claude Shannon)، که مقالاتی بنیادی در این زمینه در اواخر دههای ۱۹۴۰ و اوایل دههٔ ۱۹۵۰ به چاپ رسانده است به وجود آمده. "رمزنگاری" و "نظریهٔ رمزگذاری" نیز رابطه بسیار زیادی با این زمینه دارند. ایدهٔ فشرده سازی رابطهٔ عمیقی با آمار استنباطی دارد.
اطلاعات
اطّلاع یا آگاهش (و با نگرسوی آشکارتر ابزاری نیز آگاهِه) در کوتاه ترین تعریف، "دادههای پردازش شده" است. داده ها(data) مواد خام بالقوه معنی داری هستند که ما آنها را در راستای شناختن و فهمیدن و حتی تفسیر چیزها، کالاها، رویدادها یا هرگونه هستی ای که در جهان واقعیت و یا دنیای خیال یافت میشوند، به واسطه روشهای پژوهشی، ابزارهای شناختی مانند دستگاه زبان، احساسات پنج گانه، ذهن و مغز و حتی تجربه خود به دست میآوریم. اطلاعات، آگاهیهای به دست آمده از عنصرها و رویدادهای جهان هستی است. به زبان محدود تکنیکی، مجموعهای از نمادهای زبانی معنی دار و پیوسته درباره موجودات است. اطلاعات در زبان انگلیسی(information)از نظمی ساختاری و ذاتی خبر میدهد.
از منظر فلسفه، اطّلاعات مفهومی چندشکلی (polymorphic) و چندمعنایی (polysemantic) است.
نظریه اطلاعات
نظریّهٔ اطّلاعات مدلی ریاضی از شرایط و عوامل موثر در انتقال و پردازش دادهها و اطّلاعات فراهم میآورد. نظریهٔ اطلاعات با ارائهٔ روشی جهت «کمّی سازی و اندازهگیری عددی اطلاعات» به موضوعاتی مانند ارسال، دریافت، و ذخیرهسازی بهینهٔ دادهها و اطلاعات میپردازد. تمرکز اصلی این نظریّه بر روی محدودیتهای بنیادین که در ارسال و تحلیل دادهها وجود دارد میباشد، و کمتر به نحوهٔ عملکرد دستگاههای خاص میپردازد. پیدایش این نظریه عموماً به مهندس برقی به نام کلاود شانون در سال ۱۹۴۸ میلادی نسبت داده میشود. نظریه اطلاعات مورد استفاده خاص مهندسین مخابرات بوده، هرچند برخی از مفاهیم آن در رشتههای دیگری مانند روانشناسی، زبانشناسی،کتابداری و اطلاع رسانی، و اطلاعات و دانش شناسی نیز مورد استفاده قرار گرفتهاست. مفهوم اطلاعاتی که توسط شانون مطالعه شد اطلاعات از دید آمار و احتمالات بوده و با مفاهیم روزمره از اطلاعات مانند «دانش» و یا استفادههای روزمره از آن در زبان طبیعی مانند «بازیابی اطلاعات»، «تحلیل اطلاعات»، «چهارراه اطلاعات» و غیره تفاوت میدارد. اگر چه نظریه اطلاعات رشتههای دیگر مانند روانشناسی و فلسفه را تحت تأثیر قرار داده، ولی بدلیل مشکلات تبدیل «مفهوم آماری اطلاعات» به «مفهوم معنایی دانش و محتوا» تأثیراتش بیشتر از نوع القای احساساتی نسبت به مفهوم اطلاعات بودهاست.
تاریخچه
خلق تلگراف و تلفن توجه و علاقه نسبت به مفهوم اطلاعات و انتقال آن را افزایش داد. در سال ۱۸۴۴ میلادی، ساموئل مورس خط تلگرافی بین شهرهای واشنگتن و بالتیمور در آمریکا ساخت. مورس هنگام ارسال اطلاعات به مشکلات عملی الکتریکی برخورد. او متوجه شد که خطوطی که از زیر زمین کشیده شدهاند مشکلات بیشتری از خطوطی که هوایی از طریق تیر منتقل میشوند دارند و این خود زمینهای برای تحقیقات بعدی شد. با اختراع تلفن توسط الکساندر گراهام بل در سال ۱۸۷۵ میلادی و گسترش شدید آن، برخی از دانشوران به بررسی مشکلات انتقال اطلاعات پرداختند. اکثر این تحقیقات از تبدیل فوریه استفاده جسته ولی تمرکز آنها بیشتر به جنبه عملی و مهندسی موضوع بود.
شروع تحقیق در مورد نظریه اطلاعات اولین بار در سال ۱۹۲۴ توسط هری نایکوئیست در مقالهای به نام «عوامل خاصی که سرعت تلگراف را تحت تأثیر قرار میدهند» انجام شد. نایکویست وجود نرخ ماکزیمم ارسال اطلاعات را متوجه شده و فرمولی جهت محاسبه این نرخ ماکزیمم ارائه کرد. کار مهم دیگر در این زمان مقاله «انتقال اطلاعات» در سال ۱۹۲۸ میلادی توسط هارتلی بود که اولین پایههای ریاضی نظریه اطلاعات را بنا گذاشت.
تولد واقعی نظریه اطلاعات را به مقاله «نظریه ریاضی مخابرات» توسط کلاود شانون نسبت داد. یکی از نکات اصلی مقاله شانون توجه به این نکته بود که بررسی سیگنالهای مخابراتی را باید از بررسی معانی ای که آن سیگنالها حمل میکنند جدا کرد، در حالی که پیش از او اطلاعات موجود در یک سیگنال الکتریکی از پیغامی که آن سیگنال منتقل میکند جدا در نظر گرفته نمیشد. شانون همچنین به این نکته توجه کرد که طول یک سیگنال همیشه متناسب با میزان اطلاعات آن نیست. مثلاً نقل شدهاست که در نامهای که ویکتور هوگو به ناشرش نوشت، فقط نماد «؟» را نوشته بود. در پاسخ نامهای دریافت کرد که فقط حاوی نماد «!» بود. این دو نماد برای هر دو طرف حاوی اطلاعات زیادی میباشد، هرچند از دید ناظری که معانی آنها را نداند، بی معنی هستند. مثال دیگر این جملهای طولانی است که به زبان فارسی نوشته شده باشد، ولی برای یک انگلیسی زبانی که فارسی نمیداند مفهومی ندارد. بدین سان شانون پیشنهاد نمود که مسئله ارسال سیگنالها را از ارسال معانی موجود در آنها جدا کرده، و برای موضوع اول نظریه ریاضی ای تولید نمود.
شانون در آن زمان در آزمایشگاه بل* مشغول به کار بود و سعی در تعبیه خطوط تلفن با ضریب اعتماد بالا داشت. پیش از شانون عوامل موثر در استفاده بهینه از خطوط تلفن شناخته نشده بود و تعداد حداکثر مکالمات تلفنی که میتوان روی خطوط تلفن موجود انجام داد نامشخص بود. شانون پس از ارائه تعریفی ریاضی از کانال مخابراتی، ظرفیتی به کانال مخابراتی نسبت داد که بیانگر میزان حداکثر اطلاعاتی است که روی کانال میتوان مخابره کرد. فرمول ظرفیت کانال شانون نه تنها به کانالهای بدون اغتشاش (بدون نویز)، بلکه حتی به کانالهای با اغتشاش واقعی نیز قابل اعمال بود. شانون فرمولی ارائه کرد که نحوه تاثیر پهنای باند کانال، و نسبت توان سیگنال ارسالی به اغتشاش (نسبت سیگنال به نویز) بر ظرفیت کانال را را آشکار میکرد.
مفهوم اطلاعات و راههای اندازهگیری آن
مفهوم اطلاعاتی که توسط شانون مطالعه شد اطلاعات از دید آمار و احتمالات بوده و با مفاهیم روزمره از اطلاعات مانند «دانش» و یا استفادههای روزمره از آن در زبان طبیعی مانند «بازیابی اطلاعات»، «تحلیل اطلاعات»، «چهارراه اطلاعات» و غیره تفاوت میدارد. اگر چه نظریه اطلاعات رشتههای دیگر مانند روانشناسی و فلسفه را تحت تأثیر قرار داده، ولی بدلیل مشکلات تبدیل «مفهوم آماری اطلاعات» به «مفهوم معنایی دانش و محتوا» تأثیراتش بیشتر از نوع القای احساساتی نسبت به مفهوم اطلاعات بودهاست.
آمار و احتمالات نقشی حیاتی و عمده در ظهور و رشد نظریه اطلاعات برعهده دارد.
آنتروپی اطلاعات
قضایای شانون
در این نظریه، کلاود شانون نحوهٔ مدلسازی مسئله ارسال اطلاعات در یک کانال مخابراتی را به صورت پایهای بررسی نموده، و مدل کاملی برای مدلسازی ریاضی منبع اطلاعات، کانال ارسال اطلاعات و بازیابی آن ارائه نمودهاست. او مسالهٔ ارسال اطلاعات از یک منبع به یک مقصد را به کمک علم احتمالات بررسی و تحلیل نمود. دو نتیجهٔ بسیار مهم، معروف به قضیههای شانون، عبارتاند از:
۱- حداقل میزان نرخی که میتوان نرخ فشرده کردن اطلاعات یک منبع تصادفی اطلاعات را به آن محدود نمود برابر با آنتروپی آن منبع است؛ به عبارت دیگر نمیتوان دنباله خروجی از یک منبع اطلاعات را با کمتر از آنتروپی آن منبع ارسال نمود.
۲- حداکثر میزان نرخی که میتوان بر روی یک کانال مخابراتی اطلاعات ارسال نمود به نحوی که قادر به آشکارسازی اطلاعات در مقصد، با احتمال خطای در حد قابل قبول کم، باشیم، مقداری ثابت و وابسته به مشخصات کانال است، که به آن ظرفیت کانال میگوئیم. ارسال با نرخی بیشتر از ظرفیت یک کانال روی آن منجر به خطا میشود.
این زمینه از علم مخابرات، به زیربخشهای کدگذاری منبع و کدگذاری کانال تقسیم میگردد. مباحث رمزنگاری مطرح شده توسط شانون نیز از این بنیان ریاضی بهره جستهاست. از زیر شاخههای مرتبط با آن میتوان نظریه کدینگ جبری کانال را نام برد.
معماری اطلاعات
معماری اطلاعات (به انگلیسی: Information Architecture و به اختصار: IA) هنر و علم سازماندهی اطلاعات در وبسایتها، اینترانتها، نرمافزارها، و واسطهای کاربر است. معماری اطلاعات، عبارت است از طراحی ساختاری سامانههای اشتراک اطلاعات، که با هدف ارتقای یافتپذیری و کاربردپذیری انجام میشود. معماران اطلاعات، چارچوبی برای چیدمان اطلاعات تعریف میکنند تا کاربر به سرعت و سهولت به اطلاعات مورد نظر خود دست یابد.
معماری اطلاعات و کتابداری و اطلاع رسانی
عصر حاضر در مقایسه با اعصار گذشته دیگر به دلیل ابداعات و اختراعات گوناگون با سرعتی وصف ناپذیر به سمت کشف مجهولات حرکت میکند و اگر انسان گذشته یک اختراع و اکتشاف را طی نسلهای متمادی با خود همراه میدید ، انسان امروزی چندین و چند اختراع و نوآوری را در عصر خود تجربه میکند . به دلیل همین حقایق انکار ناپذیر است که امروزه دانشمندان علوم مختلف عصر حاضر را " عصر انفجار اطلاعات " نامیدهاند .
امروزه مقوله « اطلاعات » نقش اساسی و بنیادین را در عصر ما بر عهده دارد . هیچ سازمان ، نهاد ، جامعه ... یافت نمیشود که حتی در جزیی ترین امور خود از دسترسی به اطلاعات بی بهره باشد .انتظارات و نیازهای کاربران با توجه به میزان دسترسی آنها به اطلاعات به طور اساسی تغییر یافته و این خود سبب قطع ارتباط میان چگونگی استفاده کاربران از وب سایتهای کتابخانهای و چگونگی طراحی آنها شده است . در این میان نقش معماری اطلاعات به عنوان وسیلهای جهت برنامه ریزی ، سازماندهی و توسعه کاربرد فناوری اطلاعات بسیار برجسته است .
تعریف معماری
هر جا که نیاز به طراحی موجودیت یا سیستمی باشد که ابعاد یا پیچیدگی آن از یک واحد معین فراتر رفته ، یا نیازمندیهای خاصی را تحمیل نماید ، نگرشی ویژه و همه جانبه را لازم خواهد داشت که در اصطلاح به آن معماری گفته میشود . معماری ترکیبی است از علم ، هنر ، تجربه که در رشتههایی نظیر ساختمان دارای قدمتی چند هزار ساله است . و همچنین معماری یعنی ارائه توصیفی فنی از یک سیستم که نشان دهنده ساختار اجزای آن ، ارتباط بین آنها و اصول و قواعد حاکم بر طراحی و تکامل آنها در گذر زمان باشد . در فرهنگ معماری اطلاعات ، یافت پذیری ( Findability) شاخصهای است که قابلیت یافتن یک موضوع یا شی خاص را بیان میکند .به عبارت دیگر یافت پذیری ، کیفیتی است که قابلیت یافته شدن و مکان یابی را نشان میدهد .هرگاه جستجو و یافتن یک چیز آسان باشد گویند که یافت پذیر است .
تاریخچه
اصطلاح معماری اطلاعات برای نخستین بار در سال ۱۹۷۵ توسط Richrd soul war man مطرح گردید . وی در رشته مهندسی معماری تحصیل کرده بود اما به موضوع چگونگی گردآوری اطلاعات و سازماندهی و نمایش صورتهای مختلف آن علاقمند شد . تعریفی که او از معماری اطلاعات ارائه داده چنین بود : « سازماندهی الگوها در قالب دادهها و ارائه این دادها به صورتی واضح و در عین حال پیچیده » این اصطلاح در سال ۱۹۹۶ توسط دو نفر از محققان علوم کتابداری و اطلاع رسانی به نامهای Peter Morvile و Lous Rosenfeld مدیران شرکت Argus Associate که در دانشکده کتابداری و اطلاع رسانی دانشگاه میشیگان تدریس میکردند ، مجددا مطرح گردید . در همین سال (۱۹۹۶) قانونی در کنگره آمریکا به تصویب رسید که به قانون " کلینگر کوهن " معروف شد . مطابق این قانون ، همه وزارتخانهها و سازمانهای فدرال آمریکا ملزم شدند معماری IT خود را تنظیم نمایند .مسئولیت تدوین ، اصلاح و اجرای معماری IT یکپارچه در هر سازمان مطابق این قانون بر عهده مدیران ارشد اطلاعاتی (CIO) آن سازمان قرار گرفت . قانون کلینگر کوهن معماری اطلاعات را چنین تعریف میکرد : « یک چارچوب یکپارچه برای ارتقاء یا نگهداری فناوری موجود و کسب فناوری اطلاعاتی جدید برای نیل به اهداف راهبردی سازمان و مدیریت منابع آن . »
به دنبال تصویب قانون کلینگر کوهن ، که مهمترین سند قانونی در مورد الزام تنظیم معماری اطلاعاتی در سازمانهای دولتی آمریکاست ، سازمان مدیریت و بودجه ریزی آمریکا ( OMB) نیز رهنمودی که در سال ۱۹۶۶ منتشر ساخت ، بر لزوم هماهنگی طرحها و هزینههای انجام شده توسط موسسات فدرال آمریکا ، از جمله وزارتخانهها ، سازمانها ، نیروهای نظامی و دانشگاههایی که از بودجه دولتی استفاده میکنند ، پروژههایی را برای تنظیم و تدوین معماری اطلاعاتی خود به انجام رساندهاند .
مفهوم معماری اطلاعات
اصطلاح معماری اطلاعات در سالهای اخیر به عنوان واژهای تازه در طراحی نظامهای اطلاعاتی و طراحی وب راه یافته اما هنوز هم متخصصین در ارائه تعریفی واحد از آن شک دارند . Martin White معماری اطلاعات را همچون اطلاع رسانی مجموعهای از ابزارها و روشها میداند که توسط متخصصین در مقیاسی وسیع برای حل مشکلات مدیریت اطلاعات استفاده میشود . Iain Barker در تعریف معماری اطلاعات میگوید : « معماری اطلاعات اصطلاحی است جهت توصیف ساختار یک سیستم ، یعنی شیوهای که در آن اطلاعات سازماندهی ، کد گذاری و منتقل میشوند . » D.Grant Campell در تشریح این اصطلاح میگوید : « معماری اطلاعات شباهت کمی با موضوعات دارای رویکرد ذهنی دارد و بیشتر شبیه به رویکردهای فلسفی مثل پدیده شناسی و ساختار گرایی است . » قانون کلینگر کوهن تصریح میدارد که معماری اطلاعات یک چارچوب یکپارچه برای ارتقاء یا نگهداری فناوری موجود و کسب فناوری اطلاعاتی جدید برای نیل به اهداف راهبردی سازمان و مدیریت منابع آن فراهم مینماید . هر تعریفی که از معماری اطلاعات ارائه کنیم ، باید بپذیریم که رویکرد معماری در برنامه ریزی و توسعه فناوری اطلاعات در یک سازمان ، نهاد یا دولت نقشی اساسی دارد . میتوان چنین گفت که معماری اطلاعات قادر است با سازماندهی اصولی اطلاعات به کاربران اجازه شناخت ، جستجو و استفاده از اطلاعات را بدهد .
امروزه لفظ معماری اطلاعات اغلب به امر سازماندهی اطلاعات در تار جهانگستر ( www ) اطلاق میشود . Gillian Davis خاطر نشان میسازد که علیرغم اینکه Marville و Rosenfeld هر دو کتابدار بودند ، اما هیچگاه به این موضوع نیندیشیدند که کتابداران میتوانند بهترین قشر در امر معماری اطلاعات باشند . میتوان به نوعی چنین ادعا نمود که پیش داشتهها و آموزشهای ارائه شده در دوره کارشناسی کتابداری نیست که شما را برای انجام کار آماده میسازد ، بلکه آنچه سبب پیشرفته تان در این حرفه میگردد ، نوع رویکرد و نگرش شما ، توانایی تان جهت ابداع و نوآوری و علاقه شما جهت استفاده از مهارتهایتان در مسیرهای جدید است . کتابداران دارای دیدی وسیع دریافتهاند که قادرند مهارتها و تخصص هایشان را در زمینههای جدیدی که با دسترسی به منابع اطلاعاتی چاپی کاملا متفاوت است ، بکار برند . با چنین نگرشی کتابداری به رشتهای تبدیل میگردد که در پی کسب مهارت در زمینه معماری اطلاعات خواهد بود .
امروزه اغلب مهارتهای معماری اطلاعات نیازمند مهارت بالای تکنولوژی است و کتابدارانی که از مدارس و دانشکدههای جدید کتابداری و اطلاع رسانی فارغ التحصیل میگردند بایستی توانایی بالایی در کار با اینترنت ، طراحی پایگاههای اطلاعاتی و HTML داشته باشند .
اصول راهبردی معماری اطلاعات
۱. بهینه سازی بودجه سازمانی از طریق برنامه ریزی و هماهنگی منابع مدیریت اطلاعات بین برنامهها ، بخشها و ادارات مختلف ۲. تسهیل تصمیم گیری مناسب از طریق تامین اطلاعات کارآمد ۳. پاسخگویی سریع به نیازهای اطلاعاتی از طریق سازماندهی پایگاهها و سیستمهای اطلاعاتی با هدف تامین حداکثر دسترسی ، تغییر و ارئه گزارش . ۴. حل مسائل سازمانی با راه حلهای سازمانی از طریق به حداقل رساندن افزونگی و دوباره کاریهای اطلاعاتی ۵. بهینه سازی سرمایه گذاری سازمانی در IT از طریق تدوین برنامهها و معماری جامع فناوری اطلاعات ۶. مدیریت صحیح و کارآمد پروژههای فناوری اطلاعات ۷. پاسخگویی به شرایط در حال تغییر
امروزه برای ایجاد معماری اطلاعات موثر از : مدیران و طراحان اینترنت ، مدیران و طراحان وب سایت ، طراحان رسانههای تصویری ، برنامه نویسان ، کتابداران و اطلاع رسانان ، محققان فنی و سایر افرادی که به نوعی در طراحی سیستمهای اطلاعاتی نقش دارند ، استفاده میکنند .
فلسفه اطلاعات
فلسفهٔ اطّلاعات (Philosophy of information) به آن دسته از پژوهشهای فلسفی و انتقادی اطلاق میگردد، که به منظور تبیین و روشنسازی مفاهیم، معانی، سرچشمهها، اصول، و مبادی بنیادین اطّلاعات انجام پذیرد.
مطالعات و بررسیهای فلسفی برروی مفاهیم اطلاعات معنایی هنوز در ابتداییترین مراحل آن قرار دارد، به طوری که حتی در مورد راهها و شیوههای طرح مسئله هم تا کنون توافقی حاصل نشده است.
تعریف اطّلاعات
گرچه تا کنون تعریفی فراگیر و همهجانبه از اطّلاعات میسّر نگردیدهاست، پدیدههای گوناگونی را میتوان بر حسب زمینه و موضوع، اطّلاعات نامداد. معمولاً از سه نوع پدیده به نام اطّلاعات یاد میشود:
اطّلاعات به عنوان یک فرایند شناختمحور
اطّلاعات به عنوان دانشی که ارائه گردیدهاست
از دادهها، اسناد، تصاویر، و موارد همانند آنها بهعنوان اطّلاعات یاد میشود
هر چند اطّلاعات به خودی خود مهمّ است، اهمّیّت واقعی آن به سبب دانشی است که میتواند از آن ناشی گردد. شایان اشاره و تأکید است که همچون تمامی موارد دیگر جهان، اطّلاعات، و دانش برآمده ازآن اطّلاعات هم مشمول ترازهای تجریداند:
آنچه که در این لایه دانش نامیده میشود، خود اطّلاعات است برای دانشی که در تراز بلافاصله بالاتر از آن واقع است. شاید سادهترین مثال را بشود ارتباط چکیدهٔ (مجرّدشده) یک مقاله با خود آن دانست: هر چند خود مقاله میتواند پاسخگوی پارهای از سوالات باشد، و لذا، از نوع دانش، برای چکیدهٔ خود به عنوان اطّلاعات عمل خواهد نمود.
دانش محاسبات و فلسفه
تعاملات و داد و ستدهای علمی مابین دانشمندان علوم رایانه و اندیشمندان وادی فلسفه به هیچ وجه امروزی نیست. فلسفهٔ تولّد و ظهور کامپیوترهای ارقامی در اواسط قرن بیستم (م) را در واقع میشود در حوزهٔ بزرگتر فلسفهٔ علوم، سیبرنتیک، علوم نرم، و نیز در مجموعهٔ علل و انگیزههای مربوط به آغاز تفکرّات سیستمی و کلیّاتنگر، و نیز در منشأ و بخش مشترک تمامی آنها - پیچیدگی - نشان گرفت.
آلودگی اطلاعات
آلودگی انفورماسیون یعنی آلودن اطلاعات درست به نادرست. به تعبیر دیگر از بین بردن ارزش، کیفیت، صحّت و محتوای اطلاعات بر اثر دخالت اطلاعات نادرست را آلودگی اطلاعات گویند (نوروزی، ۱۳۷۸). رسانههای گروهی، از جمله رادیو، تلویزیون، اینترنت و در رأس آن وب (وبنوشتها و وبگاهها) امروزه با انتشار اطلاعات نادرست و تبلیغات منفی موجب آلوده شدن جریان اطلاعات میشوند یا آنها را از مسیر صحیح منحرف میسازند. کشورها یا گروههای خاص با انتشار تبلیغات منفی و اطلاعات ضد و نقیض و نادرست موجب آلودگی اطلاعات میشوند.
روشهای مهم آلوده کردن اطلاعات عبارتند از:
حذف یا سانسور برخی اطلاعات
وارونه سازی اطلاعات بدون آگاهی مخاطب
تاخیر در ارسال پیام به مخاطب
ترکیب یا آمیختن اطلاعات درست و غلط به گونهای که تشخیص آنها ممکن نباشد.
اقتصاد اطلاعات
بحث دربارة نقش اطلاعات در اقتصاد، از بازاندیشی و زیر سؤال بردن یکی از فرضهای نظریة رقابت کامل در بازار شروع شد. این فرض بر این مبنا است که تمام شرکت کنندگان در بازار، از تمام قیمتها و تمام اطلاعات فناورانه مربوط، اطلاعات کامل دارند. بدین معنا که از یک سو، بنگاهها، قیمتهای تمام کالاهایی را که احتمالاً میتوانند تولید کنند و فناوری تولید این کالاها و نیز قیمتی که در آن میتوانند نهادههای لازم را خریداری کنند، می دانند. از سوی دیگر، تمام افراد هم از قیمتهایی که در آن میتوانند تمام کالاها را خریداری کنند و منابع شان را به طورکلی و به خصوص نیروی کارشان را بفروشند، آگاه هستند. به عبارت دیگر فرض میشود که مصرف کنندگان، صاحبان منابع و بنگاههایی که در بازار هستند، دربارة وضعیت حال وآیندة قیمتها و هزینهها و فرصتهای اقتصادی بازار، اطلاعات کامل دارند؛ بنابراین مصرف کنندگان قیمتی بیش از آنچه لازم است، برای کالا نمیپردازند. تفاوت قیمتها به سرعت از بین میرود و در سراسر بازار برای هر کالا تنها یک قیمت مطرح میشود. منابع به پیشنهاد دهندة بالاترین قیمت، فروخته میشود و با داشتن اطلاعات کامل از جریان قیمتها و هزینهها در حال و اینده، تولیدکنندگان به طور دقیق می دانند که چه میزان باید تولید کنند.
حال اگر اطلاعات بدین گونه برای طرفین آشکار و مهیا نباشد چه میشود؟ پاسخ به این سوال اساسی و تحلیل واقعیتهای موجود در دنیای واقع موضوعی را تحت عنوان اقتصاد اطلاعات پدید آورد که در ذیل به طور خلاصه به توضیح چندوچون این کار خواهیم پرداخت.
کوتاه سخن آنکه منظور از اقتصاد اطلاعات، بررسی چگونگی توزیع اطلاعات بین عاملان اقتصادی و نحوه تأثیرگذاری وجود یا عدم وجود این اطلاعات بر رفاه عاملان اقتصادی است. منظور از رفاه در این تعریف منافع عمومی عاملان اقتصادی است که به عنوان مثال در مورد مصرف کننده به مطلوبیت و در مورد بنگاه به سود اشاره میکند. مباحثی از قبیل اطلاعات ناکامل و اطلاعات نامتقارن از جمله مباحثی هستند که در این حوزه مورد بررسی قرار میگیرند.
تاریخچه
فردریش هایک در مقاله پیشگام خود در سال ۱۹۴۵ معتقد است: «ما باید به نظام قیمت به عنوان مکانیزم انتقال اطلاعات بنگریم» (هایک، ۱۹۴۵: ص۵۲۶). هایک در ادامه ذکر میکند که: چه مسألهای را میخواهیم حل کنیم وقتی تلاش میکنیم که نظم اقتصادی منطقی بسازیم؟ یک پاسخ این است که اگر ما همه اطلاعات مربوط را داشتیم و میتوانستیم از نظام معین ترجیحات شروع کنیم و نیز اگر از ابزارهای موجود آگاهی کامل داشتیم، تنها یک مسئله باقی میماند و آن پاسخ به این پرسش است که بهترین راه استفاده از ابزارهای موجود، چیست.
اما «آگاهی» از شرایط مورد استفاده هیچگاه به شکل متمرکز یا ادغام شده، وجود ندارد ؛ بلکه این آگاهی صرفاً به صورت اجزای (ذرههای) پخش شده، ناقص است و تمام افراد جدا از هم، آن را در اختیار دارند. بنابراین مسئله اقتصادی جامعه این است که چگونه منابع «معین» را با استفاده از اطلاعات تخصیص دهیم، درحالیکه به هیچکس کل آن اطلاعات داده نشدهاست. برنامهریزی برای تخصیص منابع موجود، مبتنی بر «اطلاعاتی» است که باید به برنامهریز داده شود و از قبل در اختیار او نیست.
چهکسی باید برنامهریزی کند؟ اختلاف نظردرباره این نیست که آیا برنامه ریزی باید انجام شود یا نه؛ بلکه در این مورد است که آیا برنامه ریزی برای کل نظام اقتصادی باید مرکزی باشد یا باید میان تعداد زیادی از افراد تقسیم شود. اصطلاح «برنامهریزی» که در ادبیات اقتصادی متداول است، به معنای برنامهریزی مرکزی است؛ یعنی هدایت کل نظام اقتصادی طبق یک برنامة یکپارچه انجام شود. رقابت به معنای برنامهریزی غیر متمرکز است و تعداد زیادی از افراد، جداگانه، آن را انجام میدهند. اینکه کدامیک از این دو نظام، کارایی بیشتری دارد، عمدتاً به پاسخ این پرسش بستگی دارد که کدام یک از «اطلاعات» موجود در جامعه کاملتر استفاده میکنند. در یک نظام اقتصادی متمرکز باید تمام اطلاعات به مقامات برنامهریز مرکزی منتقل شود؛ اطلاعاتی که ابتدا میان تعداد زیادی از افراد مختلف پخش شده بود. راه دیگر، انتقال «اطلاعات اضافی» به افراد برحسب نیازشان است تا بتوانند برنامههایشان را با برنامه دیگران هماهنگ کنند. اگر توافق کنیم که مسئلة اقتصادی جامعه عمدتاً انطباق با تغییرات در شرایط زمان و مکان است، در اینصورت تصمیمات نهایی باید به افرادی واگذار شود که با این شرایط آشنا باشند و تغییرات و منابع موجود انجام آنرا میشناسند. نمیتوانیم انتظار داشته باشیم که با انتقال این آگاهی به یک هیئت مرکزی و ادغام تمام اطلاعات، فرامین هیئت صادر شود؛ بلکه باید این مسئله را با عدم تمرکز حل کنیم. با عدم تمرکز این اطمینان حاصل میشود که اطلاعات مربوط به مقتضیات خاص زمان و مکان، بلافاصله مورد استفاده قرار میگیرد.
نظام قیمت، مکانیزمی برای انتقال اطلاعات است. مهمترین واقعیت نظام قیمت، اطلاعاتی است که براساس آن عمل میشود. هر شرکتکننده در نظام قیمت، به طور انفرادی اطلاعات اندکی لازم دارد تا بتواند اقدام درست را انجام دهد. حل مسائل نظام قیمت با تعامل افرادی است که هر یک تنها «اطلاعات جزئی» دارند. اطلاعات انسان کامل نیست و به کسب مستمر و انتقال اطلاعات نیاز دارد.
هایک در سخنرانی دریافت جایزة نوبل (۱۹۷۴)، بازار را یک «نظام اطلاعاتی» دانست که برای استفاده از اطلاعات پخش شده، در مقایسه با هر مکانیزم دیگری که بشر آگاهانه طراحی کردهاست، مکانیزم کاراتری دارد. هر چند نظریة نئوکلاسیک به محدودیتهای اطلاعاتی توجه نکردهاست و در واقع اطلاعات نقشی در این نظریه ندارد؛ اما هایک، مکرر، از اطلاعات صحبت کردهاست.
پیدایش رشته اقتصاد اطلاعات
رشته «اقتصاد اطلاعات» با انتشار دو مقاله در سال ۱۹۶۱، یکی توسط ویلیام ویکری (William Vickrey) و دیگری توسط جرج استیگلر (George Stigler)، متولد شد. اولین مقاله، «اقتصاد اطلاعات» تألیف جورج استیگلر و دومین مقاله، «سفتهبازی متقابل، حراجها و مناقصههای رقابتی مهرومومشده» به قلم ویلیام ویکری است. ویلیام ویکری حالتی را در نظر میگیرد که مقولة غیرقابل تقسیم و منحصربهفردی قرار است به یکی از خریداران بالقوه فروخته شود. ویکری نشان میدهد که با ارزشهای خصوصی مستقل و مزایدهگزاران همگن، قیمت مورد انتظار معامله در روش حراج از نوع انگلیسی و هلندی یکی است. او سپس مفهوم حراج مزایده مهر و موم شده قیمت دوم را وارد میکند و نشان میدهد که معادل روش حراج انگلیسی است. ویکری برتری روش حراج انگلیسی برحراج هلندی را در شرایط ریسک پذیری، وجود مزایدهگزاران بیتجربه و سایر مواردی که باعث دورشدن از فرضهای استاندارد میشود، نشان میدهد که در آن روش حراج انگلیسی، بهینة پارتو است.
جورج استیگلر در مقاله خود مدل سادهای برای جستوجو ارائه کرد؛ این مدل شامل اطلاعات بود. او نظریة استاندارد اقتصادی را به کار گرفت تا به طور درونزا مشخص کند که کارگزاران اقتصادی چه میزان اطلاعات باید کسب کنند. نقش استیگلر، مدلسازی صریح به منظور فعالیت برای کسب اطلاعات در چهارچوب مارشالی موجود بود. استیگلر از این واقعیت شروع میکند که هیچ خریداری از قیمتهایی که فروشندگان مختلف در هر زمان معین اعلام میکنند، آگاهی ندارند. در نتیجه خریداران برای پی بردن به مطلوب ترین قیمت، باید از فروشندگان مختلف نظرخواهی کنند. استیگلر این «نظرخواهی» را مدلسازی میکند. خریداری که به دنبال یک واحد از کالای همگن است، n پیشنهاد مستقل جمعآوری میکند که از توزیع مشترک f به دست آمدهاست. هزینة هر پیشنهاد، c است و از آنجا که مسئلة جستوجوی خریدار خنثی نسبت به ریسک، صرفاً انتخاب اندازة نمونة n بهگونهای است که مجموع قیمت مورد انتظار پرداخت شده برای کالا به اضافة هزینة جستوجو را حداقل سازد، اندازة بهینة جستوجو از شرط مرتبة اول محاسبه شدهاست. از این مطالب دو نتیجة مهم به دست میآید: اول اینکه پیشبینی میشود پخش قیمت اتفاق بیفتد که به معنای نقض قانون یک قیمتی است؛ در این صورت تفاوت در قیمتهای معاملات برای کالای همگن تحقق پیدا میکند. دوم اینکه منابع بیکار پیشبینی شدهاست. فعالیت جستوجو نشاندهندة سرمایهگذاری در حصول قیمت فروش یا اجاره بالاتر است. علاوه بر آن مدل جستوجوی استیگلر راه دیگری فراهم میکند که منجر به شناخت فرایند شکلگیری قیمت میشود.
چند تن از افراد تاثیرگذار در اقتصاد اطلاعات
استیگلر(George Stigler)
آکرلف (George Akerlofe)
ویکری (William Vickrey)
میرلس(James Myles)
مفاهیم پایه
اطلاعات
اطلاعات یا آگاهش در کوتاه ترین تعریف، "دادههای پردازش شده" است. دادهها (data) مواد خام بالقوه معنی داری هستند که ما آنها را در راستای شناختن و فهمیدن و حتی تفسیر چیزها، کالاها، رویدادها یا هرگونه هستی ای که در جهان واقعیت و یا دنیای خیال یافت میشوند، به واسطه روشهای پژوهشی، ابزارهای شناختی مانند دستگاه زبان، احساسات پنچ گانه، ذهن و مغز و حتی تجربه خود به دست میآوریم. اطلاعات، آگاهیهای به دست آمده از عنصرها و رویدادهای جهان هستی است. به زبان محدود تکنیکی، مجموعهای از نمادهای زبانی معنی دار و پیوسته درباره موجودات است. اطلاعات در زبان انگلیسی(information)از نظمی ساختاری و ذاتی خبر میدهد.
انقلاب اطلاعات
انقلاب اطلاعات موضوع نسبتاً جدیدی در ادبیات علمی است. بسیاری از صاحبنظران انقلاب اطلاعات راچیزی شبیه انقلاب صنعتی ارزیابی کردهاند واساسا انقلاب ابررسانه واطلاعات را بعد از انقلاب صنعتی انقلاب برق انقلاب نفت و انقلاب الکترونیک، پنجمین انقلاب علمی بشر بعد از رنسانس می دانند و اعتقاد دارند که این تحول، شیوهٔ تولید، توزیع و مصرف اطلاعات را دگرگون ساختهاست. یکی از جنبههای مهم و اساسی این انقلاب اقتصاد اطلاعات است زیرا اثرات اقتصادی انقلاب اطلاعات بسیار شگرف بودهاست.
ارزش اطلاعات
نقطهٔ آغازین تحلیل اقتصادی مشاهدهٔ این نکتهاست که اطلاعات ارزش اقتصادی دارد، چرا که اطلاعات به افراد اجازه میدهد تا انتخابی انجام دهند که عایدی انتظاری و یا مطلوبیت انتظاری آنها را نسبت به زمانی که اطلاعات وجود ندارد حداکثر سازند.
مکانیزم تعیین قیمت اطلاعات
خصوصیات و ماهیت کاملاً متفاوت فناوری اطلاعات نسبت به سایر کالاها و خدمات موجب شدهاست که برای بررسی بعد اقتصادی اطلاعات، روشهای تحلیل جدید (البته نه نوع جدیدی از تحلیل) بکار گرفته شود. لذا در بررسی و تحلیل بازاراطلاعات در عین حال که از روشهای کاملاً جدیدی استفاده میشود عواملی مثل سلیقهٔ افراد، فناوری تولید و ساختار بازار در چگونگی کارکرد این بازار نقش مبنایی ایفا میکند. بخش عمدهای از اقتصاد اطلاعات بر مکانیزم تعیین قیمت اطلاعات جهت استفادهٔ کارا و موثر از منابع اختصاص دارد. در این زمینه همانطور که در بالا اشاره شد هایک کار را آغاز کرد و دیگر اقتصادانان (همچون افراد نامبرده در بالا) این مسیر را ادامه دادند.
تقارن و عدم تقارن اطلاعات
اینکه اطلاعات چگونهاست در تعیین مکانیزم قیمت اطلاعات و رسیدن به کارایی اهمیت دارد اگر اطلاعات در دسترس همگان یکسان بوده و همهٔ افراد حاضر در بازار موردنظر اطلاعات یکسانی داشته باشند گوییم فرض تقارن اطلاعات برقرار بوده و هیچکس به علت نداشتن اطلاعات در معرض عدم دستیابی به کارایی قرار نخواهد گرفت. ضمن آنکه برقراری اطلاعات متقارن یکی از فروض تشکیل بازار رقابت کامل است.
وجود اطلاعات متقارن ضرورتی برای مطرح شدن اقتصاد اطلاعات ایجاد نمیکند. از آنجاکه در واقعیت افراد حاضر در بازار خاص نسبت به امر مورد نظر اطلاعات یکسانی ندارند لذا افراد با عدم تقارن اطلاعات مواجه بوده و از این ناحیه امکان عدول از بهینهٔ پرتو به آسانی امکان پذیر خواهد بود. به دلیل آنکه عدم تقارن اطلاعات موضوع اصلی اقتصاد اطلاعات است در ذیل جداگانه به آن خواهیم پرداخت.
اطلاعات نامتقارن
اطلاعات نامتقارن در واقع حالت خاصی از اطلاعات ناکامل است که در اکثر مسائل اقتصادی شایع است. عمده بحثها در اقتصاد اطلاعات به مسالهٔ اطلاعات نامتقارن مربوط میشود یعنی موقعیتی که در آن یک عامل اقتصادی در مورد مبادلهٔ خود اطلاعات خاصی دارد که طرف دیگر مبادله آن اطلاعات را ندارد. مثلاً کارگر در فروش نیروی کار خود به کارفرما در مورد نحوه و میزان تلاش و بهرهوری خود از اطلاعات بیشتری برخوردار است تا کارفرما. از این جهت رفتار عاملان اقتصادی در شرایط عدم تقارن اطلاعات بطور حتم با تعاملهای استراتژیک همراهاست. نکتهای که در اینجا باید تاکید شود این است که معمولاً طرف مبادله با اطلاعات بیشتر میخواهد فرد کمتر مطلع را استثمار کند. این رفتار فرصت طلبانه منجر به از بین رفتن ویژگیهای خوب بازار رقابت کامل و بروز عجز و نقص بازار رقابت ناقص میشود. در کل میتوان گفت که اطلاعات نامتقارن موجب بروز دو نوع رفتار فرصتطلبانهٔ انتخاب بد (کژگزینی) و مخاطرهٔ اخلاقی (کژمنشی) میشود.(این موارد و شیوههای رفع این مشکلها به صورت خیلی کوتاه در ذیل توضیح داده میشود و برای مطالعهٔ توضیح کاملتر در هر مورد به صفحهٔ مربوطه ارجاع داده میشود).
انتخاب بد و نامناسب (کژگزینی)
کژگزینی نوعی رفتار فرصت طلبانهاست که در موقعیتی رخ میدهد که در آن یک فرد با اطلاعات بیش تر از مبادله سود بردهو مزیت کسب میکند یا اساساً در جایی بروز میکند که یک فرد مطلع با یک فرد با اطلاعات کمتر در مورد یک مشخصهٔ خاص غیر قابل مشاهده از وی (فرد مطلع) قرارداد میبندد. مثلاً افرادی که با درجهٔ معینی از ریسک از بانکها اعتبار میگیرند در مورد اندازهٔ ریسک و وضعیت خود بیش از بانکها مطلعاند. برای حل این مشکل از روشهایی استفاده میشود که منجر به برابرسازی اطلاعات شوند: علامت دهی و غربال کردن.
علامت دهی
علامت دادن (signaling) اقدامی است که توسط فرد مطلع انجام میشود تا برای فرد کمتر مطلع در مبادله اطلاعات بفرستد تا از این طریق از بروز کژگزینی جلوگیری شود. مانند کارگرانی که در موقع استخدام سعی میکنند تا به کارفرما بفهمانند که دارای توانایی لازم هستند. حتی در مصاحبهٔ استخدام سعی میکنند که با سر و وضع مناسب حاضر شوند، به موقع حاضر شوند، آدامس نجوند و با ارائه مدارک مربوط به آموزشها در مورد سابقه و تجربهٔ خود به کارفرما علامت بدهند تا در کل مشکل کژگزینی رخ ندهد.
غربال کردن
غربال کردن (screening) اقدامیاست که توسط فرد غیر مطلع انجام میشود تا وی به تمام یا بخشی از اطلاعاتی که فرد مطلع دارد دست یابد. مانند خریدار ماشین دست دومی که قبل از خرید چند بار سوار ماشین میشود تا از کیفیت آن مطلع شود. از این طریق طرفهای نامطلع سعی میکنند عدم مزیت اطلاعاتی خود را از طریق غربال کردن و جمعآوری اطلاعات در مورد مشخصات مشاهده نشدهٔ افراد مطلع، از بین ببرند. بنابراین افرادی که اطلاعات کمتری دارند و پس از غربال کردن، اطلاعات بیشتری کسب میکنندچه بسا از امضا قرارداد امتناع کرده یا شرایط آن را تغییر داده و یا مثلاً قیمت را تعدیل کنند.
مخاطرات اخلاقی (کژمنشی)
کژمنشی وقتی اتفاق میافتد که طرفی که اقدامات وی قابل مشاهده نیست احتمال رخداد حوادث را تحت تاثیر قرار دهد یا احتمال پرداخت توسط طرف دیگر را افزایش میدهد. کژمنشی موجب استفادهٔ ناکارا از منابع میشود.
مثال
در قرارداد میان مدیر و کارگزار، مدیر با کارگزاری قرارداد میبندد که اقدامی انجام دهد که به نفع مدیر باشد. اما کارگزار ممکن است در صورت عدم نظارت مستقیم مدیر، این اقدام تعهد نموده را خوب انجام ندهد. و مرتکب کژمنشی شود. مثلاً کارفرما با کارگر قرارداد میبندد که به ازا هر ساعت ارائه خدمات کار، دستمزد معینی به وی بپردازد. کارگر هم متعهد میشود که تلاش خود را حین کار انجام دهد اما وقتی تحت نظارت مستقیم نباشد ممکن است کمکاری کند و تعهد خود را انجام ندهد.
بازیابی اطلاعات
بازیابی اطلاعات (به انگلیسی: Information Retrieval) به فناوری و دانش پیچیدهٔ جستجو و استخراج اطلاعات، دادهها، فرادادهها در انواع گوناگون منابع اطلاعاتی مثل بانک اسناد، مجموعهای از تصاویر، و وب گفته میشود.
با افزایش روزافزون حجم اطلاعات ذخیره شده در منابع قابل دسترس و گوناگون، فرایند بازیابی و استخراج اطلاعات اهمیت ویژهای یافته است. اطلاعات مورد نظر ممکن است شامل هر نوع منبعی مانند متن، تصویر، صوت و ویدئو باشد. بر خلاف پایگاه دادهها، اطلاعات ذخیره شده در منابع اطلاعاتی بزرگ مانند وب و زیرمجموعههای آن مانند شبکههای اجتماعی از ساختار مشخصی پیروی نمیکنند و عموماً دارای معانی تعریف شده و مشخصی نیستند. هدف بازیابی اطلاعات در چنین شرایطی، کمک به کاربر برای یافتن اطلاعات مورد نظر در انبوهی از اطلاعات ساختارنایافته است.
جستجوگرهای گوگل، یاهو و بینگ سه نمونه از پراستفادهترین سیستمهای بازیابی اطلاعات هستند که به کاربران برای بازیابی اطلاعات متنی، تصویری، ویدئویی و غیره کمک میکنند.
«بازیابی اطلاعات» در برخی منابع فارسی به اشتباه به جای ذخیره و بازیابی دادهها که به معنای دانش شناخت رسانههای ذخیرهسازی فیزیکی است، به کار رفته است.
مدلسازی اطلاعات
مدلسازی مفهومی اطلاعات، یکی از فنون تجزیه و تحلیل و تشریح اطلاعات مورد نیاز کاربران سیستم است. در تجزیه و تحلیل اطلاعات باید ذهن خود را بر شناخت مفهومی اطلاعات متمرکز ساخت. در تشریح ماهیت اطلاعات باید از جملات موجز، دقیق و خوانا استفاده کرد. از آنجایی که تشریح اطلاعات، راهنمای طراحی پایگاه اطلاعاتی بشمار میآید باید برای کاربران، برنامه نویسان و سایر متخصصان فنی خوانا باشد. زیرا راهنمای طراحی پایگاه اطلاعاتی بشمار میآید. از آنجایی که هر سیستم کاربران متعددی دارد و آنان نیز از داده و بازدادههای گوناگون استفاده میکنند و همچنین تحلیلگر معمولاً با سیستم آشنا نیست و ضمن تجزیه و تحلیل و تشریح با آن آشنا میشود تشریح اطلاعات برای سیستم دشوار است. تشریح اطلاعات برای پاسخگویی به نیازهای «فرایند سیستم» باید به صورت تفضیلی صورت پذیرد و در عین حال از کلیتی برخوردار باشد که به تشکیل یک پایگاه اطلاعاتی منجر شود و نیازهای کلی سازمان را در بعد اطلاعات برآورده سازد. و چون تا این مرحله به اندازه کافی کار طراحی آسان شده است تحلیلگر باید تشریح اطلاعات را در محدوده زمانی و بودجهای پروژه مکتوب نماید. اکنون این پرسش ممکن است مطرح شودکه چرا «نمودار جریان اطلاعات» شرح کاملی از اطلاعات ارائه نمیدهد؟ پاسخ این است که نمودار جریان اطلاعات تنها چگونگی بکارگیری اطلاعات در فرایندهای سیستم را نشان میدهد و روابط مورد نیاز میان موجودیتهای سازمان را به نمایش نمیگذارد. بدین ترتیب پایگاه اطلاعاتی مبتنی بر یک نمودار جریان اطلاعات نمیتواند از شاخص روانی سازمانی برخوردار باشد. از سوی دیگر، مدل مفهومی اطلاعات، تحلیلگر را تشویق مینماید تا تحلیل اطلاعات را بر مبنای نیازهای سازمان و از دید کاربرای یا نحوه تجسم ذهنی آنان قرار دهد. شرح تفصیلی نیازهای اطلاعاتی سیستم مانند بازدادهها و غیره بعداً به مدل افزوده خواهد شد. از انجایی که مدل مفهومی، اطلاعات را از دید سازمان تشریح میکند نه از دید فرایندهای تفصیلی سیستم بنابراین پایگاه اطلاعاتی حاصل از آن با نیازهای اطلاعاتی سازمان قابلیت انطباق بیشتری خواهد داشت. تشریح اطلاعات با استفاده از مدل مفهومی مستلزم موارد زیر است: ۱- مجموعهای از ساختهها (موجودیت، رابطه، صفت، نشانگر، وابستگی) برای تعریف اطلاعات. ۲- قوانینی برای کنترل چگونگی ترسیم ساختهها در شکل دهی مدل. ۳- روشی برای ساختن مدل مفهومی اطلاعات با استفاده از ساختهها، و قوانین برای نمایش ساختهها، قوانین و روش ساختن مدل مفهومی اطلاعات.
نخستین گام در بازیابی اطلاعات، مدلسازی اطلاعات و توصیف و تعریف ارتباط موجود میان اجزاء منبع اطلاعاتی با نیازهای اطلاعاتی کاربر است. سه مدل مهم در حوزهٔ بازیابی اطلاعات عبارت است از:
مدل دودویی (یا دوگانی): در مدل دودویی (یا دوگانی) هر سند (document) به صورت کیفی پر از کلمات (bag of words) در نظر گرفته میشود.
مدل بُرداری: در مدل بُرداری، هر سند به صورت برداری از کلمات در یک فضای برداری چند بُعدی در نظر گرفته میشود که ابعاد آنرا کلمات تشکیل میدهند. مولفههای این بردار سند، در واقع وزنهایی هستند که نشان میدهند هر یک از کلمات چقدر در متمایز کردن آن سند دخیل هستند.
مدل احتمالاتی: در مدل احتمالاتی، به هر سند احتمالی اختصاص داده میشود که مربوط بودن آن مستند را به نیاز کاربر به صورت احتمال بین صفر و یک بیان میکند.
تعیین میزان ربط هر سند به نیاز اطلاعاتی کاربر
بعد از تعریف مدل، سیستم آمادهٔ دریافت نیاز اطلاعاتی کاربر است. معمولاً کاربران نیاز اطلاعاتی خود را در قالب یک «پُرسه» برای سیستم بیان میکند که معمولاً شامل چندین کلمات یا عبارات است. سیستم سپس بر اساس مدلی که اطلاعات بر اساس آن تعریف شدهاند، میزان ربط هر سند را با پُرسهٔ کاربر محاسبه میکند، و سندهایی را که از همه باربط تر تشخیص داده شدهاند به عنوان نتیجهٔ بازیابی باز میگرداند.
مدل دودویی
در مدل دودویی، نیاز اطلاعاتی کاربر به صورت عبارتی منطقی با عملگرهای AND و OR و NOT بیان میشود و هر سندی که این عبارت در مورد آن صحیح باشد بازیابی میشود. مثلاً اگر نیاز اطلاعاتی به صورت Iran AND Oil بیان شود، تمامی اسنادی که هردو کلمهٔ Iran و Oil را دربردارند به کاربر نمایش داده میشوند. در مدل دودویی سند یا باربط است یا نیست، و هیچ معیاری برای سنجش میزان (درجهٔ) ربط وجود ندارد. مثلاً دو سند را در نظر بگیرید که یکی تماماً دربارهٔ ایران و نفت بحث میکند، و دیگری در مورد اقتصاد جهانی صحبت میکند و فقط از نام ایران و نفت به عنوان مثالی در یک جمله استفاده کرده است. سیستمی که از مدل دودویی استفاده کرده تفاوتی بین این دو سند قائل نخواهد شد. در صورتیکه در واقع سند اول بیشتر به نیاز کاربر مربوط است.
مدل بُرداری
در مدل برداری، برای سنجش میزان ربط اسناد و نیاز اطلاعاتی کاربر، سیستم اسناد موجود و پُرسهٔ کاربر را در فضای چند بعدی مدلسازی میکند. در نتیجه برای سنجش میزان شباهت میان بُردار پُرسه و بردار هر سند میتوان از زاویهای که این دو بردارها با هم میسازند استفاده کرد. اسنادی که بردارشان با بردار پرسهٔ کاربر زاویه کوچکتری میسازد بیشتر با نیاز اطلاعاتی کاربر هم جهت هستند و در نتیجه مرتبطتر خواهند بود. برتری این مدل این است که به سیستم امکان درجهبندی میزان ارتباط اسناد با پرسه را میدهد.
مدل احتمالاتی
این مدل نخستین بار توسط استیو رابرتسن و کارن اسپارک جونز در سالهای ۱۹۷۰ معرفی شد. این مدل به لحاظ اینکه مدارک و پرسشها را به صورت بردار عرضه میکند شبیه مدلبرداری است، اما به جای بازیابی مدارک براساس میزان مشابهت با پرسش، مدارک را براساس احتمال ارتباطشان با پرسش بازیابی میکند. احتمال ربط مدرکی خاص به پرسش را میتوان با جمع اوزان ربط اصطلاحات آن مدرک، یعنی برآورد احتمال ظهور اصطلاحات موجود در پرسش و در مدرک مرتبط، و نه در مدرک غیرمرتبط، محاسبه کرد. در مدل بازیابی کلاسیک احتمالی، این احتمالات اصطلاح از طریق مجموعهای نمونه از مدارک و پرسشها همراه با قضاوت مرتبط مربوط به آن تخمین زده میشود. با وجود این، اجرای فرایند تخمین به صورت عملیاتی مشکل است، زیرا جمعآوری دادههای ربط لازم قبل از جستجوی واقعی عملاً غیرممکن است. در نتیجه، برای تخمین احتمال اصطلاح، معمولاً، در این مدل از بازخورد ربط استفاده میکنند.
در مدل احتمالاتی هم به ازای هر نیاز اطلاعاتی، تمامی اسناد بر اساس احتمال این که با نیاز اطلاعاتی مرتبط باشد مرتب میشوند و لیست اسناد در نهایت به صورت درجهبندی شده (مانند مدل برداری) به کاربر نمایش داده میشود، به نحوی که اولین سندی که کاربر میبیند از همه بیشتر احتمال دارد که به نیاز او ربط داشته باشد.
تفاوت بازیابی داده و بازیابی اطلاعات
بین بازیابی اطلاعات و بازیابی داده تفاوتهای زیادی وجود دارد. دادهها ابهام ندارند، اما اطلاعات نیاز به تفسیر دارد و در نتیجه مبهم میشوند. سیستمی که برای بازیابی داده طراحی شده نیازی به رفع این ابهامها ندارد، اما در سیستم بازیابی اطلاعات باید هر چه بهتر اطلاعات را مدل کرد تا ابهام در درک اطلاعات توسط سیستم کمتر شوند. به همین علت بر خلاف سیستمهای بازیابی داده که در آن کارایی سیستم از نظر سرعت و فضا به عنوان معیار ارزیابی در نظر گرفته میشود، در سیستمهای بازیابی اطلاعات، معیار دقت (precision) و بازخوانی (recall) و معیارهایی شبیه به آنها به عنوان معیارهای اصلی ارزیابی به کار میروند.
معیارهای ارزیابی
معیار دقت: به حاصل تقسیم «تعداد مستندات بازیابی شدهٔ واقعاً باربط» بر «تعداد کل مستندات بازیابی شده» گفته میشود.
معیار صحت: به مقدار دقیق اطلاعات و صحیح که مورد جستجو قرار گرفته است گفته میشود.
پردازش اطلاعات
به مفهوم کلّی، پردازش موازی اطلاعات عبارت است از دریافت دادهها، ایجاد فرایند مقایسه و در نهایت تغییر یا عدم تغییر اطّلاعات موجود به صورتی دیگر. بدین ترتیب، هر آنچه که در جهان رخ میدهد، میتواند به نوعی پردازش اطّلاعات تلقی گردد.
داده کاوی چیست
داده عبارت است از هر شکل، نمودار، عدد، متن، عکس و... که پیام زیادی منتقل نمیکند، و برای استفاده از آن باید آن را پردازش کرد. برای مثال نتایج حاصل از یک آمارگیری، داده در نظر گرفته میشود چراکه اعداد حاصل از آمارگیری اطلاعات چندانی در اختیار قرار نمیدهد و باید آن را پردازش کرد تا شاخصهای آماری و سایر اطلاعات مورد نیاز بتوانند ویژگیهای جامعه را بیان کنند.
بانک اطلاعات
به نتایج پردازش داده، اطلاعات میگویند. کسب اطلاعات در واقع هدف از جمع آوری داده و پردازش آن میباشد تا بتوان با استفاده از آن به نتایج مطلوب دسترسی پیدا کرد. معمولاً اطلاعات برای مخاطب ارزش بسیار بیشتری دارد و میتواند مطالب بیشتری از آن دریافت کند. این تعاریف بطور نسبی مطرح میشوند و ممکن است داده یک سیستم، اطلاعات سیستم دیگر باشد و بالعکس.
نرمافزار سیستم
نرمافزار سیستم به نرمافزاری در رایانه گفته میشود که به کارکرد سیستم رایانه یا کاربردهای سطح پایین (یا Low Level) رایانه مربوط باشد. این نرمافزارها به ساختار فیزیکی سختافزار رایانه وابسته هستند و در نوشتن آنها از زبانهای سطح پائین مانند زبان اسمبلی استفاده میشود. سیستمعامل و درایورها از نرمافزارهای سیستم هستند. از جمله زبان هایی که برای نگارش نرمافزارهای سیستمی استفاده میشود، زبان برنامه نویسی C میباشد. کار کردن با سی برای برنامه نویسان راحت تر است و آنان این زبان را به اسمبلی ترجیح میدهند. اگر برای نگارش نرمافزار سیستمی مشکل محدودیت فضای سختافزاری داشته باشیم بهتر است با زبان اسمبلی کار کنیم که حجم آن پایین تر است. نرمافزارهای سیستمی به سختافزار وابسته اند.
در برابر نرمافزار سیستم، نرمافزار کاربردی قرار دارد که برای کاربردهای سطح بالا و غیرسیستمی رایانه است و معمولاً به زبانهای سطح بالا نوشته میشود که از جزئیات سختافزاری سیستم مستقل است.
نرمافزار کاربردی
نرمافزار کاربردی (به انگلیسی: Application software) عبارت است از نرمافزاری که با استفادهٔ مستقیم از منابع و قابلیتهای رایانه کاری را مستقیماً برای کاربر انجام میدهد. باید توجه داشت که این عبارت در مقابل عبارت نرمافزار سیستمی معنی پیدا میکند.
نرمافزار سیستمی در مقابل در پسزمینه عمل میکند و خدماتی را فراهم میکند که دیگر نرمافزارها و یا سیستمعامل میتوانند برای انجام کارهای خود از آن استفاده کنند. اما در عوض معمولاً مستقیماً با کاربر عادی در تماس نیست و خدماتی را به او ارایه نمیدهد.
در عمل بیشتر نرمافزارهایی که کاربران با آنها سر و کار دارند از این دسته محسوب میشوند. برای مثال میتوان به نرمافزارهای رومیزی یعنی واژهپردازها، صفحه گستردهها، نرمافزارهای طراحی گرافیکی، بازیهای رایانهای و امثال آنها اشاره کرد.
بسیاری نرمافزارهای کاربردی، برای توسعهدهندگان ابزار رابط برنامهنویسی کاربردی هم فراهم میکنند تا بتوان از قابلیتهای نرمافزار در نرمافزارهای جدید استفاده کرد. برای مثال نرمافزار ادوبی آکروبات هنگام نصب ایپیآی فراهم میکند که برنامهنویس میتواند با استفاده از آن تواناییهای آکروبات را در برنامهٔ خود به کار گیرد.
برای عنوان نمونههای دیگر میتوان به نرمافزارهای پردازش متن، برگههای گسترده (صفحات گسترده) و نرمافزارهای پخش نوا و نما اشاره کرد.
سختافزار رایانه
سختافزار رایانه مجموعهای از اجزای فیزیکی است که میتوان آنها را لمس کرد (مشاهده کرد) و یک رایانه را تشکیل میدهند مانند صفحه نمایش، صفحه کلید، حافظههای رایانه، دیسک سخت، ماوس، چاپگرها، سیپییو، کارت گرافیک، کارت صدا، حافظه، مادربورد و چیپها. در مقابل آن نرمافزار قابل لمس نیست. نرمافزار مجموعهای از ایدهها، مفاهیم و نمادها است. ترکیب سختافزار و نرمافزار یک سیستم محاسباتی قابل استفاده را تشکیل میدهند.
تعریف صنعتی
سختافزار بخش مادی، قابل لمس و ابزاری هر مجموعه یا سیستم است. سختافزار معمولاً به قطعات و یراقآلات فلزی و پلاستیکی تشکیل دهنده مجموعه گفته میشود. لازم به توضیح است که برق نیز جزو سختافزار حساب میشود.
تعریف رایانه
در دانش رایانه به مجموع مدارهای الکترونیکی، اجزای فیزیکی و مکانیکی قابل لمس و مشاهده در یک رایانه سختافزار میگوییم. همچنین به بخش غیرقابل لمس مانند سیستمعامل و برنامههای رایانهای، نرمافزار اطلاق میگردد.
فهرست سختافزارها
مادربورد (بُردِ مادر یا برد اصلی)
نمایشگر (مانیتور)
جعبه رایانه (کیس)
صفحهکلید (کیبورد)
موشواره (ماوس)
چاپگر (پرینتِر)
پویشگر (اسکنر)
واحد پردازش مرکزی (سیپییو یا پردازنده)
فلاپیدیسک
دیسک سخت
مودم
دیسکگردان نوری (درایو نوری) (CD و DVD)
بلندگو
یواسبی (همهگذر)
کارت صدا
کارت گرافیک
قلم نوری
هدفون (دوگوشی)
کارت تلویزیون و رادیو
وببین (وبکم)
میکروفون
هدست.
نرمافزار سیستم به نرمافزاری در رایانه گفته میشود که به کارکرد سیستم رایانه یا کاربردهای سطح پایین (یا Low Level) رایانه مربوط باشد. این نرمافزارها به ساختار فیزیکی سختافزار رایانه وابسته هستند و در نوشتن آنها از زبانهای سطح پائین مانند زبان اسمبلی استفاده میشود. سیستمعامل و درایورها از نرمافزارهای سیستم هستند. از جمله زبان هایی که برای نگارش نرمافزارهای سیستمی استفاده میشود، زبان برنامه نویسی C میباشد. کار کردن با سی برای برنامه نویسان راحت تر است و آنان این زبان را به اسمبلی ترجیح میدهند. اگر برای نگارش نرمافزار سیستمی مشکل محدودیت فضای سختافزاری داشته باشیم بهتر است با زبان اسمبلی کار کنیم که حجم آن پایین تر است. نرمافزارهای سیستمی به سختافزار وابسته اند.
در برابر نرمافزار سیستم، نرمافزار کاربردی قرار دارد که برای کاربردهای سطح بالا و غیرسیستمی رایانه است و معمولاً به زبانهای سطح بالا نوشته میشود که از جزئیات سختافزاری سیستم مستقل است.
نرمافزار کاربردی
نرمافزار کاربردی (به انگلیسی: Application software) عبارت است از نرمافزاری که با استفادهٔ مستقیم از منابع و قابلیتهای رایانه کاری را مستقیماً برای کاربر انجام میدهد. باید توجه داشت که این عبارت در مقابل عبارت نرمافزار سیستمی معنی پیدا میکند.
نرمافزار سیستمی در مقابل در پسزمینه عمل میکند و خدماتی را فراهم میکند که دیگر نرمافزارها و یا سیستمعامل میتوانند برای انجام کارهای خود از آن استفاده کنند. اما در عوض معمولاً مستقیماً با کاربر عادی در تماس نیست و خدماتی را به او ارایه نمیدهد.
در عمل بیشتر نرمافزارهایی که کاربران با آنها سر و کار دارند از این دسته محسوب میشوند. برای مثال میتوان به نرمافزارهای رومیزی یعنی واژهپردازها، صفحه گستردهها، نرمافزارهای طراحی گرافیکی، بازیهای رایانهای و امثال آنها اشاره کرد.
بسیاری نرمافزارهای کاربردی، برای توسعهدهندگان ابزار رابط برنامهنویسی کاربردی هم فراهم میکنند تا بتوان از قابلیتهای نرمافزار در نرمافزارهای جدید استفاده کرد. برای مثال نرمافزار ادوبی آکروبات هنگام نصب ایپیآی فراهم میکند که برنامهنویس میتواند با استفاده از آن تواناییهای آکروبات را در برنامهٔ خود به کار گیرد.
برای عنوان نمونههای دیگر میتوان به نرمافزارهای پردازش متن، برگههای گسترده (صفحات گسترده) و نرمافزارهای پخش نوا و نما اشاره کرد.
سختافزار رایانه
سختافزار رایانه مجموعهای از اجزای فیزیکی است که میتوان آنها را لمس کرد (مشاهده کرد) و یک رایانه را تشکیل میدهند مانند صفحه نمایش، صفحه کلید، حافظههای رایانه، دیسک سخت، ماوس، چاپگرها، سیپییو، کارت گرافیک، کارت صدا، حافظه، مادربورد و چیپها. در مقابل آن نرمافزار قابل لمس نیست. نرمافزار مجموعهای از ایدهها، مفاهیم و نمادها است. ترکیب سختافزار و نرمافزار یک سیستم محاسباتی قابل استفاده را تشکیل میدهند.
تعریف صنعتی
سختافزار بخش مادی، قابل لمس و ابزاری هر مجموعه یا سیستم است. سختافزار معمولاً به قطعات و یراقآلات فلزی و پلاستیکی تشکیل دهنده مجموعه گفته میشود. لازم به توضیح است که برق نیز جزو سختافزار حساب میشود.
تعریف رایانه
در دانش رایانه به مجموع مدارهای الکترونیکی، اجزای فیزیکی و مکانیکی قابل لمس و مشاهده در یک رایانه سختافزار میگوییم. همچنین به بخش غیرقابل لمس مانند سیستمعامل و برنامههای رایانهای، نرمافزار اطلاق میگردد.
فهرست سختافزارها
مادربورد (بُردِ مادر یا برد اصلی)
نمایشگر (مانیتور)
جعبه رایانه (کیس)
صفحهکلید (کیبورد)
موشواره (ماوس)
چاپگر (پرینتِر)
پویشگر (اسکنر)
واحد پردازش مرکزی (سیپییو یا پردازنده)
فلاپیدیسک
دیسک سخت
مودم
دیسکگردان نوری (درایو نوری) (CD و DVD)
بلندگو
یواسبی (همهگذر)
کارت صدا
کارت گرافیک
قلم نوری
هدفون (دوگوشی)
کارت تلویزیون و رادیو
وببین (وبکم)
میکروفون
هدست.