پروژه : بررسي و تحليل موتورهاي جستجو (Search Engine)
فرمت : word
تعداد صفحه : 102
قیمت : مبلغ ۱۱هزار تومان
مقدمه :
در طي سالهاي اخير تعداد ميزباناني كه به اينترننت پيوستند بسيار افزايش يافته است، و به تبع آن حجم اطلاعات موجود در آن نيز به شدت فزوني گرفت و كار جستجوي بهينه را هم براي كتابداران و هم براي كاربران مشكل نموده است. از طرف ديگر برخي پژوهشهاي انجام شده، نشان از كارائي اطلاعات موجود در شبكه در پاسخگوئي به سوالات مرجع دارد (روس و نيلسون، 2000). موتورهاي جستجوي عمومي در ميان انواع ابزارهاي جستجوي موجود در اينترنت شناخته شدهتر هستند و به طور معمول جستجو در هر زمينه از طريق اين موتورها شروع ميشود، به گونهاي كه تا 85 درصد كل جستجوهاي كه در شبكه انجام ميشود از طريق موتورهاي جستجو است (اردلان، 1380).
از طرف ديگر نمايه اين موتورها با هم متفاوت ميباشند، و تمام مدارك موجود در شبكه در نمايه يك موتور موجود نميباشد (اسميت، 2001) همچنين مداركي كه از طريق يك موتور جستجو يافت ميشود، ممكن است توسط موتور ديگر بدست نيايد، و كاربران به طور معمول به اين نكته توجهي نكرده و جستجو در يك موتور را چه مثبت و چه منفي به منزله پايان كار ميدانند. با توجه به پوشش متنوع موضوعي در نمايه موتورهاي جستجو و تحقيقاتي كه تا حال بر روي موتورهاي جستجو در مورد توانائي پاسخگوئي آنها به سوالات مرجع و موضوعي انجام شده است، ميتوان انتظار داشت كه اين موتورها توانائي پاسخگوئي به سوالات مرجع را داشته باشند.
رشد اينترنت بسيار سريع بوده است، و اين رشد در حال ادامه است. اندازه واقعي اين شبكه به دليل همين رشد سريع روشن نيست (ويلموت، 2000) تخمين زده ميشود و اندازه شبكه هر 12 تا 15 ماه دو برابر گردد (يي، 1998، ص 28)، در ابتداي سال 1990 تعداد 000/500 جايگاه در شبكه موجود بود (جين، 1997، ص 329)، اين رقم در ابتداي سال 2001 به رقم 000/000/109 رسيد. از آنجا كه هر جايگاهي ميتواند ميزبان بسياري از صفحات شبكهاي باشد، اين خود ميتواند نشان از تعداد بسيار بيشتري از صفحات شبكهاي باشد. علاوه بر اين امكانات و كارائيهاي جديد نيز با سرعت به اين رسانه افزوده ميشود.
امروزه جستجوي اطلاعات از طريق اينترنت بسيار رايج شده است و حتي ابزاري ضروري براي جمعآوري اطلاعات گرديده است. در كشوري مانند ايران نيز اين رونق به سرعت رو به رشد ميباشد. بدون شك اين شبكه راحتي و آسايش بسياري را براي جويندگان اطلاعات و همچنين پژوهشگران فراهم آورده است، و مفاهيم جديد كتابخانهاي از جمله خدمات معروف به 24/7 كه عبارت از خدمات رساني 24 ساعته در 7 روز هفته ميباشد را پديد آورده است، اما اين درياي اطلاعات از همان ابتداي پيدايش نظم خاصي نداشته است (چو و روزنتال، 1996). اين شبكه فاقد مسئول و كنترل كيفيت است (كيرك، 1996) اگرچه سعي ميشود در زمينههاي مختلف براي آن استانداردهائي تهيه گردد (استانز، 2000، ص 8) و از آنجا كه حدود نيمي از 200 ميليون كاربران اينترنت ساكن آمريكاي شمالي هستند (بامت، 1999) و 90% منابع شبكه نيز به زبان انگليسي ميباشد (مان و استوارت، 2000)، فرهنگ كشورهاي آمريكاي شمالي و اروپا بر آن غلبه دارد (كوهلر، 1999).
منابع عظيم اطلاعاتي در شبكه گاه شامل موادي زننده، غيرقانوني يا تحريك كننده هستند. و از آنجا كه شبكه بازبيني نميشود، گروههاي سياسي افراطي و هرزه نگاران به راحتي قابل دسترسي هستند، (مان و استوارت، 2000). ممانعت استفاده از منابع مخرب اخلاق و فرهنگ در شبكه اينترنت امروزه از علايق مهم بخشهاي تحقيقاتي و تجاري است (كوباياشي و تاكدا، 2000؛ آن و كن، 2001). شبكه همچنين به دليل عدم وجود استاندارد صحت و درستي منابع (گودمن، 1998) و اصطلاحات و واژگان (باركر، 2000) راهي است به دادهها و اطلاعات نامطمئن و اشتباه، به گونهاي كه چگونگي ارزشيابي (آليسون، 1999؛ بيا، 2000؛ ريد، 2002) و دسترسي به اطلاعات معتبر يكي از پر بحثترين موضوعات در رابطه با شبكه بوده است (باربلز، 2001) بر همين اساس جستجو و يافتن اطلاعات مفيد در آن اغلب وقت گير و سخت است (دربنستون، 2001) و حتي كتابداران نيز از اوايل كار اين شبكه از اين مسئله لب به شكايت گشوده و يافتن اطلاعات در اينترنت را به مثابه يافتن سوزن در كاهدان ذكر كردهاند (گرمن، 1994). براي حل اين مشكل شركتهاي بسياري از سراسر جهان، ولي عمدتا از آمريكا و كشورهاي اروپاي غربي ابزارهاي جستجو را با هدف جستجوي بهينه طراحي كردهاند (چو و روزنتال، 1996). كه برخي عمومي و برخي نيز ابزارهاي تخصصي براي جستجو در رشتهاي خاص ميباشند.
در يك تقسيم بندي ابزارهاي جستجوي موجود در شبكه را به دو دسته كلي تقسيم ميكنند (ديويس، 1996) كه عبارتند از موتور جستجو و راهنماي موضوعي. تفاوت اصلي موتورهاي جستجو و راهنماهاي موضوعي فراهم آوري دستي راهنماها ميباشد. راهنماها توسط متخصصان موضوعي جمع آوري و نگهداري ميشوند، و به همين دليل منابع بسيار كمتري در مقايسه با موتورهاي جستجو كه توسط نرم افزارهايي با نام روبوت (robot) يا اسپايدر (spider) كه عناصري غيرانساني هستند، تهيه ميشوند (اكرمن، هارتمن، 2000) در خود جاي دادهاند. علاوه بر اين راهنماها از خود نمايه مستقلي ندارند و فقط از طريق فراپيوند به جايگاه وي ا مدرك موردنظر وصل ميشوند، به همين علت گاه برخي از اين فراپيوندها به منابعي كه ديگر موجود نيستند ختم ميشوند، در مقابل موتورهاي جستجو از خود نمايه مستقل دارند و منابعي را كه در بعد از جستجو بازيابي ميكنند در خود دارند و از اين ديدگاه بر راهنماها برتري دارند.
موتورهاي جستجو در خود تقسيماتي دارند و به دو دسته موتورهاي نسل اول و نسل دوم تقسيم ميشوند، منظور از نسل اول آن دسته از موتورهاي است كه به مدت نسبتاً كوتاهي از پيدايش شبكه جهاني بوجود آمدند، عمدهترين اين موتورها عبارتند از: Lycos، InfoSeek، Fastsearch ، Excite، Vista، Alta و HotBot و موتورهاي نسل دوم، آنهايي هستند كه به فاصله نسبتاً دوري از پيدايش شبكه جهاني به وجود آمدند و معروفترين آنها عبارتند از: DirectHit، Ask Jeeves، Google و NorthernLight. از طرف ديگر برخي پژوهشهاي انجام شده، نشان از كارائي اطلاعات موجود در شبكه به پاسخگوئي به سوالات مرجع دارد (روس و نيلسون، 2000). و همچنين برخي از تحقيقات اخير نشان ميدهد كه درصد بالايي از كتابخانهها در كشورهاي پيشرفته خدمات مرجع خود را از طريق شبكه هم ارائه ميدهند (عليجاني، 1308؛ روس و نيلسون، 2000؛ هلفر، 2001) تا آنجا كه اين درصد براي كتابخانههاي دانشگاهي در كشوري مانند آمريكا به 99 درصد بالغ ميشود. ميزان استفاده به سرعت رو به افزايش است، بطوري كه تنوپير تعداد كتابخانههاي دانشگاهي آمريكا را كه از خدمات مرجع اينترنتي استفاده نميكنند تنها 1 درصد ميداند (تنوپير، 2001). پژوهشي اخير نشان ميدهد كه 80 درصد از دانشجويان و اعضا هيئت علمي دانشگاههاي آمريكا به جاي رفتن به كتابخانه سعي ميكنند از طريق شبكه نيازهاي علمي خود را رفع كنند (آلبانز و اودر، 2002) و الگوهايي براي ارائه اطلاعات مرجع از طريق شبكه طراحي شده (استمپل و باتلر، 2001) و در برخي از كتابخانهها بكار گرفته شدهاند.
روبرو شدن با اين همه ابزار موجب سردرگمي ميگردد. براي بسياري از جستجوگران اينترنت موتورهاي جستجو فقط يك تسكين موقت هستند، چرا كه اغلب نتايج بازيابي شده دريايي از اطلاعات است كه راه را به توده عظيمي از اطلاعات (پولوك و هاكلي، 1997) مربوط يا نامربوط (آميتاي، 2001) ميگشايند. اين جستجوگران به زودي در مييابند كه اين موتورها به هر حال كامل نيستند و فقط قسمت كوچكي از منابع موجود را پوشش ميدهند (كونل و پيپل، 1999؛ تلوال، 2001). اگرچه مدارك بازيابي شده براساس ميزان ربط مرتب ميشوند، ولي كاربران همچنان دست به گريبان ريزش كاذب، نتايج تكراري و تعداد فراوان مواد بازيابي شده هستند (يي، 1998) با توجه به ابزارهاي كم استفادهتر موجود در شبكه نظير، ورونيكا، آرچي و گوفر كه قدرت جستجوي بسيار محدودتري داشتند، موتورهاي كنوني از توانائيهاي بالائي برخوردارند، بگونهاي كه 85 درصد از كاربران شبكه چگونگي دسترسي خود به منابع موردنظر را از طريق جستجو و يا ابزارهاي جستجو ذكر ميكنند (اردلان، 1380؛ بارنت، 1999؛ كوباياشي، تاكدا، 2000)/ اما ابزارها چنان متفاوت هستند كه انتخاب ابزار درست، يك وظيفه به نظر ميرسد.
بر همين اساس، اين پژوهش تلاش ميكند تا موثر بودن موتورهاي جستجو در پاسخگوئي به سوالات مرجع عمومي را مورد بررسي قرار دهد. همچنين نتايج این بررسي به ما كمك خواهد كرد تا نقاط قوت و ضعف اين موتورها را بهتر درك كنيم و موتورهاي جستجوي مناسبي را انتخاب كنيم كه بهتر و سريعتر جوابگوي نيازهاي اطلاعاتي باشند.
فهرست موضوعات :
-
مقدمه:
-
معرفی پژوهش
-
-
فصل اول:
-
بیان مسئله
-
چهارچوب نظری تحقیق
-
اهمیت تحقیق
-
اهداف تحقیق
-
فصل دوم:
-
پیشینه تحقیق: مطالعات انجام شده
-
فصل سوم:
-
روش شناسی تحقیق
-
سئوالات پژوهش.
-
تعاریف عملیاتی
-
روش تحقیق
-
جامعه آماری تحقیق
-
روش گردآوری داده ها
-
روش تجزیه و تحلیل داده ها
-
فصل چهارم
-
یافته های پژوهشی و تجزیه و تحلیل
-
مقایسه موتورهای جستجو از نظر دقت بازیافت
-
مقایسه موتورهای جستجو از نظر ریزش کاذب
-
مقایسه موتورهای جستجو از نظر بازیابی پیوندهای مرده
-
مقایسه موتورهای جستجو از نظر بازیابی صفحات
-
مقایسه موتورهای جستجو از نظر بازیابی اقلام غیر انگلیسی
-
مقایسه موتورهای جستجو از نظر بازیابی اقلام نامربوط محتوایی
-
مقایسه موتورهای جستجو از نظر بازیابی اقلام مربوطه
-
فصل پنجم
-
بحث
-
نتیجه گیری
-
پیشنهادهای پژوهش
-
پیشنهاد برای پژوهشهای آینده
-
فصل ششم
-
مقایسه کارایی موتورهای جستجو
-
-
فصل هفتم
-
جستجوی اطلاعات فارسی در اینترنت
-
خط فارسی
-
نقایص عمومی خطوط
-
نقایص معمول خط فارسی
-
زبان و خط فارسی در اینترنت
-
نکات کلیدی جستجو به زبان فارسی
-
فصل هشتم
-
استاندارد یونی کُد و نویسه های فارسی
-
فصل نهم
-
وب نامرئی و بازیابی اطلاعات
-
بخش های وب نامرئی
-
منابع موجود در وب نامرئی
-
اهمیت وب نامرئی
-
دلایل عدم بازیابی و نمایه سازی وب نامرئی توسط موتورهای جستجو
-
شیوه های اطلاع یابی در وب نامرئی
-
فصل دهم
-
چالش های موجود در مسیر کارایی موتورهای جستجو
***************************************************************************************
در صورت تمایل
به دریافت فایل فوق در مدت 10 دقیقه ، لطفاً اینجا کلیک
کنید
***************************************************************************************
مشاوره ؛نگارش پایان نامه ؛ مقاله + شبیه سازی
در تمام مقاطع دانشگاهی پذیرفته می شود
در صورت
تمایل می توانید عنوان و جزئیات پروژه خود را در قسمت نظرات این پست
اعلام فرمایید. ضمنا می توانید اطلاعات درخواستی خود را به ایمیل یا تلگرام
نمایید
ایمیل :
com.dr@yahoo.com
درباره :
بررسي و تحليل موتورهاي جستجو (Search Engine) ,
|