محركات البحث على الانترنت
ملخص
دراسة عامة حول محركات البحث على الانترنت، تتناول سبعة نقاط رئيسية: الفرق بين محركات البحث والأدلة، مكونات محركات البحث على شبكة الإنترنت وكيفية عملها، نسبة المواقع التي تغطيها محركات البحث من مجموع مواقع الشبكة، فهرسة محركات البحث لمواقع الشبكة، الوقت اللازم لظهور صفحات الويب الجديدة في محركات البحث، آليات البحث في محركات البحث، وأخيرا أنواع محركات البحث.
المقدمة:
محركات البحثSearch Engine هي أدوات شائعة الاستخدام إلى الوصول إلى صفحات النسيج الشبكي العالمي world wide web لكنها تعود بمئات النتائج والوصلات التي تكون في الغالب غير ذات صلة بموضوع البحث الرئيسي مما يجعل الباحث في حيرة ويأس من وجود ما يبحث عنه، فإن استخدام أدوات البحث المتوفرة على الإنترنت بدون إستراتيجية بحث محددة تشبه إلى حد كبير من يسير في مكتبة ضخمة بشكل عشوائي يحاول العثور على كتاب معين وسوف يناقش هذا البحث النقاط التالية:
أولا: الفرق بين محركات البحث والأدلة .
ثانيا: مكونات محركات البحث على شبكة الإنترنت
وكيفية عملها.
ثالثا: نسبة المواقع التي تغطيها محركات البحث من
مجموع مواقع الشبكة.
رابعا: فهرسة محركات البحث لمواقع الشبكة.
خامسا: الوقت اللازم لظهور صفحات الويب الجديدة في
محركات البحث.
سادسا: آليات
البحث في محركات البحث.
سابعا: أنواع محركات البحث.
أولا : الفرق بين محركات البحث والأدلة [1]
يسخر مستخدمو الإنترنت أدوات البحث المختلفة على الوب للوصول إلى المعلومات المفيدة الموزعة على ملايين الأجهزة الخادمة على الإنترنت، وهذه الأدوات هي محركات البحث search engine والأدلة directories التي تساعد في تسريع عملية البحث بدرجة كبيرة، وفي هذا السياق لابد تقديم تعريف مبسط لهاتين الأداتين قبل أن دخل في تفاصيل محركات البحث.
محركات البحث Search Engines
بأبسط صورة للتعريف هي عبارة عن قواعد بيانات ضخمة بعناوين ومواقع،
ومع وصف مختصر لصفحات الإنترنت المختلفة، والتي بواسطتها
- أي محركات البحث - يمكن البحث عن موضوع معين في حقل من الحقول المختلفة في
الشبكة بشكل دائم بغرض إيجاد دليل معين لمثل هذه الصفحات، ولأنها تعمل بشكل آلي
وتقوم بفرز وفهرسة كم هائل من الصفحات ، فسيلاحظ كل شخص يستخدم هذه المحركات على أنها تحتوي على كثير من
المعلومات غير المتوفرة في الأدلة directories وقد يمثل ذلك جانب
إيجابي يجعل من محركات البحث أداة فعالة أكثر من الأدلة [8]
الأدلة Directories
ويذكر أحمد عبد القادر الخالد: " الأدلة لا تعمل بشكل آلي بل تتم إدارتها من قبل أشخاص متخصصين، وما يحدث هو أن العديد من المواقع يتم تسليمها إلى دليل ما، ومن ثم يتم فرزها وتبويبها تحت تصنيف معين، ولأن هذه الآله يتم إدارتها بشكل بشري فإنها قادرة دوما على توفير معلومات أكثر دقة وموقع yahoo المشهور ما هو إلا مثال واحد لهذه الأدلة". [2]
وتقدم الأدلة للمستخدم طريقة سريعة للبدء بعمليات البحث عن المعلومات بواسطة تفحص المواضيع المصنفة التي يعرضها ، إذ يندرج تحت كل موضوع لائحة من المواضيع الفرعية فيمكن للمستخدم أن يتفحصها تباعا إلى أن يصل إلى المعلومات المطلوبة، وفي حال عدم وجود المعلومات تحت الموضوع الذي اختاره المستخدم، يتراجع ويختار موضوعا رئيسيا آخر ليقوم بالبحث في تفرعاته من جديد، وهكذا...
وفي هذا السياق لابد من توضيح من أن هناك العديد من أدلة البحث تعمل أيضا كمحركات منها : yahoo – altavista – excite
ثانيا : مكونات محركات البحث وكيفية عملها [7] [11]
يوجد على شبكة الإنترنت كميات ضخمة من المعلومات تتوزع على شكل صفحات وتنمو بشكل سريع [ في عام 1996 بلغ معدل النمو 400 % ]، و في أوائل 1998 كان هناك ما يتعدد بـ 300 مليون صفحة متوفرة على النسيج، وفي أواخر اعم 2000 قدر عدد الصفحات بأكثر من مليار صفحة، وفي أوائل 2002قدر بحوالي مليار ونصف صفحة، ويقدر عدد الصفحات التي تضاف أو تحدث يوميا بمليون ومائتين صفحة، وهذا يدل على معدل نمو الإنترنت الذي يتضاعف بكل سنوي.
هناك أكثر من 2500 أداة بحث متوفرة ويقدر تغطية تلك الأدوات للإنترنت بـ 5 % للأدوات الصغيرة و 15 % لتلك العملاقة، ومن هنا نعلم أنه مهما كان سمعة أداة البحث فإنها لا يمكن أن تغطي كافة المعلومات المتوفرة على الشبكة، وتظهر محركات البحث نتائج مختلفة، لأن كل منها يبحث في قاعدة بياناته الخاصة به، التي تتضمن جزء من مواقع الويب.
ويتألف محرك البحث من ثلاثة أجزاء رئيسية هي:
1. برنامج العنكبوت Spider Program
2. برنامج المفهرس Program Indexer
3. برنامج محرك البحث
1. برنامج العنكبوت
تستخدم محركات البحث برنامج العنكبوت لإيجاد صفحات جديدة على الوب لإضافتها، ويسمى هذا البرنامج أيضا الزائر لأنه يبحر في الإنترنت بهدوء، لزيارة صفحات الويب والإطلاع على محتويتها، ويأخذ هذا البرنامج مؤشرات المواقع من عنوان الصفحة Page Title والكلمات المفتاحية Keywords التي تحتويها ، إضافة إلى محتويات محددات الميتا Meta Tags فيها.
ولا تقتصر زيارة برنامج العنكبوت على صفحات الموقع، بل يتابع البرنامج تعقب الروابط [ links] الموجودة فيها لزيارة صفحات أخرى. أما الغاية من هذه الزيارات فهي وضع النصوص المتاحة على تلك المواقع على فهارس محرك البحث ليتمكن المحرك من العودة إليها فيما بعد، ولم تغب فكرة تغيير المحتوى في الموقع عن بال مصممي محرك البحث، إذ يقوم محرك البحث بزيارات دورية للمواقع الموجودة في الفهارس للتأكد من التعديلات التي تصيب المواقع المفهرسة.
2. برنامج المفهرس
يمثل برنامج المفهرس index program ،ويطلق عليه أحيانا الكتالوج catalogue ، قاعدة بيانات ضخمة تقوم بتوصيف صفحات الويب ويركز التوصيف على المعلومات التي حصلت عليها من برنامج العنكبوت spider كما تعتمد على بعض المعايير مثل الكلمات الأكثر تكرارا من غيرها، وتختلف محركات البحث عن بعضها في هذه المعايير، إضافة إلى اختلافها في خوارزميات البحث searching algorithms
3. برنامج محرك البحث
يبدأ دور برنامج محرك البحث program search engine عند كتابة كلمة مفتاحية في مربع البحث box search إذ يأخذ هذا البرنامج الكلمة المفتاحية ويبحث عن صفحات الويب التي تحقق الاستعلام، الذي كونه برنامج المفهرس في قاعدة بيانات الفهرس، ثم يعرض نتيجة البحث المتمثلة بصفحات الويب التي طلبها المستخدم في نافذة المستعرض browser window ويقوم أيضا بعملية الترتيب لهذه الصفحات
وتختلف محركات البحث عن بعضها في أسلوب العمل، فمثلا: تحتفظ قاعدة بيانات altavista بكل تفاصيل صفحة الويب المخزنة عليها، أما محركات البحث الأخرى فقد تحتفظ بالعناوين الرئيسية للصفحة فقط ، مما يؤدي إلى اختلاف شكل ودقة نتائج البحث الظاهر للمستخدم.
ثالثا : نسبة المواقع التي تغطيها محركات البحث من مجموع مواقع الشبكة [3]
أكدت دراسة أجراها معهد NEC للبحوث الواقع في مدينة برينيتون في ولاية نيوجرسي الأمريكية عام 1999، على 11 محرك بحث مستخدمة في الإنترنت، إن هذه المحركات لم تتمكن من التأقلم مع النمو الكبير لمواقع الويب، وبينت الدراسة أن محركات البحث لا تغطي سوى قسم ضئيل من صفحات الويب، وان إدراج الصفحات الجديدة بينها يستغرق وقتا طويلا. ووجدت الدراسة أن محرك البحث northern light هو أكثر المحركات شمولا لكنه على الرغم من ذلك لا يغطي سوى 1/6 من صفحات الإنترنت التي يمكن أن تصل الإنترنت إليها، ويذكر أن هذه النسبة قبل 18 شهر كانت تصل إلى 1/3 من صفحات الإنترنت. ويقول ستيف لورانس وسي لي جاليز، المتخصصان في علوم الكمبيوتر في معهد NEC والقائمين بهذه الدراسة، " أنه من المحتمل أن يكون تأخر إدراج الصفحات الجديدة ضمن محركات البحث أمرا مقصودا، إذا تمتلئ قواعد البيانات التابعة لمحركات البحث هذه وأصبحت عملية إضافة موقع جديد إليها عملية مكلفة، خاصة إن هذه الإضافة لا تزيد في معظم الأحوال من الأرباح الإعلانية" .
رابعا : فهرسة محركات البحث للمواقع [4]
ومن خلال العرض السابق لمكونات محركات البحث، تبين أن برنامج العنكبوت أو عنكبوت الشبكة " web spider وبرنامج المفهرس cataloger هما المسئولان عن إيجاد صفحات الويب الجديدة وفهرستها وإدخالها داخل قاعدة بيانات المحرك ولكن كيف ؟
تستخدم واصفات <META> الخاصة بكلاً من وصف الموقع والكلمات المفتاحية في صفحة HTML ، حتى تضمن إدراج المواقع بشكل سليم في محركات البحث، ووضع وصف واضح له فيها، ولا يؤدي استخدام واصفة <META> بعكس كثير من واصفات HTML إلى ظهور أي عنصر مرئي على صفحة الويب، لكن عمل هذه الواصفة يتم في الكواليس، حيث تقدم وصفاً ن المعلومات التي تتضمنها الصفحة إلى المتصفحات وعناكب الشبكة ومحررات HTML .
إذا الوظيفة الأساسية هي وصف الصفحة وكلمات المفتاح فيها وتقديمها لمحركات البحث. عندما يزور عنكبوت الشبكة صفحة لا تحتوي على وصف لها باستخدام واصفة <META> فإنه يسجل الأسطر القليلة الأولى من النص الموجود في بداية الصفحة ويعتبر ذلك وصفا لها ، ولا يعطي هذا الأسلوب غالبا وصفاً دقيقاً للصفحة. وأحد الأسباب الرئيسية لذلك "وجود ملف صورة في بدايتها"، إذ لا يتعرف عنكبوت الشبكة إلا على النصوص، ولا يستطيع قراءة الملفات الرسومية، التي تتضمن نصوص على هيئة صور، وهذا يوضح استخدام واصفات <META> وخاصة عندما تحتوي الصفحة على كثير من الصور.
خامسا : الوقت اللازم لظهور صفحات الويب الجديدة في محركات البحث.
من خلال بحث أجرته مجلة الطبيعة الأمريكية في عدد يوليو من عام 1999 والتي أوضحت أن المتوسط العمري لظهور الموقع في محركات البحث هو 57 يوم تقريبا. [9]
كما أوضحت الدراسة أن الوقت اللازم لتحديث قاعدة بيانات كل محرك بحث هي نفس المعدلات السابقة، حيث لا بد أن يتم تحديث قواعد بيانات محركات البحث لملاحقة التغيرات أو التعديلات على المواقع الموجودة داخل قاعدة البيانات وكذلك الحصول على مزيد من المواقع الجديدة على الويب.
سادساً : آليات البحث في محركات البحث
ذكرنا سابقا أن محركات البحث تستخدم في بحثها عن مواقع الويب ما يدعى الكلمات المفتاحية Keywords التي يمكن أن تكون عبارة، وتستخدم آليات البحث عادة بعض المعاملات Operators مع هذه الكلمات المفتاحية، لتوفير خيارات إضافية لعملية البحث، وهناك طريقتين للبحث في محركات البحث هما:
البحث البسيط SIMPLE SEARCH
وهذا النوع من أنواع البحث يقوم به معظم الناس وخاصة المبتدئين مع استخدام الإنترنت وهم من يجهلون تقنيات البحث المتقدم. وهو يكون عن طريق وضع كلمة بدون أي علامات أو شارات ثم البحث عنها ولكننا سنجد النتيجة العديد من النتائج العلائقية والروابط المتينة.
البحث المتقدم ADVANCED SEARCH
تزيد خصائص البحث المتقدمة التي يوفرها الكثير من محركات البحث إمكان العثور على المعلومات، كما إنها طريقة فعالة للبحث عن معلومات محددة إذ تتيح للمستخدمين إمكان البحث عن عدة كلمات مفتاحية معاً.
سابعا : أنواع محركات البحث [10]
يمكن القول أنه قد ولى الزمان الذي كان يمكن فيه الاكتفاء بموقع بحث واحد ليلبي مختلف احتياجاتك في البحث بالشبكة، فمع التنامي المطرد للإنترنت جرى نوع من التخصص في وظائف البحث، بحيث أصبح كل موقع لمحركات البحث يحتوي على مجموعة من الخدمات التي تحتاجها للتنقيب عن المعلومات المطلوبة بسرعة ويسر، وسيتم عرض تلك الأنواع وهي كالآتي :
1. محرك بحث يبحث عن الصور [6]
يمكن القول بأن موقع www.ditto.com وهو محرك بحث يرتكز على الصور، من إدخال كلمة، أو قطع للبحث عنه، وبدلا من إعادة نتائج البحث بشكل نصي يعيد الموقع النتائج بشكل عدد من الصور المصغرة Thumbnails ، وعند النقر على أي صورة مصغرة تعرض صفحة الويب التي تتضمنها، ويضم الفهرس في هذا الموقع أكثر من مليوني صورة، وهذا طبقا لإحصائية تم عملها في عام 1999، كما أن هناك العديد من محركات بحث الصور منها www.snap.com
2. محرك بحث الملفات
قامت شركة c2v بتصميم برنامج جديد أطلق عليه أسمtextomattom وهو من محركات البحث متعددة اللغات وليس من بينها العربية، وهو يعمل على إيجاد الملفات الهامة عن طريق محتوياتها أيا كانت نوعها أو مواقعها على الويب، كما يعمل على تنفيذ عمليات البحث اعتمادا على إدخال كلمات مفاتيح المفردات المتخصصة، وبالتالي يستطيع البرنامج من خلال المحتوى دون اللجوء إلى عناوين الملفات ودون الحاجة إلى فتحها أياُ كان نوع الإصدارة، وكذلك يسمح باستخدام كلمات البحث المتقدم and , or , not .
3. محركات بحث متخصصة
كما أن هناك محركات بحث عامة ، فهناك محركات بحث متخصصة في موضوعات معينة مثل :
- محركات بحث طبية :
www.nlm.nih.gov و www.healthfinder.org
-
محركات بحث في مناطق أو دول معينة :
مثل إفريقيا www.rubani.com . و www.ananzi.com
الخاتمة:
يوجد على الإنترنت اليوم بلايين الصفحات، وحسب المصادر المتوفرة فإنه قد تم حتى اليوم فهرسة ما يزيد قليلا على البليون صفحة. وتتسابق الشركات التي تقوم بفهرسة هذه الصفحات في إتاحتها لمستخدمي إنترنت، والحفاظ على سرعة الاستجابة التي يحصل عليها المستخدم. وإضافة إلى السرعة فإن على قواعد البيانات هذه أن تثبت وجودها بتقديم أجوبة "طازجة"، ومتناسقة، وذات علاقة بما يبحث عنه المستخدم. كما أن عجلة الابتكار لا تتوقف في مجال البحث، وإضافة إلى ذلك فهناك العديد من محركات البحث التي تعتمد تقنيات الشبكات العصبية Neural Networks، ومحركات البحث التي يمكن تثبيتها على أجهزة المستخدمين، وفهرسة محتويات أقراصهم الصلبة. ونظرا للأهمية المتواصلة لمحركات البحث، فإن التقنيات الجديدة ستواصل ظهورها، وستواصل التقنية تطورها لتقديم نتائج أفضل للمستخدمين. وبظهور هذه التقنيات فإن بعضها سيفشل وبعضها سينجح، وستصبح التقنيات الناجحة جزءا من محركات البحث المستخدمة اليوم.
المراجع
1. أدوات البحث على الإنترنت . – مكتبات نت . – ع 6 ، 7 [ يونيو ويوليو 2000].
2. نبش أعماق الإنترنت . أحمد عبد القادر الخالد . 2002 .- تاريخ الاطلاع مايو 2002 .- متاح في : :www.computers.arabcomputing.com/search.html
3. الطريق الآمن لدخول عالم الإنترنت . أمنية طلعت .– جريدة البيان . – 27 يناير 2002 .- متاح في : www.albayan.co.ae/albayan/2002/01/271mnw/9.html
4. التحكم بفهرسة محركات البحث لموقعك .- انترنت العالم العربي . ع مايو [1999]. متاح في : www.ditnet.co.ae/arabic/internet/tutor0702.html
5. البحث على الإنترنت . – لغة العصر . – [8 أغسطس 2000] . - متاح في :www.ahram.org.eg/ict
6. خطوات بسيطة تضمن الاستفادة القصوى من محركات البحث . أريزونا عبد العزيز أبانمي .– جريدة الجزيرة . – ع 9993 [فبراير 2000] - متاح في :www.suhuf.net.sa
7. دليلك إلى محركات البحث في الشبكة : إنترنت العالم العربي .- ع مايو / أغسطس [1998] . متاح في www.ditnet.co.ae/arabic/internet/studyd0110_2.html
8. محركات البحث العربية : أنترنت العالم العربي . – ع مايو / أغسطس [1998] . متاح في : www.ditnet.co.ae/arabic/internet/studyd0110_3.html
9. محركات البحث لا تتأقلم مع نمو الإنترنت . – مجلة إنترنت العالم العربي . – ع أغسطس [1999] - متاح في : www.idwmag.com/issue0211/nal.html
10. مواقع البحث .– لغة العصر .– [26 مارس 2002] - متاح في : www.ahram.org.eg/ict
11. مقدمة إلى محركات البحث في الشبكة . نبيل بدر سنبل .– الرياض : جامعة الملك فهد ، 2001.- متاح في :http://Users.kfupm.edu.sa
12. http://www.cybrarians.info/journal/no2/searchengines.htm
13. http://ar.wikipedia.org/wiki