1. هدف المدونة اللغوية العربية العالمية

مرحبا بكم في موقع المدونة اللغوية العربية العالمية لمكتبة الإسكندرية. مكتبة الإسكندرية هي إحدى المؤسسات المصرية العالمية التي تلعب دورا ملحوظا في نشر الثقافة والمعرفة ودعم الأبحاث العلمية، وقد قامت بدعم بناء المدونة اللغوية العربية العالمية التي هي إحدى المحاولات الحقيقية الطموحة لبناء مدونة لغوية للعربية المعاصرة تحوي 100 مليون كلمة محللة صرفيا ونحويا ودلاليا، وقد روعي فيها أن تكون ممثلة لقطاع إقليمي كبير من الدول الناطقة باللغة العربية المعاصرة وعاكسة بشكل حقيقي وواقعي لأنماط استخدام اللغة العربية المعاصرة في أنحاء العالم العربي. بمجرد الانتهاء من بناء المدونة ستكون أول مدونة محللة ومتاحة كمورد لغوي للباحثين بصفة عامة والباحثين اللغويين بصفة خاصة لتفيد في وصف نظريات اللغة من خلال الاستخدام الواقعي للكلمات.

2. تخطيط المدونة اللغوية العربية العالمية

لقد روعيت العديد من الأمور المرتبطة ببناء المدونة مثل التمثيل الجيد للنصوص في العربية المعاصرة والتنوع في فئات النصوص ومحتواها والتوازن بين كل فئة من النصوص وحجم الكلمات المجمعة في كل فئة من فئات التجميع. عند النظر إلى تمثيل العربية المعاصرة داخل المدونة نجد أن الاهتمام الأساسي هو التغطية والتمثيل الواقعي لمختلف المصادر من كل المجتمعات العربية. فشملت المدونة عددا من المصادر والفئات المختلفة للنصوص وذلك بهدف تحقيق شروط التمثيل الجيد ومدى انتشار المصدر أو الفئة، والتوازن بين كل مصدر وكل فئة، وحجم الكلمات في كل مصدر وفئة.

ونجد أن تصميم المدونة اعتمد بالأساس على البدء بحصر المصادر المختلفة، وداخل كل مصدر تم إدراج الفئات المميزة له. وقد تم حفظ النصوص داخل المدونة بطريقة هرمية من خلال تسمية النصوص بطريقة توضح العديد من المعلومات مثل المصدر والفئة وتاريخ النشر.

لقد تم الأخذ في الاعتبار العديد من الأمور عند تجميع المدونة مثل عدد الفئات المتضمنة داخل المدونة، وعدد النصوص داخل كل فئة من هذه الفئات، بالإضافة إلى متوسط عدد الكلمات داخل كل نص. تبعا لطبيعة كل مصدر من مصادر التجميع.

3. تصميم المدونة اللغوية العربية العالمية

  • يوجد أربعة مصادر أساسية: الصحافة والمقالات الإلكترونية والكتب والدراسات الأكاديمية.
  • المصدر الخاص بالصحافة منقسم إلى ثلاثة مصادر فرعية: الجرائد والمجلات والصحافة الإلكترونية.
  • يوجد إحدى عشرة فئة على مستوي المدونة: العلوم الاستراتيجية والعلوم الاجتماعية والرياضة والدين والأدب والعلوم الإنسانية والعلوم الطبيعية والعلوم التطبيقية والفنون والثقافة والسير الذاتية والنصوص المتنوعة.
  • يوجد أربع وعشرون فئة فرعية: سياسة وقانون واقتصاد واجتماع ودين إسلامي ودين مسيحي وأديان أخرى ودين مقارن وقصص وشعر ونثر ودراسات لغوية وأدبية وطب وهندسة وزراعة وتكنولوجيا وعلم الأحياء وعلم الفيزياء وعلم الفضاء وعلم الجيولوجيا والبيئة وعلم الكيمياء وعلم النفس وعلم الفلسفة وتاريخ.
  • يوجد أربع فئات فرعية من فئة القصص الفرعية: روايات وقصص قصيرة وقصص أطفال ومسرحيات.
  • تغطي المدونة جميع المنشورات داخل الوطن العربي وكذلك بعض المنشورات العربية المنشورة خارج الوطن العربي

4. تحليل المدونة اللغوية العربية العالمية

تشمل هذه المرحلة حاليا التحليل الصرفي لكل كلمة موجودة داخل المدونة، وقد تم في هذه المرحلة تحليل المدونة بطريقة آلية مبنية على بعض الطرق الإحصائية وبعض القواعد اللغوية بالاعتماد على أحد المحللات الصرفية الشهيرة - تيم باك والتر (Tim Buckwalter) - حيث يوضح التحليل الصرفي عدد من المعلومات كالسوابق واللواحق قسم الكلمة وساقها وجذعها وجذرها ووزنها الصرفي بالإضافة إلى نوع الكلمة من حيث الجنس والعدد والتعريف تبعا للسياقات المختلفة للكلمات داخل كل نص.