كلام تقنى

باحثون في سلطة عمّان: يطالبون بضخ مزيدا من النتاجات المعرفية باللغة العربية في الحاسوب

دعا أستاذ الذكاء الاصطناعي وحوسبة اللغة في جامعة بيرزيت الفلسطينية، د.مصطفى جرار، إلى ضخ المزيد من النتاجات المعرفية والعقلية والفكرية والعلمية المتعقلة باللغة العربية في الحاسوب؛ لتوفير فضاء معرفي متاح للجميع.

وقال جرار في محاضرة له بمنتدى عبد الحميد شومان الثقافي تحت عنوان “تجربة بناء أضخم قاعدة بيانات لغوية في تاريخ اللغة العربية”، أن حوسبة اللغة العربية باتت أمراً ضرورياً، إذ ما تزال المادة العربية في قواعد البيانات والقواعد الحاسوبية “ضعيفة”.

واستعرض جرار الجهود المبذولة في جامعة بيرزيت من أجل حوسبة اللغة العربية، وإثراء المحتوى الرقمي باللغة العربية عبر شبكة الإنترنت.

وبحسب جرار، فإن الجامعة تستخدم محركات: “البحث المعجمي”، و”الأنطولوجيا العربية”، و”كرّاس للّهجة العامية الفلسطينية”، وهي متاحة لاستخدام الباحثين والجمهور مجاناً عبر الموقع الإلكتروني الجامعة.

وبيّن جرار أن “محرك البحث المعجمي” لجامعة بيرزيت هو الأول من نوعه في العالم ليس فقط على مستوى اللغة العربية، بل على مستوى جميع اللغات المستخدمة عبر شبكة الإنترنت، إذ تتضمن قاعدة بيانات المحرك حوسبة (150) معجماً عربياً، تشمل المعاجم اللغوية العامّة التراثية والحديثة، والمعاجم العلمية المتخصصة في العلوم التطبيقية والإنسانية بمجالاتها المختلفة.

ويوفر المحرك، بحسب جرار، ترجمة دقيقة بالعربية للمصطلحات والألفاظ الأجنبية، وبما يتجاوز الأخطاء والمغالطات التي تعتري ترجمات محركات البحث شائعة الاستخدام مثل محرّك (google translate)، إذ تعتمد المحركات على غرار (google) ما يسمى “الترجمة الإحصائية” لمعاني المفردات والكلمات، وليس الترجمة “المعجمية” المنضبطة، كما في محرك جامعة بيرزيت.

وسلّط جرار، الفائز بجائزة عبد الحميد شومان للباحثين العرب (2019) في حقل العلوم التكنولوجية والزراعية (حوسبة اللغة العربية)، الضوء على منهجيات جديدة لتوصيف اللغة العربية من أجل النهوض بها لمواكبة عصر المعرفة والذكاء الاصطناعي.

واستعرض أضخم قاعدة بيانات لغوية في تاريخ اللغة العربية؛ وهي شبكة لغوية شاملة تحتوي على جميع المستويات التصريفية، والاشتقاقية، والدلالية، والأنطولوجيا، والعامية، بشكل مترابط، إضافةً لربطها بشبكات لغوية أجنبية.

ولفت إلى أن زيادة الاهتمام بالمصادر اللغوية كالمعاجم، والمكانز، والمسارد، والأنطولوجيات، يأتي بهدف بناء تطبيقات حاسوبية، مثل: الترجمة الآلية، واسترجاع البيانات بأكثر من لغة، وفهم وتحليل النصوص المكتوبة والمنطوقة، والتحدث مع الآلة.

موضحاً أن عدم دعم التطبيقات الحديثة للغة العربية، يعود، إلى شح المصادر اللغوية العربية المحوسبة، إذ لا يوجد قائمة بجميع المدخلات العربية، كما لا يوجد مصادر لغوية حديثة.

وأوضح جرار أن جامعة بيرزيت ساهمت في جمع ورقمنة وتنقيح ودمج وتوحيد المصادر اللغوية، وإتاحتها للجمهور العربي والباحثين ومتعلمي اللغة العربية، ومطوري التطبيقات عبر واجهات برمجية (APIs).

وبشأن محرك “الأنطولوجيا العربية”، بيّن جرار أنه يهدف إلى ضبط فوضى التعريفات والدلالات والمفاهيم في اللغة العربية، والتي تعتري حتى النقاشات العلمية والأكاديمية المتخصصة، بينما يستعير المحرك نفسه مفهوم “الأنطولوجيا” من الفلسفة، والذي يعني “علم الوجود”، أو علم “ماهية الأشياء”، كما تشير إليه المصادر التراثية العربية.

أما محرك “كرّاس”، فيأتي، وفق جرار، استجابة لحقيقة أن نسبة كبيرة من المحتوى العربي عبر شبكة الإنترنت مكتوب باللهجات العامية، وعدم قدرة محركات البحث وأجهزة الحاسوب على التعرّف على هذه اللهجات.

وبشأن قاعدة البيانات المعجمية، أوضح جرار أنها أضخم قاعدة بيانات للغة العربية ومتعددة اللغات، وهي تحتوي على أنواع كثيرة من المصادر اللغوية، مثل: المعاجم اللغوية، والمعاجم ثنائية اللغة أو ثلاثية اللغة، وقواعد البيانات التصريفية، والمسارد، والمكانز، والفروق اللغوية، والأنطولوجيا العربية. وتغطي مجالات عدة كالعلوم، والهندسة، والصحة، والطب، والفلسفة، والإنسانيات، والفنون.

من جهته، أكد أمين عام مجمع اللغة العربية الأردني د.محمد السعودي، الذي أدار المحاضرة، أهمية حوسبة اللغة العربية من خلال مشروعات ضخمة تعيد لها مكانها من جديد من خلال حوسبتها، وإيجاد مرجعية متخصصة لمأسسة ومراقبة آليات عمل مراكز تعليم اللغة العربية لغير الناطقين بها.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى
إغلاق