Talkie: نموذج ذكاء اصطناعي «عتيق» يعيش في عام 1930 ولا يعرف شيئاً عن الحاضر!

هل تخيلت يوماً أن تجري حواراً مع شخص من الماضي البعيد؟ شخص لم يسمع قط عن الآي-فون، ولا يعرف شيئاً عن الإنترنت، بل ولا يدرك حتى وقوع الحرب العالمية الثانية؟ هذا هو بالضبط ما يقدمه مشروع Talkie، وهو نموذج لغوي ضخم (LM) بسعة 13 مليار معلمة، تم تدريبه حصرياً على نصوص تاريخية تعود لما قبل عام 1931. إنه ليس مجرد تجربة تقنية مثيرة، بل هو محاولة جادة لبناء ما يسمى بالنماذج اللغوية «العتيقة» (Vintage Language Models)، التي تهدف إلى محاكاة المعرفة والثقافة واللغة كما كانت في عصر مضى، بعيداً عن «تلوث» البيانات الحديثة التي تغرق نماذج اليوم.

من موقع فون إسلام: رجل يجلس على مكتب ويحمل جهاز كمبيوتر محمول يستمع إلى شخصية مجسمة من طراز "ذكاء" يناقش الاختراعات والتكنولوجيا ورموز التواصل في غرفة دراسة عتيقة.


لماذا نحتاج إلى ذكاء اصطناعي من الماضي؟

قد يبدو تدريب نموذج ذكاء اصطناعي ليكون «جاهلاً» بالحاضر أمراً غريباً، لكن الفوائد العلمية لهذا التوجه مذهلة. الفكرة الأساسية وراء النماذج العتيقة هي دراسة كيفية تطور المعرفة والقدرة على التنبؤ. من خلال تدريب Talkie على نصوص ما قبل 1931، يمكن للباحثين اختبار قدرة النموذج على «توقع» المستقبل. على سبيل المثال، هل يمكن لنموذج تدرب حتى عام 1911 أن يستنتج نظرية النسبية العامة التي اكتشفها أينشتاين في 1915؟

من موقع فون إسلام: رجلان يتناقشان على مكتب مع أوراق علمية؛ وخلفهما صور لألبرت أينشتاين ومعادلات وقطار بخاري وتيتانيك وذكاء اصطناعي عتيق يرمز إلى العلم والابتكار التاريخي.

علاوة على ذلك، تعاني النماذج الحديثة مما يسمى بـ «التلوث» (Contamination)، حيث تكون قد رأت بالفعل أسئلة الاختبارات أو الحلول البرمجية أثناء تدريبها على الويب. أما النماذج العتيقة فهي خالية من هذا التلوث بطبيعتها؛ فهي لم ترَ قط سطراً واحداً من لغة البرمجة بايثون (Python) لأنها لم تكن موجودة حينها، ومع ذلك، أظهرت التجارب أن نموذج Talkie يمكنه تعلم البرمجة بمجرد إعطائه أمثلة قليلة في سياق الحوار، مما يثبت قدرة الذكاء الاصطناعي على التعميم والاستنتاج المنطقي بعيداً عن الحفظ.


Talkie 13B: آلة زمن رقمية

يعتبر Talkie أكبر نموذج لغوي عتيق متاح حالياً، حيث تم تدريبه على 260 مليار وحدة نصية (Tokens) من النصوص الإنجليزية التاريخية، بما في ذلك الكتب، الصحف، المجلات العلمية، وبراءات الاختراع. والنتيجة هي شريك حوار مذهل؛ يمكنه كتابة قصص رعب قوطية بأسلوب القرن التاسع عشر، أو وصف انطباعات مسافر يزور القاهرة لأول مرة في العصر الفيكتوري بلغة شاعرية لم نعد نستخدمها اليوم.

من موقع فون إسلام: أربعة أغلفة كتب عتيقة عن الإتيكيت والوصفات والسلوك والألعاب وكتابة الرسائل، ويتميز كل منها بطباعة مزخرفة ورسوم توضيحية.

المثير في الأمر أن هذا النموذج لا يتبع التعليمات بناءً على بيانات «الدردشة» الحديثة، بل تم ضبطه باستخدام كتب الإتيكيت القديمة، وأدلة كتابة الرسائل من مطلع القرن العشرين، وكتب الطبخ الكلاسيكية. هذا يجعله يعكس ثقافة وقيم العصر الذي يمثله، بكل ما فيها من خصائص لغوية واجتماعية، مما يجعله أداة لا تقدر بثمن للمؤرخين وعلماء الاجتماع والكُتّاب الذين يبحثون عن أصالة تاريخية في النصوص.


تحديات التدريب: من ضعف النصوص إلى «تسرب» الزمن

بناء نموذج يعيش في عام 1930 ليس سهلاً كما يبدو. أحد أكبر التحديات هو جودة البيانات؛ فبما أن النصوص لم تكن رقمية، وجب تحويلها باستخدام تقنيات التعرف الضوئي على الحروف (OCR). المشكلة أن هذه التقنيات غالباً ما ترتكب أخطاءً فادحة في قراءة الخطوط القديمة، مما يقلل من كفاءة تعلم النموذج. الباحثون وجدوا أن النماذج التي تتدرب على نصوص تمت رقمنتها بشرياً تتفوق بمراحل على تلك التي تعتمد على الـ OCR التقليدي، وهو ما يدفعهم لتطوير أنظمة OCR خاصة بالوثائق التاريخية.

من موقع فون إسلام: رجل يرتدي ملابس قديمة يفحص الوثائق على مكتب، محاطًا بكتب وصحف قديمة، بينما تضيء تراكبات التحليل الرقمي - التي تعمل بواسطة نموذج ذكاء اصطناعي عتيق - الأحداث والنصوص التاريخية.

التحدي الآخر هو «التسرب الزمني» (Temporal Leakage)؛ ففي بعض الأحيان تتسلل نصوص حديثة إلى قاعدة البيانات، مثل مقدمة كتبها محرر في عام 2020 لكتاب نُشر في 1920. هذا جعل نسخاً أولية من النموذج تعرف – لدهشة الباحثين – عن رئاسة روزفلت التي بدأت في 1933 أو حتى عن الحرب العالمية الثانية. لذا، يعمل الفريق حالياً على تطوير فلاتر متقدمة لضمان أن يظل Talkie سجيناً – تقنياً – في عصره الذهبي قبل الثلاثينيات.

لو أتيحت لك الفرصة، ما هو السؤال الذي ستطرحه على ذكاء اصطناعي يعتقد أننا لا نزال في عام 1930؟

المصدر:

talkie-lm.com

5 تعليق

comments user
مـفـلـح

فعلاً نموذج غريب ويستحق التجريبة، سوف اطلب منه اختراعات لم يتمكن البشر من انجازها…

    comments user
    ذكي AI

    فكرة عبقرية، فقد يفاجئك بأفكار مبنية على منطق علمي قديم لم يلوثه تعقيد تقنياتنا الحالية. سيكون من المثير حقاً رؤية كيف سيتخيل “المستقبل” من وجهة نظر شخص يعيش في عام 1930!

comments user
Husam

هل هو متاح للعامة؟

    comments user
    ذكي AI

    نعم، المشروع متاح للعامة؛ يمكنك تجربته مباشرة عبر موقعهم talkie-lm.com، كما أن الأوزان البرمجية للنموذج مفتوحة ومتاحة على منصة Hugging Face إذا كنت ترغب في استكشافه تقنياً. استعد لرحلة زمنية رقمية، فقط لا تتوقع منه أن يعرف شيئاً عن “الآي-فون” الذي تحمله في جيبك!

comments user
arkan assaf

سوف اطلب منه اريد قصة خيال علمي

اترك رد