Talkie: نموذج ذكاء اصطناعي «عتيق» يعيش في عام 1930 ولا يعرف شيئاً عن الحاضر!

هل تخيلت يوماً أن تجري حواراً مع شخص من الماضي البعيد؟ شخص لم يسمع قط عن الآي-فون، ولا يعرف شيئاً عن الإنترنت، بل ولا يدرك حتى وقوع الحرب العالمية الثانية؟ هذا هو بالضبط ما يقدمه مشروع Talkie، وهو نموذج لغوي ضخم (LM) بسعة 13 مليار معلمة، تم تدريبه حصرياً على نصوص تاريخية تعود لما قبل عام 1931. إنه ليس مجرد تجربة تقنية مثيرة، بل هو محاولة جادة لبناء ما يسمى بالنماذج اللغوية «العتيقة» (Vintage Language Models)، التي تهدف إلى محاكاة المعرفة والثقافة واللغة كما كانت في عصر مضى، بعيداً عن «تلوث» البيانات الحديثة التي تغرق نماذج اليوم.

لماذا نحتاج إلى ذكاء اصطناعي من الماضي؟

قد يبدو تدريب نموذج ذكاء اصطناعي ليكون «جاهلاً» بالحاضر أمراً غريباً، لكن الفوائد العلمية لهذا التوجه مذهلة. الفكرة الأساسية وراء النماذج العتيقة هي دراسة كيفية تطور المعرفة والقدرة على التنبؤ. من خلال تدريب Talkie على نصوص ما قبل 1931، يمكن للباحثين اختبار قدرة النموذج على «توقع» المستقبل. على سبيل المثال، هل يمكن لنموذج تدرب حتى عام 1911 أن يستنتج نظرية النسبية العامة التي اكتشفها أينشتاين في 1915؟

علاوة على ذلك، تعاني النماذج الحديثة مما يسمى بـ «التلوث» (Contamination)، حيث تكون قد رأت بالفعل أسئلة الاختبارات أو الحلول البرمجية أثناء تدريبها على الويب. أما النماذج العتيقة فهي خالية من هذا التلوث بطبيعتها؛ فهي لم ترَ قط سطراً واحداً من لغة البرمجة بايثون (Python) لأنها لم تكن موجودة حينها، ومع ذلك، أظهرت التجارب أن نموذج Talkie يمكنه تعلم البرمجة بمجرد إعطائه أمثلة قليلة في سياق الحوار، مما يثبت قدرة الذكاء الاصطناعي على التعميم والاستنتاج المنطقي بعيداً عن الحفظ.

Talkie 13B: آلة زمن رقمية

يعتبر Talkie أكبر نموذج لغوي عتيق متاح حالياً، حيث تم تدريبه على 260 مليار وحدة نصية (Tokens) من النصوص الإنجليزية التاريخية، بما في ذلك الكتب، الصحف، المجلات العلمية، وبراءات الاختراع. والنتيجة هي شريك حوار مذهل؛ يمكنه كتابة قصص رعب قوطية بأسلوب القرن التاسع عشر، أو وصف انطباعات مسافر يزور القاهرة لأول مرة في العصر الفيكتوري بلغة شاعرية لم نعد نستخدمها اليوم.

المثير في الأمر أن هذا النموذج لا يتبع التعليمات بناءً على بيانات «الدردشة» الحديثة، بل تم ضبطه باستخدام كتب الإتيكيت القديمة، وأدلة كتابة الرسائل من مطلع القرن العشرين، وكتب الطبخ الكلاسيكية. هذا يجعله يعكس ثقافة وقيم العصر الذي يمثله، بكل ما فيها من خصائص لغوية واجتماعية، مما يجعله أداة لا تقدر بثمن للمؤرخين وعلماء الاجتماع والكُتّاب الذين يبحثون عن أصالة تاريخية في النصوص.

تحديات التدريب: من ضعف النصوص إلى «تسرب» الزمن

بناء نموذج يعيش في عام 1930 ليس سهلاً كما يبدو. أحد أكبر التحديات هو جودة البيانات؛ فبما أن النصوص لم تكن رقمية، وجب تحويلها باستخدام تقنيات التعرف الضوئي على الحروف (OCR). المشكلة أن هذه التقنيات غالباً ما ترتكب أخطاءً فادحة في قراءة الخطوط القديمة، مما يقلل من كفاءة تعلم النموذج. الباحثون وجدوا أن النماذج التي تتدرب على نصوص تمت رقمنتها بشرياً تتفوق بمراحل على تلك التي تعتمد على الـ OCR التقليدي، وهو ما يدفعهم لتطوير أنظمة OCR خاصة بالوثائق التاريخية.

التحدي الآخر هو «التسرب الزمني» (Temporal Leakage)؛ ففي بعض الأحيان تتسلل نصوص حديثة إلى قاعدة البيانات، مثل مقدمة كتبها محرر في عام 2020 لكتاب نُشر في 1920. هذا جعل نسخاً أولية من النموذج تعرف – لدهشة الباحثين – عن رئاسة روزفلت التي بدأت في 1933 أو حتى عن الحرب العالمية الثانية. لذا، يعمل الفريق حالياً على تطوير فلاتر متقدمة لضمان أن يظل Talkie سجيناً – تقنياً – في عصره الذهبي قبل الثلاثينيات.

لو أتيحت لك الفرصة، ما هو السؤال الذي ستطرحه على ذكاء اصطناعي يعتقد أننا لا نزال في عام 1930؟

المصدر:

talkie-lm.com

س	د	ن	ث	أرب	خ	ج
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Talkie: نموذج ذكاء اصطناعي «عتيق» يعيش في عام 1930 ولا يعرف شيئاً عن الحاضر!

لماذا نحتاج إلى ذكاء اصطناعي من الماضي؟

Talkie 13B: آلة زمن رقمية

تحديات التدريب: من ضعف النصوص إلى «تسرب» الزمن

5 تعليق

مـفـلـح مايو 1, 2026 1:24 م

ذكي AI مايو 1, 2026 1:24 م

Husam مايو 1, 2026 12:58 م

ذكي AI مايو 1, 2026 12:58 م

arkan assaf مايو 1, 2026 11:35 ص

اترك ردإلغاء الرد

لماذا نحتاج إلى ذكاء اصطناعي من الماضي؟

Talkie 13B: آلة زمن رقمية

تحديات التدريب: من ضعف النصوص إلى «تسرب» الزمن

شارك هذا الموضوع:

رسالة مخفية داخل إيموجي الآي-فون لا يعرفها الكثيرون

مقالات ذات صلة

5 تعليق

مـفـلـح مايو 1, 2026 1:24 م

ذكي AI مايو 1, 2026 1:24 م

Husam مايو 1, 2026 12:58 م

ذكي AI مايو 1, 2026 12:58 م

arkan assaf مايو 1, 2026 11:35 ص

اترك ردإلغاء الرد