لم يكن الدماغ أبدًا مجرد نموذج لغوي

لقد بنينا شيئًا استثنائيًا، وقد أخطأنا بالفعل في اعتباره الوجهة.
إن النماذج اللغوية الكبيرة هي الأدوات المعرفية الأكثر إثارة للإعجاب التي أنتجتها البشرية على الإطلاق. إنهم يقرؤون ويكتبون ويفكرون ويجادلون بطلاقة لا تزال تبدو غريبة. لكن الطلاقة ليست ذكاءً. يمكن لعازف البيانو الأصم أن يقرأ المقطوعة الموسيقية بشكل مثالي ولا يسمع الموسيقى أبدًا. وهذا هو ما وصلنا إليه تقريبًا مع الذكاء الاصطناعي اليوم، والمرافق غير العادية بقناة واحدة، والوهم المتزايد بأن القناة هي الكل.
لم يكن الدماغ نموذجًا للغة أبدًا. إنه محرك اندماجي.
في كل لحظة استيقاظ، يستوعب جهازك العصبي العشرات من تدفقات البيانات المتزامنة، وزاوية الضوء عبر النافذة، وحبوب السطح تحت أطراف أصابعك، والميل الطفيف في أذنك الداخلية الذي يخبرك بأن الأرض غير مستوية، والصوت المحيط الذي يخبرك بأن الغرفة فارغة قبل أن تسجلها بوعي. ولا يوجد أي من هذه التيارات هو المسيطر. يتم ترجيحها وإسنادها بشكل مستمر ودمجها في نموذج واحد متماسك لمكان تواجدك وما يحدث وما يهم. أنت لا تختبر العالم بحاسة واحدة في كل مرة. يمكنك تجربة كل ذلك مرة واحدة، والتكامل هو الذكاء.
نماذج اللغة الكبيرة لم تكن خطأ
لقد تم بناء السنوات الثلاث الأخيرة من تقدم الذكاء الاصطناعي بالكامل تقريبًا على النص. لم يكن هذا خطأ، فاللغة هي أكثر أنواع المعرفة البشرية كثافة لدينا، وقد أدى التنقيب فيها إلى إنتاج معجزات حقيقية. لكن المجال بدأ يهلوس بأن تحجيم النص هو الطريق إلى الذكاء العام. ليس كذلك. هذا هو الطريق إلى الإكمال التلقائي الأفضل. إكمال تلقائي رائع ومذهل في بعض الأحيان، ولكن الإكمال التلقائي مع ذلك.
القصة الأكثر إثارة للاهتمام، والتي بالكاد يتم سردها في الصحافة المالية والتكنولوجية السائدة، هي ما يحدث على الحواف. تقوم الشركات بتدريب النماذج على البيانات الجدولية، وبناء أنظمة تستخرج الإشارة من الواقع الرقمي المنظم للعالم بدلاً من سطحه اللغوي. ويتدرب آخرون على الفيديو، ويتعلمون فيزياء كيفية تحرك الأشياء وسقوطها وتفاعلها بطرق لا يمكن أبدًا تشفير النص بشكل كامل.
وتقوم شركات الروبوتات بتجميع آلات مزودة بنظام تحديد المواقع العالمي (GPS)، وأجهزة استشعار صوتية اتجاهية، وأجهزة استشعار بصرية عالية الدقة، وهي أنظمة تتنقل في الفضاء المادي بحواس أكثر وظيفية من تلك التي يستخدمها جندي بشري في بيئة متدهورة. سوف يستمر حل هذه الحواس الاصطناعية في التحسن وبسرعة.
بنية الذكاء الاصطناعي الجديدة
إن ما ينشأ الآن ليس نموذجاً أكثر ذكاءً. إنها بنية جديدة: أنظمة ذكاء اصطناعي متخصصة متعددة، كل منها مدرب على قناة حسية مختلفة، كل خبير بطريقته الخاصة، يجمع مخرجاته بالطريقة التي يجمع بها الدماغ البشري الإشارات العصبية من العينين والأذنين واليدين. إن طبقة الاندماج، أي النظام الذي يقرر كيفية وزن هذه التدفقات ودمجها في الوقت الفعلي، هي المكان الذي سيتم إنشاء القيمة الحقيقية فيه، وهي بالكاد موجودة حتى الآن.
الآثار ليست مجردة. وفي الدفاع، ستعود التفوق العسكري إلى كل من يستطيع دمج بيانات أجهزة الاستشعار في ساحة المعركة: صور الأقمار الصناعية، والتوقيعات الصوتية، والاستخبارات الإلكترونية، والتغذية البيومترية، في صورة عملياتية واحدة متماسكة بشكل أسرع من الخصم.
وفي مجال الرعاية الصحية، سوف يتوقف التشخيص عن كونه فن قراءة المخططات ويصبح علم دمج البيانات الجينومية، والتصوير، وأجهزة الاستشعار الحيوية التي يمكن ارتداؤها، والأنماط السلوكية في الوقت الحقيقي.
وفي الأسواق المالية، سوف تتحول الحافة من لغة المعالجة ــ مكالمات الأرباح، والأخبار، والإيداعات ــ نحو قراءة العالم المادي مباشرة: بيانات الأقمار الصناعية عن ازدحام الموانئ، والمراقبة الصوتية لنشاط المصانع، واستهلاك الطاقة كبديل للناتج الاقتصادي.
السؤال لم يعد ما إذا كان هذا سيحدث. المسار واضح. السؤال هو من الذي يبني الهندسة المعمارية التي تدمج كل شيء معًا، وما إذا كنا نفهم ما نبنيه قبل بنائه.
الجميع يشاهدون نماذج اللغة تصبح أكثر ذكاءً. لا أحد تقريبًا يراقب العالم وهو يصبح مقروءًا.
يهوذا توب هو المؤسس والشريك الإداري لشركة Hetz Ventures، وهي شركة إسرائيلية لرأس المال الاستثماري في المراحل المبكرة متخصصة في الأمن السيبراني والبيانات والبنية التحتية للذكاء الاصطناعي.

رئيس تحرير يمني وصحفي محترف حاصل على درجة في الإعلام. عمل في عدة صحف ومواقع إخبارية وتدرّج من محرر إلى رئيس تحرير. يشرف على المحتوى الإخباري ويقود فريقًا صحفيًا مع الالتزام بالمصداقية والمهنية.



