آندي جوتمانز من Google يتحدث عن التحول إلى إدارة البيانات على مستوى الوكيل

في قمة Google التي عقدت الأسبوع الماضي في لندن، قال آندي جوتمانز، نائب رئيس سحابة البيانات الوكيلة للشركة والمؤسس المشارك للغة البرمجة النصية لخادم الويب PHP، إن الشركات مستعدة للانتقال من “أنظمة الذكاء” إلى “أنظمة العمل”.
في هذا العالم، مع وصول حجم البيانات إلى حجم زيتابايت، سينتقل العمل من الإشراف على البيانات على المستوى البشري إلى الأتمتة على مستوى الوكيل، وذلك باستخدام وكلاء الذكاء الاصطناعي (AI) لتنظيم البيانات وإدارة البيانات الوصفية وبناء الأنطولوجيات. بالنسبة للمؤسسات، يعني ذلك أن مهمة إدارة البيانات وتفعيلها ستخضع لتحول جذري.
يساعد Gutmans في قيادة إستراتيجية شركة التكنولوجيا الفائقة الحجم للشركات للاستفادة من عقارات البيانات الخاصة بها من أجل سير عمل الوكلاء المستقلين.
لقد سألناه عن العقبات التقنية التي تحول دون تحقيق سير عمل مستقل موثوق به وآمن، واستخدام بنيات متعددة الوكلاء للتحقق من الجودة، والهندسة وراء “بحيرة بلا حدود” من Google، والتوتر بين عالم مفتوح المصدر الذي أتى منه والإمكانات الهائلة للالتزام بنماذج الذكاء الاصطناعي الخاصة، والحدود الأمنية في البيئات متعددة السحابية، والمسؤوليات الأخلاقية لمقدمي النماذج.
أثناء قيامك بتوجيه المؤسسات من أنظمة الذكاء إلى أنظمة العمل، ما هو برأيك أكبر عقبة تقنية أمام تحقيق سير عمل مستقل وموثوق؟
أعتقد أن أكبر عقبة تقنية هي الوصول إلى النتائج الصحيحة عالية الجودة. كما تعلم، يمكن لنماذج الأساس أن تسبب الهلوسة، فهي لا تؤدي دائمًا إلى النتائج الصحيحة. وبالتالي فإن الأمر كله يتعلق بما إذا كان بإمكاننا بالفعل إعطاء النموذج الأساسي السياق الصحيح، بحيث يفهم الأعمال، ويفهم ملكية البيانات، ويمكنه بالفعل تحقيق نتائج عالية الجودة. لذلك أود أن أقول أن الجودة هي الشيء الأول.
الآن، تتطلب حالات الاستخدام المختلفة للمؤسسات مستوى مختلفًا من الجودة. يمكن أن يكون دعم العملاء أكثر تسامحًا بعض الشيء. إذا كان هذا قرارًا وجوديًا في مجال الخدمات المالية، فقد تحتاج إلى إنسان على اطلاع به. في الواقع، هدفنا ليس فقط تقديم نتائج بأعلى جودة، ولكن أيضًا بناء الثقة مع مستخدم المؤسسة بأن هذه النتائج قد تم تحقيقها ومنحهم طريقة للتحقق من دقة النتائج التي نحققها.
إذا كان وجود الإنسان في الحلقة هو إحدى الطرق للمساعدة في ضمان الجودة، فماذا لو كنت تريد بناء الإنسان خارج الحلقة – أو على الأقل جعل الإنسان “فوق الحلقة”؟ ما نوع الآليات التي يمكن دمجها في سير العمل الوكيل للمساعدة في ضمان الجودة؟
لقد حققنا نجاحًا جيدًا جدًا مع الوكلاء الذين ينتقدون الوكلاء. في الأساس، أنت على وشك اتخاذ إجراء، ثم يكون لديك وكيل آخر غير ملوث بالسياق وينتقد، ويسأل: “هل هذا الإجراء منطقي؟” يمكنك حتى أن يكون لديك ثلاثة وكلاء ثم تطلب منهم التصويت. وإذا قال الثلاثة نعم، فهذا يعني أن لديك يقينًا كبيرًا بأنك تصل إلى النتيجة الصحيحة. خارج نطاق الإنسان في الحلقة، يعد هذا نمطًا نموذجيًا للغاية – وكيل ينتقد وكيلًا آخر في الواقع.
هل تقوم ببناء حواجز حماية من النوع الموجه للنظام، كما نرى في بعض بنيات الذكاء الاصطناعي، للمساعدة في الجودة؟
نعم، على الرغم من أنني أود أن أقول إن الأفضل سيكون إذا لم تكن مضطرًا إلى إنشاء تعليمات النظام عندما تقوم ببناء الوكلاء. ما زلنا لسنا هناك تماما. ولكن هذا هو السبب في أن التأكد من بناء المعرفة الصحيحة حول الأعمال، وحول التفاعلات وسير العمل، والتأكد من أن لدينا بيانات وصفية عالية الجودة يمكن أن تساعد في توفير السياق الصحيح للوكلاء هو أمر بالغ الأهمية حقًا.
للحصول على نتائج عالية الجودة حقًا، فإن الأمر كله يتعلق بالتأكد من أن الوكلاء لا يفكرون بشكل صحيح فحسب، بل يفكرون بشكل صحيح بناءً على وجود السياق الصحيح للمؤسسة
آندي جوتمانز، جوجل
كلما تمكنا من القيام بذلك بشكل أفضل، قل عدد تعليمات النظام التي يتعين عليك تقديمها للوكلاء، لأن الوكيل سيكون قادرًا على الوصول إلى تلك النتائج. ولهذا السبب نركز بشدة في رسائلنا على كتالوج المعرفة وما نقوم به في هذا العالم.
للحصول على نتائج عالية الجودة حقًا، فإن الأمر كله يتعلق بالتأكد من أن الوكلاء لا يفكرون بشكل صحيح فحسب، بل يفكرون بشكل صحيح بناءً على وجود السياق الصحيح للمؤسسة.
كيف ترى التوتر بين الابتكار مفتوح المصدر وطبيعة الملكية لنماذج المؤسسات الحديثة، مع الأخذ في الاعتبار أن النماذج التي توفر “الذكاء” أصبحت غامضة بشكل متزايد ويسيطر عليها عدد قليل من الشركات الضخمة؟
لقد عملت في مجال المصادر المفتوحة لسنوات عديدة، منذ عام 1997، حيث ساهمت في المصادر المفتوحة وبدأت مشاريع مفتوحة المصدر خارج الشركات الأمريكية. في أدواري السابقة والحالية، قمت أيضًا بدعم المصادر المفتوحة من داخل Amazon وGoogle. الطريقة التي أفكر بها في الأمر هي أنه لا يوجد مقاس واحد يناسب الجميع – فالأمر يعتمد على حالة الاستخدام.
هناك مجال للنماذج مفتوحة المصدر، ولدينا جيما، وهو نموذج مفتوح قمنا بطرحه هناك. ولكن بالتأكيد، أعتقد أن ما تراه أيضًا، كما هو الحال في العديد من الشركات، هو أن هناك أيضًا مجالات تريد التمييز فيها كمزود.
هدفنا هو التميز في بعض هذه المجالات، ولكن أن نكون منفتحين جدًا في كيفية استهلاك العملاء لذلك. على سبيل المثال، يمكنك استخدام Gemini إذا كنت تستخدم AWS [Amazon Web Services] أو [Microsoft] أزور. لدينا روابط بينية عبر السحابة حتى تتمكن من القيام بذلك بوقت استجابة منخفض للغاية. نحن نحاول التأكد من أنه حتى عندما نكون مملوكين لنا، فإننا نفعل ذلك بطريقة منفتحة للغاية وتمنح العملاء حرية الاختيار.
لقد دافعت عن فكرة بناء بحيرة “بلا حدود”. كيف يمكنك التوفيق بين ذلك وواقع بيئات المؤسسات متعددة السحابة المجزأة بشكل متزايد؟
يمتلك معظم عملاء المؤسسات لدينا سحابتين على الأقل، وفي بعض الأحيان يكون ذلك غير مقصود من خلال الاستحواذ. تاريخيًا، كان هذا في حد ذاته بمثابة عائق إلى حد ما، لأن الوصول إلى البيانات في السحابات الأخرى كان بطيئًا ومكلفًا، وكانت هناك مخاوف أمنية.
لقد عملنا بشكل وثيق مع كل من AWS وAzure لإنشاء اتصالات بينية عبر السحابة، والتي تتيح للعملاء الآن شراء قدر معين من النطاق الترددي المفتوح بين هذه السحابات. ولا يمر عبر الإنترنت العام، لذا فهو آمن للغاية، وزمن الوصول منخفض جدًا. هذا مثال على عقبة تقنية سمحت لنا الآن بجعل الأمر سهلاً للغاية وفعالاً من حيث التكلفة للاستعلام المباشر عن البيانات الموجودة على السحب الأخرى من خلال بحيرتنا التي لا حدود لها.
العمل الآخر الذي قمنا به هو مع SaaS [software-as-a-service] مقدمو الخدمات مثل SAP وSalesforce للحصول على تكامل بدون نسخ معهم من خلال معايير مفتوحة مثل Iceberg، حيث يمكننا بالفعل جعل BigQuery يستعلم مباشرة عن البيانات الموجودة داخل تطبيقات SaaS تلك.
بين البنية التحتية التقنية، وهدم تلك الحدائق المسورة، وتنسيقات البيانات المفتوحة، والنماذج التي تسمح لنا بأخذ البيانات غير المنظمة – والتي كانت تقليديًا بيانات مظلمة – وجعلها مضيئة، تساعدنا هذه التطورات حقًا في تحويل هذه البحيرة بلا حدود إلى واقع.
إذا كان بإمكان وكيل الذكاء الاصطناعي الوصول عبر كل سحابة وقاعدة بيانات في الشركة، فكيف يمكنك منعه من الوصول إلى البيانات التي لا ينبغي له ذلك؟ كيف يوازن الحلم “بلا حدود” بين حرية الوصول والأمن الصارم والامتثال الذي تتطلبه المؤسسة الحديثة؟
لا يزال من المهم التأكد من أنه عند وصولك إلى البيانات على الجانب الآخر، فإنك تصل إليها مع وضع الشخصية والدور في الاعتبار حتى تتمكن من فرض التحكم في الوصول من المصدر. يعد هذا جزءًا كبيرًا من هدفنا التصميمي – وهو التأكد من أننا نحترم جميع عناصر التحكم الأمنية التي قد يمتلكها العملاء، سواء كانوا مشتركين في Google Cloud Platform [Google Cloud Platform] أو ما إذا كانت تلك البيانات موجودة على سحابة أخرى.
الشيء الآخر الذي نقوم به في منصة الوكلاء لدينا هو السماح للعملاء بتضييق نطاق الوصول الذي يحصل عليه هؤلاء الوكلاء. يمكنك منح الوكيل إذنًا لمصادر البيانات والخدمات المحددة التي يحتاج إلى الوصول إليها فقط، وليس أكثر.
وعلى من تقع مسؤولية هذا النطاق؟ هل تقوم فقط بتوفير الأداة وترك المسؤولية للعميل؟ إلى أي مدى تذهب مسؤولية جوجل؟
في Borderless Lakehouse، نتحمل قدرًا كبيرًا من المسؤولية لمساعدة العملاء على تسهيل استخدام هذا النظام بطريقة آمنة للغاية ومحكومة من وجهة نظرهم.
عندما يقوم العملاء ببناء وكلاء خاصين بهم، يوجد عنصر عليهم للتأكد من أنهم يقومون بفحص نطاق أذونات الوكيل بطريقة منطقية بالنسبة لهم. نحن نجعل من السهل الحصول على وضع آمن افتراضيًا، ولكن في كثير من الحالات، خاصة مع أعباء العمل الحساسة للغاية، قد يرغب العميل في تحديد نطاق الأذونات بشكل أكبر.
بعد إدارة خدمات قواعد البيانات في AWS وGoogle، ما هي أهم المفاهيم الخاطئة لدى المؤسسات حول “جاذبية البيانات” المطلوبة لتشغيل الذكاء الاصطناعي المولد بشكل فعال؟
لا تزال ترى بعض البائعين يرسلون رسالة مفادها أنه يجب عليك استيعاب جميع البيانات في البحيرة المركزية ثم تنشيط وكلائك من ذلك. أعتقد أن هذا افتراض خاطئ، لأن هؤلاء الوكلاء يجب أن يتصرفوا في الوقت الفعلي، ويجب أن يكونوا مستقلين، وعليهم الوصول إلى البيانات التشغيلية. لا يمكنك إدخال جميع البيانات فحسب، بل تحتاج إلى حداثة البيانات.
كما أن تكلفة وتعقيد هذا الابتلاع مرتفعان جدًا. وعندما تفكر في بياناتك غير المنظمة، لا يمكنك نقل بيتابايت من البيانات لمجرد وضعها في المكان الصحيح. يحصل العملاء على الكثير من الفوائد عند استيعاب البيانات في Google Cloud Platform لأن Google Cloud Platform مصمم بشكل مختلف تمامًا عن أي شخص آخر، لكنني لا أعتقد أن أي شركة يمكن أن تكون ناجحة إذا كان المسار للأمام هو جلب جميع البيانات إلى بحيرة بيانات مركزية.
لقد تحدثت عن زيتابايت من البيانات التي تحت سيطرتك. إذا كان الفرد يواجه صعوبة في إدارة محرك أقراص واحد بسعة 1 تيرابايت على جهاز الكمبيوتر المنزلي الخاص به، فكيف يمكن للمؤسسات إدارة البيانات على هذا النطاق؟
لقد وصلنا إلى مستوى من الحجم حيث نحتاج إلى وكلاء للقيام ببعض هذا. هذا هو المكان الذي لا يزال فيه بعض البائعين الحاليين يعتمدون بشكل كبير على مشرفي البيانات والأشخاص الذين يقومون بشكل أساسي بتحديد الأنطولوجيات يدويًا. ولكننا نعتقد أنه إذا لم نجعل هذا الأمر آليًا، فلن يكون ناجحًا.
نحن على مستوى عالٍ جدًا، ويصل العملاء إلى مستوى عالٍ جدًا، بحيث لا يكفي إلقاء المزيد من مشرفي البيانات على المشكلة. جزء كبير من تركيزنا وتمايزنا هو محاولة حل هذه المشاكل للبشر من خلال الوكلاء – التحول من إدارة البيانات على نطاق بشري إلى إدارة البيانات على نطاق الوكلاء.
لقد تحدثت خلال الكلمة الرئيسية عن النتائج المفيدة للغاية للإنسانية والتي يمكن أن تأتي من هذه التقنيات. فكيف نضمن عدم استخدامه لأغراض ضارة، مثل الاستخدامات العملياتية العسكرية، أو من قبل أنظمة متهمة بارتكاب جرائم حرب؟
إن سياسات توزيع النماذج رفيعة المستوى وقضايا الرقابة الأخلاقية الأوسع تقع خارج نطاق اختصاصي المحدد. ينصب تركيزي بالكامل على تنشيط بيانات المؤسسة – وتزويد المؤسسات بالبنية التحتية الآمنة والمدارة التي تحتاجها لتنشيط ملكية البيانات الخاصة بها. تتم إدارة السياسات المؤسسية والأخلاقية المتعلقة باستخدام النموذج بواسطة فرق مخصصة على مستوى الشركة.

رئيس تحرير يمني وصحفي محترف حاصل على درجة في الإعلام. عمل في عدة صحف ومواقع إخبارية وتدرّج من محرر إلى رئيس تحرير. يشرف على المحتوى الإخباري ويقود فريقًا صحفيًا مع الالتزام بالمصداقية والمهنية.



