الأمن السيبراني

باراك توروفسكي يحلل ثورة معالجة اللغات الطبيعية في الذكاء الاصطناعي


مع ظهور المزيد والمزيد من المنصات ذات التعليمات البرمجية المنخفضة، يستمر تسارع أتمتة تكنولوجيا المعلومات المعتمدة في المؤسسة في النمو. لقد كان الذكاء الاصطناعي التوليدي وقدرته على التأثير على حياتنا أحد أهم المواضيع في مجال التكنولوجيا، خاصة فيما يتعلق بـ ChatGPT.

هناك وعود هائلة ولكن من المحتمل أن تكون هناك مخاطر أكبر مع هذا النهج في الأتمتة. هل سنرى أتمتة تكنولوجيا المعلومات في المؤسسات تدخل مرحلة جديدة من التبني؟

في هذه الجلسة الرئيسية المؤرشفة، يكشف باراك توروفسكي، نائب الرئيس للذكاء الاصطناعي في شركة Cisco، عن نضوج الذكاء الاصطناعي ورؤية الكمبيوتر وتأثيره على ثورة معالجة اللغة الطبيعية. كان هذا الجزء جزءًا من حدثنا الافتراضي المباشر بعنوان “استراتيجيات تعظيم أتمتة تكنولوجيا المعلومات”. تم تقديم الحدث بواسطة ITPro Today وInformationWeek في 28 مارس 2024.

نسخة من الفيديو يلي أدناه. تم إجراء تعديلات طفيفة من أجل الوضوح.

باراك توروفسكي: لذلك، الذكاء الاصطناعي للتعرف على الكلام، كما ذكرت، كان هذا العصر الذي تراجع الآن من حيث فهم ماهية النظام. السبب الذي جعلها تحظى بشعبية كبيرة هو أن العديد من الشركات استثمرت في التكنولوجيا، وقد نضجت أخيرًا.

يمكنك استخدام الشبكات العصبية العميقة للحصول على درجة عالية جدًا من الثقة في التعرف على الكلام. الميزة الثانية للذكاء الاصطناعي هي أنه في الأساس رؤية حاسوبية، وهي مرة أخرى عبارة عن بيانات غير منظمة حيث يمكنك التعرف على كلب أو استخدام جهاز لترجمة أي شيء بصريًا.

متعلق ب:نائب رئيس شركة Cisco للذكاء الاصطناعي باراك توروفسكي يتحدث عن حالات استخدام LLM وفوائد أتمتة تكنولوجيا المعلومات

يمكن ترجمة أي علامة أو أي عنصر قائمة بسرعة وحتى استخدامها في الواقع المعزز. أنا فخور جدًا بكل تلك الابتكارات المبكرة التي قمنا بها مع أحد فرقي في خدمة الترجمة من Google. وكان التعلم الآلي كأداة في ذلك الوقت هو ما نسميه الآن الذكاء الاصطناعي، لأن جوجل كانت من أوائل المتبنين لهذه التكنولوجيا.

خلال تلك الفترة، استخدمنا التعلم الآلي الإحصائي لمعالجة اللغة الطبيعية. إلى حد ما في الماضي، كان علي أن أشرح سبب أهمية معالجة اللغة الطبيعية لأنه في كثير من الحالات، كانت الموجة الأولى من ثورة الذكاء الاصطناعي مقتصرة على شركات مثل جوجل.

إن Google حسب تصميمها هي شركة لغات، ولكن بفضل قوة ChatGPT اليوم، فإننا نعرف مدى أهمية معالجة اللغة. وعلى مستوى أعلى، تريد صناعة التكنولوجيا تمكين المستخدمين من إدارة عالمهم بقوة اللغة.

سواء كنت تكتب أو تتحدث، فهذه هي الواجهة الأكثر طبيعية، وتعد معالجة اللغة عنصرًا حاسمًا في العديد من منتجات التكنولوجيا. اليوم، لا أعتقد أنني بحاجة إلى شرح معالجة اللغة، لكن في الماضي كنت أفعل ذلك لأنها كانت مقتصرة على شركات مثل Google.

إنه موضوع معقد للغاية. ولهذا السبب فإن التقدم في هذه التكنولوجيا حديث نسبيًا. وفي نهاية المطاف، فإنه يسمح للصناعة بتحقيق مستويات أعلى من قدرات معالجة اللغة الطبيعية. إنه أمر معقد للغاية لأن اللغات صعبة، وهذه أمثلة من العالم الحقيقي.

متعلق ب:[Free Virtual Event] استراتيجيات لتعظيم أتمتة تكنولوجيا المعلومات

يمكن أن تكون اللغات غامضة. على سبيل المثال، يمكن أن يكون الهدف التعليمي ذو معنى في لغة برمجة أو لعبة، أو يمكن أن يختلف، نظرًا لوجود طرق متعددة لقول نفس الشيء. أستطيع أن أقول إنني عملت لدى جوجل، أو أستطيع أن أقول إن جوجل وظفتني.

تتضمن اللغة أيضًا بعض اللغات العامية. كما يمكن أن يكون سياقيًا للغاية، والبشر يفهمون ذلك، لكن الآلات لن تفهم ذلك حتى وقت قريب جدًا. إن عدد الفروق في اللغة أمر جنوني، ولهذا السبب تحتاج الآلات إلى تقنيات مختلفة لفهم الفروق الدقيقة بشكل أفضل.

في اللغات التي تحتوي على الذكاء الاصطناعي، كان الاختراق هو استخدام الشبكات العصبية على كميات هائلة من بيانات التدريب. من خلال معالجة اللغة الطبيعية للغة واحدة، ستتمكن من فهم ما قاله شخص ما باللغة الإنجليزية بشكل أفضل، وسأعرض لك بعض الأمثلة.

وكان الإنجاز الثاني هو الترجمة الآلية العصبية. وهذا ما أسميه معالجة اللغة الطبيعية ثنائية اللغة، حيث تفهم اللغة أ، وتترجمها إلى اللغة ب. وكان كلاهما بمثابة خط الأساس لهذا التطور.

متعلق ب:تستكشف Eve Logunova-Parker المسار التطوري لأتمتة تكنولوجيا المعلومات

لإعطائك القليل من التاريخ، بدأ التطور التوليدي في عام 2017. وكما ذكرت، في عام 2016، أطلق فريقي في Google الترجمة الآلية العصبية لما نسميه الآن ماجستير إدارة الأعمال التجارية. لقد كان طفرة تكنولوجية هائلة سنتحدث عنها، سواء على مستوى البرمجيات أو الأجهزة.

أدى ذلك إلى موجة جديدة من الأبحاث التي بلغت ذروتها في ورقة بحثية تُعرف باسم “المحول، الانتباه هو كل ما تحتاجه”. كان هذا في الأساس هو الإنجاز الذي مكّن ثورة الذكاء الاصطناعي التوليدي الحالية لأنه أظهر طرقًا جديدة لمعالجة البيانات، وخاصة فهم ما يقوله الناس لتوليد الاستجابات.

كان المنتج الأول يُعرف باسم برنامج التشفير ثنائي الاتجاه، وهو منتج سمح لنا بالنظر إلى اتجاهي النص. يمكننا أيضًا إجراء التدريب المسبق والضبط الدقيق. كان هذا أول إنتاج للتكنولوجيا التحويلية في عام 2018 والذي تم إجراؤه في البداية لبحث Google، والذي توسع بعد ذلك ليشمل العديد من المنتجات الأخرى في Google.

لقد أصبح في النهاية مفتوح المصدر بواسطة Google. ومن الواضح أن جوجل تستحق قدرًا كبيرًا من الفضل لما ساهمت به في الصناعة التي أشعلت شرارة هذه الثورة. أشعر بأنني محظوظ للغاية وفخور لأنني كنت جزءًا من تلك الرحلة المذهلة.

لذلك، من مستوى عالٍ، فإن ما تفعله تمثيلات التشفير ثنائية الاتجاه من المحولات (BERT) هو إخفاء ما يقرب من 20٪ من العالم أثناء تدريبنا وإعادة تدريبنا. نحن نطلب من النموذج العصبي أن يحاول تخمين تلك الكلمات، والتنبؤ إلى حد ما بالكلمة الصحيحة التي يجب استخدامها.

في هذه الحالة على سبيل المثال، الكلمات الموجودة في الأعلى مثل العشب، والموائل، والمسماة، والأرض، والثدييات، والصغيرة تكون مخفية بشكل أساسي. إن مجرد تخمين كلمات جديدة ليس بالضرورة مفيدًا، ولكن إذا قمت بتدريب النموذج على كمية هائلة من البيانات من مليارات المطالبات التدريبية، فإنه يبدأ في أن يصبح جيدًا جدًا في محاولة إنشاء إطار للإجابة على الأسئلة.

لذا، على سبيل المثال، إذا كان السؤال هو ما هي الثدييات التي تبني أعشاشها على الأرض؟ لقد أوضحت بعض السياق أن معظم الثدييات، مثل السناجب، تبني أعشاشًا في أعالي الأشجار، بينما قد تبني حيوانات الراكون أعشاشها على الأرض.

وهذا يسمح للنموذج بالتنبؤ بالإجابات الصحيحة، وهذا استخدام مبسط للغاية لـ BERT.

شاهد الحدث الافتراضي المباشر المؤرشف “استراتيجيات تعظيم أتمتة تكنولوجيا المعلومات” عند الطلب اليوم.





Source link

زر الذهاب إلى الأعلى