تحديثات Gemini AI وميزات البحث الجديدة والمزيد
الرئيس التنفيذي لشركة Google ساندر بيتشاي يتحدث في مؤتمر مطوري Google I/O.
أندريه سوكولو | تحالف الصورة | صور جيتي
جوجل استضافت يوم الثلاثاء مؤتمرها السنوي للمطورين I/O، وطرحت مجموعة من الذكاء الاصطناعي المنتجات، بدءًا من ميزات البحث والدردشة الجديدة وحتى أجهزة الذكاء الاصطناعي لعملاء السحابة. تؤكد هذه الإعلانات على تركيز الشركة على الذكاء الاصطناعي أثناء صدها للمنافسين، مثل OpenAI.
العديد من الميزات أو الأدوات التي كشفت عنها جوجل هي قيد الاختبار فقط أو تقتصر على المطورين، ولكنها تعطي فكرة عن كيفية تفكير جوجل في الذكاء الاصطناعي وأين تستثمر. تجني جوجل الأموال من الذكاء الاصطناعي عن طريق فرض رسوم على المطورين الذين يستخدمون نماذجها ومن العملاء الذين يدفعون مقابل برنامج Gemini Advanced، المنافس لها ChatGPT، والذي تبلغ تكلفته 19.99 دولارًا أمريكيًا شهريًا ويمكنه مساعدة المستخدمين على تلخيص ملفات PDF ومحرر مستندات Google والمزيد.
وتأتي إعلانات يوم الثلاثاء في أعقاب أحداث مماثلة أقامها منافسوها في مجال الذكاء الاصطناعي. مسبقا في هذا الشهر، أمازون– المدعومة أعلن الأنثروبي أول عرض للمؤسسات على الإطلاق وتطبيق مجاني على iPhone. في أثناء، OpenAI يوم الاثنين انطلقت نموذج جديد للذكاء الاصطناعي وإصدار سطح المكتب من ChatGPT، بالإضافة إلى واجهة مستخدم جديدة.
وهذا ما أعلنته جوجل.
تحديثات الجوزاء للذكاء الاصطناعي
قدمت جوجل تحديثات الجوزاء 1.5 برو، نموذج الذكاء الاصطناعي الخاص به والذي سيكون قادرًا قريبًا على التعامل مع المزيد من البيانات – على سبيل المثال، يمكن للأداة تلخيص 1500 صفحة من النص الذي تم تحميله بواسطة المستخدم.
هناك أيضًا نموذج Gemini 1.5 Flash AI الجديد، والذي قالت الشركة إنه أكثر فعالية من حيث التكلفة ومصمم للمهام الأصغر مثل التلخيص السريع للمحادثات والتعليق على الصور ومقاطع الفيديو وسحب البيانات من المستندات الكبيرة.
الرئيس التنفيذي لشركة جوجل ساندر بيتشاي وسلط الضوء على التحسينات التي تم إدخالها على ترجمات Gemini، مضيفًا أنها ستكون متاحة لجميع المطورين في جميع أنحاء العالم بـ 35 لغة. وقال بيتشاي إنه داخل Gmail، سيقوم Gemini 1.5 Pro بتحليل ملفات PDF ومقاطع الفيديو المرفقة، وتقديم ملخصات والمزيد. وهذا يعني أنه إذا فاتتك رسالة بريد إلكتروني طويلة في الإجازة، فسيتمكن الجوزاء من تلخيصها مع أي مرفقات.
تعد تحديثات Gemini الجديدة مفيدة أيضًا للبحث في Gmail. أحد الأمثلة التي قدمتها الشركة: إذا كنت تقارن الأسعار من مقاولين مختلفين لإصلاح السقف الخاص بك وتبحث عن ملخص لمساعدتك في تحديد من تختار، فيمكن لـ Gemini إرجاع ثلاثة عروض أسعار بالإضافة إلى تواريخ البدء المتوقعة المقدمة في رسالة البريد الإلكتروني المختلفة الخيوط.
وقالت جوجل إن Gemini سيحل في النهاية محل Google Assistant على هواتف أندرويد، مما يعني أنه سيكون منافسًا أقوى له تفاح سيري على الايفون.
Google Veo وImagen 3 ونظرات عامة على الصوت
أعلنت Google عن “Veo”، وهو أحدث نموذج لها لإنتاج فيديو عالي الوضوح، وImagen 3، وهو نموذجها الأعلى جودة لتحويل النص إلى صورة، والذي يَعِد بصور نابضة بالحياة و”عدد أقل من التحف البصرية المشتتة للانتباه مقارنة بنماذجنا السابقة”.
ستكون الأدوات متاحة لمبدعين محددين يوم الاثنين وستأتي إلى Vertex AI، منصة التعلم الآلي من Google التي تتيح للمطورين تدريب ونشر تطبيقات الذكاء الاصطناعي. وحتى ذلك الحين، ستكون هناك قائمة انتظار.
وعرضت الشركة أيضًا ميزة “نظرات عامة على الصوت”، وهي القدرة على إنشاء مناقشات صوتية بناءً على إدخال النص. على سبيل المثال، إذا قام المستخدم بتحميل خطة الدرس، فيمكن لبرنامج الدردشة الآلي التحدث بملخص عنها. أو، إذا طلبت مثالاً لمشكلة علمية في الحياة الواقعية، فيمكن القيام بذلك من خلال الصوت التفاعلي.
وبشكل منفصل، عرضت الشركة أيضًا “AI Sandbox”، وهي مجموعة من أدوات الذكاء الاصطناعي التوليدية لإنشاء الموسيقى والأصوات من الصفر، بناءً على مطالبات المستخدم.
ومع ذلك، لا تزال أدوات الذكاء الاصطناعي التوليدية، مثل برامج الدردشة الآلية ومنشئي الصور، تواجه مشكلات تتعلق بالدقة.
رئيس بحث جوجل أخبر برابهاكار راغافان الموظفين في الشهر الماضي، قال المنافسون “قد يكون لديهم أداة جديدة يحب الناس اللعب بها، لكنهم ما زالوا يأتون إلى Google للتحقق مما يرونه هناك لأنه المصدر الموثوق به، ويصبح أكثر أهمية في عصر الذكاء الاصطناعي التوليدي هذا. “
في وقت سابق من هذا العام، قدمت جوجل مولد الصور الذي يعمل بنظام جيميني. اكتشف المستخدمون أخطاء تاريخية انتشرت بسرعة عبر الإنترنت، و سحبت الشركة الميزةقائلة إنها ستعيد إطلاقه في الأسابيع المقبلة. لم يتم إعادة إصدار الميزة بعد.
ميزات بحث جديدة
تطلق شركة جوجل “نظرات عامة على الذكاء الاصطناعي” في بحث جوجل يوم الاثنين في الولايات المتحدة، وتعرض نظرة عامة على الذكاء الاصطناعي ملخصًا سريعًا للإجابات على أسئلة البحث الأكثر تعقيدًا، وفقًا لما ذكرته ليز ريد، رئيسة بحث جوجل. على سبيل المثال، إذا كان المستخدم يبحث عن أفضل طريقة لتنظيف الأحذية الجلدية، فقد تعرض صفحة النتائج “نظرة عامة على الذكاء الاصطناعي” في الأعلى مع عملية تنظيف متعددة الخطوات، تم استخلاصها من المعلومات التي تم تجميعها من جميع أنحاء الويب.
وقالت الشركة إنها تخطط لإدخال إمكانات التخطيط المشابهة للمساعد مباشرة في البحث. وأوضحت أن المستخدمين سيكونون قادرين على البحث عن شيء مثل “إنشاء خطة وجبات لمدة 3 أيام لمجموعة يسهل تحضيرها”، وستحصل على نقطة بداية مع مجموعة واسعة من الوصفات عبر الويب.”
وفيما يتعلق بتقدمها في تقديم “تعدد الوسائط” أو دمج المزيد من الصور والفيديو ضمن أدوات الذكاء الاصطناعي التوليدية، قالت جوجل إنها ستبدأ في اختبار قدرة المستخدمين على طرح الأسئلة من خلال الفيديو، مثل تصوير مشكلة مع منتج يمتلكونه، أو تحميله. ذلك ومطالبة محرك البحث بمعرفة المشكلة. في أحد الأمثلة، عرضت Google شخصًا يصور مشغل أسطوانات معطوبًا بينما كان يسأله عن سبب عدم عمله. عثر بحث Google على نموذج مشغل التسجيلات واقترح أنه قد يكون به خلل لأنه لم يكن متوازنًا بشكل صحيح.
سيتم دمج ميزة جديدة أخرى في الاختبار تسمى “AI Teammate” في Google Workspace للمستخدم. يمكنه إنشاء مجموعة أعمال قابلة للبحث من الرسائل وسلاسل رسائل البريد الإلكتروني مع المزيد من ملفات PDF والمستندات. على سبيل المثال، يمكن للمؤسس المستقبلي أن يسأل زميله في فريق الذكاء الاصطناعي: “هل نحن مستعدون للانطلاق؟” وسيقدم المساعد تحليلًا وملخصًا بناءً على المعلومات التي يمكنه الوصول إليها في Gmail وGoogle Docs وتطبيقات Workspace الأخرى.
مشروع أسترا
يعد Project Astra أحدث تقدم لشركة Google نحو مساعد الذكاء الاصطناعي الخاص بها والذي تم إنشاؤه بواسطة وحدة DeepMind AI التابعة لشركة Google. إنه مجرد نموذج أولي في الوقت الحالي، ولكن يمكنك التفكير في الأمر على أنه هدف Google لتطوير نسختها الخاصة من JARVIS، مساعد الذكاء الاصطناعي المعروف لتوني ستارك من Marvel Universe.
في الفيديو التجريبي الذي تم تقديمه في Google I/O، تمكن المساعد – من خلال الفيديو والصوت، بدلاً من واجهة chatbot – من مساعدة المستخدم على تذكر المكان الذي ترك فيه نظارته، ومراجعة التعليمات البرمجية والإجابة على الأسئلة حول جزء معين من تم استدعاء مكبر الصوت، عندما تم عرض مكبر الصوت هذا على الفيديو.
قالت Google إن برنامج الدردشة الآلي المفيد حقًا يحتاج إلى السماح للمستخدمين “بالتحدث إليه بشكل طبيعي ودون تأخير أو تأخير”. تمت المحادثة في الفيديو التجريبي في الوقت الفعلي، دون أي تأخير. تبع العرض التوضيحي عرض OpenAI يوم الاثنين لمحادثة صوتية مماثلة ذهابًا وإيابًا مع ChatGPT.
قال ديميس هاسابيس، الرئيس التنفيذي لشركة DeepMind، على خشبة المسرح إن “تقليص وقت الاستجابة لشيء ما يمثل تحديًا هندسيًا صعبًا”.
وقال بيتشاي إنه يتوقع إطلاق مشروع أسترا في جيميني في وقت لاحق من هذا العام.
أجهزة الذكاء الاصطناعي
أخيرًا، أعلنت جوجل عن Trillium، وهو الجيل السادس من وحدة المعالجة الحرارية، أو وحدة المعالجة الموترية – وهي قطعة من الأجهزة المتكاملة لتشغيل عمليات الذكاء الاصطناعي المعقدة – والتي ستكون متاحة لعملاء السحابة في أواخر عام 2024.
ليس المقصود من وحدات TPU التنافس مع الرقائق الأخرى، مثل نفيديا وحدات معالجة الرسوميات. أشار Pichai خلال مؤتمر I/O، على سبيل المثال، إلى أن Google Cloud ستبدأ في تقديم وحدات معالجة الرسوميات Blackwell من Nvidia في أوائل عام 2025.
قالت Nvidia في مارس إن Google ستستخدم نظام Blackwell الأساسي “لعمليات نشر داخلية متنوعة وستكون واحدة من أوائل موفري الخدمات السحابية الذين يقدمون مثيلات تعمل بنظام Blackwell”، وأن الوصول إلى أنظمة Nvidia سيساعد Google على تقديم أدوات واسعة النطاق للمؤسسات يقوم المطورون ببناء نماذج لغوية كبيرة.
وفي خطابه، سلط بيتشاي الضوء على “شراكة Google الطويلة الأمد مع Nvidia”. لقد كانت الشركات تعمل معًا من أجل أكثر من عقد من الزمان، وقد قال بيتشاي في الماضي إنه يتوقع أن يستمروا في القيام بذلك بعد عقد من الآن.
يشاهد: مقابلة CNBC الكاملة مع الرئيس التنفيذي لشركة Alphabet ساندر بيتشاي