هل أنت مهتم بهم OFFERED؟ حفظ مع كوبونات لدينا على ال WHATSAPP o برقية!

أصبح ChatGPT الآن مساعدًا يمكنه الرؤية والسمع والتحدث

شات جي بي تي، الذي طورته OpenAI، يقدم إمكانات جديدة تسمح لك بالتفاعل من خلال الصوت والصور، ويقدم واجهة بديهية والمزيد من الطرق لدمج ChatGPT في حياتك اليومية. وفي إعلان حديث على موقعها الإلكتروني، قررت OpenAI الكشف عن هذه الميزات الجديدة مسبقًا. وبالمثل، سلط الضوء أيضًا على الفوائد التي يجلبونها والتحديات التي يمثلونها في سوق الذكاء الاصطناعي المتنامي.

ChatGPT: التفاعل الصوتي

مع وظيفة الصوت الجديدة، يمكن للمستخدمين الحصول عليها محادثات تفاعلية مع ChatGPT. يتيح لك هذا استخدام المساعد حتى أثناء التنقل، مما يزيد من إمكانات برنامج الدردشة الآلي. على سبيل المثال، يمكن للمستخدم أن يطلب من ChatGPT أن يروي قصة أطفال أثناء التنقل، مما يجعلها أكثر متعة.

الأوامر الصوتية chatgpt
قصة تم إنشاؤها بواسطة chatbot

أو، أثناء تناول العشاء مع الأصدقاء، يمكن أن ينشأ نقاش حول موضوع معين؛ وفي هذه الحالة، يمكن للمستخدمين استخدام الروبوت للحصول على معلومات دقيقة وحل النقاش بشكل بناء.

تستخدم تقنية الصوت الخاصة بـ ChatGPT نموذج تحويل النص إلى كلام المتقدم. بالتعاون مع ممثلين صوتيين محترفين، يستطيع هذا النموذج إنشاء صوت بشري من النصوص وعينات صوتية قصيرة، مما يجعل التفاعل مع ChatGPT أكثر طبيعية وبديهية. وأيضا بفضل همس، وهو نظام مفتوح المصدر للتعرف على الكلام تم تطويره بواسطة OpenAI، الكلمات المنطوقة هي يتم نسخها إلى نص بدقة كبيرةمما يسمح لبرنامج الدردشة الآلية بفهم طلبات المستخدم والاستجابة لها بشكل فعال.

ChatGPT: التفاعل البصري

كما هو مذكور أعلاه، يمكن الآن لنموذج الذكاء الاصطناعي تحليل صورة واحدة أو أكثرمما يسمح للمستخدمين بحل المشكلات أو تخطيط الوجبات أو تحليل الرسوم البيانية المعقدة. على سبيل المثال، يمكن للمستخدم إرسال صورة لمحتويات ثلاجته. ولذلك ينبغي استخدام chatbot تحليل الأطعمة الموجودة واقتراح وصفات بناء على هذه المكونات، كما يوفر تعليمات خطوة بخطوة للتحضير.

أوامر الصورة chatgpt

اقرأ أيضا: GPT-4: الجوزاء سيكون منافس جوجل. وهنا الاختلافات

علاوة على ذلك، إذا كان المستخدم يحتاج إلى التركيز على عنصر معين في الصورة، يتضمن تطبيق ChatGPT للهاتف المحمول أداة رسم والذي يسمح لك بتسليط الضوء على مناطق معينة من الصورة، مما يجعل الاتصال والتحليل أكثر دقة وتخصيصًا.

يتم دعم فهم الصور بواسطة الطرازين متعددي الوسائط GPT-3.5 وGPT-4. هذه النماذج المتقدمة حيث يقومون بتطبيق مهاراتهم اللغوية على مجموعة واسعة من الصور، مثل الصور الفوتوغرافية ولقطات الشاشة والمستندات التي تحتوي على نصوص وصور، مما يسمح لـ ChatGPT بفهم وتفسير السياق المرئي بدقة وبالتفصيل.

ومن الجدير بالذكر أن من poco لقد قامت OpenAI بدمج ليس ذلك فحسب Canva ولكن أيضا DALL-E 3 في ChatGPTأو نموذج الصورة التوليدية.

متى ولمن سيكون متاحا

في الأسبوعين المقبلين، ستقوم OpenAI بتنفيذ الصوت والصور في ChatGPT للمستخدمين المستخدمين الذين لديهم اشتراكات Plus وEnterprise. 

ستكون الوظيفة التي تسمح بالتفاعل الصوتي متاحة على نظامي التشغيل iOS وAndroid ولكن ليس على إصدار الويب، وهو الإصدار الذي يستخدمه معظم الأشخاص.

ستكون الوظيفة التي تسمح بالتفاعل البصري متاحة بدلاً من ذلك على جميع المنصاتوبالتالي Android و iOS والويب.

المصدر | OpenAI

الوسوم (تاج):

جيانلوكا كوبوتشي
جيانلوكا كوبوتشي

شغوف بالأكواد واللغات واللغات وواجهات الإنسان والآلة. كل ما هو التطور التكنولوجي يهمني. أحاول الإفصاح عن شغفي بمنتهى الوضوح، معتمدًا على مصادر موثوقة وليس "من أول وهلة".

الاشتراك
أبلغ
ضيف

0 تعليقات
التقيمات المضمنة
عرض جميع التعليقات
XiaomiToday.it
الشعار