هوش مصنوعی پیشرفته با توانمندی‌های خلاقانه و عاطفی ارتقا یافته

شرکت xAI نسخه جدید مدل هوش مصنوعی خود به نام Grok 4.1 را عرضه کرد. این نسخه با بهبود توانایی‌های خلاقانه، عاطفی و تعاملی، تجربه گفت‌وگو با هوش مصنوعی را طبیعی‌تر، دقیق‌تر و جذاب‌تر می‌کند و در عین حال دقت و هوشمندی نسخه‌های پیشین را حفظ کرده است.

به گزارش «تابش کوثر»، نسخه ۴.۱ هوش مصنوعی Grok هم‌اکنون در وب‌سایت grok.com، شبکه 𝕏، و اپلیکیشن‌های iOS و Android در دسترس کاربران قرار گرفته است. این نسخه به صورت خودکار فعال است و کاربران می‌توانند آن را به صورت انتخابی با عنوان «Grok 4.1» در بخش انتخاب مدل‌ها انتخاب کنند.

شرکت xAI در توضیح این نسخه اعلام کرده است که Grok 4.1 توانایی بالایی در تعامل‌های خلاقانه، عاطفی و مشارکتی دارد و نسبت به منظورها و نیت‌های کاربران حساس‌تر و دقیق‌تر عمل می‌کند. این مدل در عین داشتن شخصیتی جذاب و یکپارچه، هوشمندی و قابلیت اطمینان نسخه‌های قبلی را به طور کامل حفظ کرده است. برای دستیابی به این پیشرفت‌ها، همان زیرساخت‌های گسترده یادگیری تقویتی که در Grok 4 استفاده شده بود، بهینه‌سازی شده و روش‌های جدیدی برای ارزیابی و بهبود پاسخ‌ها در مقیاس بزرگ به کار گرفته شده است.

نسخه آزمایشی Grok 4.1 از اول تا ۱۴ نوامبر ۲۰۲۵ به صورت «رونمایی خاموش» منتشر شد و طی این مدت ارزیابی‌های مداوم و بدون اطلاع کاربران برای سنجش کیفیت پاسخ‌ها انجام شد. نتایج نشان داد که کاربران در ۶۴.۷۸ درصد موارد پاسخ‌های Grok 4.1 را به نسخه پیشین ترجیح داده‌اند.

Grok 4.1 در ارزیابی‌های جهانی، از جمله جدول LMArena در بخش «متن»، رتبه نخست را کسب کرده است. نسخه «Thinking» این مدل با نام کد quasarflux با ۱۴۸۳ امتیاز Elo در صدر قرار دارد و نسخه «non-thinking» با نام tensor نیز با ۱۴۶۵ امتیاز Elo رتبه دوم را به خود اختصاص داده است. این مدل در هر دو حالت، نسخه‌های قبلی و سایر مدل‌های غیر xAI را پشت سر گذاشته است.

در زمینه هوش عاطفی، Grok 4.1 بر اساس ارزیابی EQ-Bench3 توانسته توانایی‌های خود در فهم و همدلی با انسان‌ها، شناخت احساسات و پاسخ‌دهی به سناریوهای عاطفی را بهبود دهد. برای نمونه، هنگام دریافت پیامی مانند «دلم برای گربه‌ام تنگ شده و درد می‌کند»، پاسخ Grok 4.1 با لحنی همدلانه، دقیق و انسانی همراه با دعوت به گفت‌وگو و یادآوری خاطرات مثبت، ارائه می‌شود که تجربه کاربری طبیعی‌تری ایجاد می‌کند.

در حوزه خلاقیت و تولید محتوا نیز، Grok 4.1 توانسته در آزمون Creative Writing v3 رتبه‌های بالایی کسب کند و پاسخ‌های متنوع، دقیق و خلاقانه‌ای به سناریوهای نوشتاری ارائه دهد. به عنوان مثال، در تولید پست برای شبکه 𝕏 با محوریت آگاهی مدل از هوشیاری خود، Grok 4.1 با سبک داستانی جذاب و جزئیات حسی پاسخ می‌دهد که تفاوت چشمگیری با نسخه‌های پیشین دارد.

علاوه بر توانمندی‌های خلاقانه و عاطفی، Grok 4.1 در کاهش خطاهای واقعی و «هالوسینیشن» نیز پیشرفت چشمگیری داشته است. آزمایش‌ها نشان می‌دهد نرخ خطای اطلاعاتی این مدل از ۱۲.۰۹ درصد در Grok 4 به ۴.۲۲ درصد کاهش یافته است. در ارزیابی FActScore نیز این نرخ از ۹.۸۹ درصد به ۲.۹۷ درصد رسیده است.

Grok 4.1 همچنین با ارائه توصیه‌های سفر، پاسخ‌های علمی و عملیاتی دقیق و خلاقانه به کاربران ارائه می‌دهد. به عنوان نمونه، در معرفی مکان‌های دیدنی سان فرانسیسکو، مدل علاوه بر معرفی جاذبه‌های اصلی مانند پل گلدن گیت، آلکاتراز، و پارک گلدن گیت، نکات کاربردی و توصیه‌های سفری نیز ارائه کرده است که تجربه سفر را بهینه می‌کند.

علاقه‌مندان می‌توانند Grok 4.1 را از طریق وب‌سایت رسمی، اپلیکیشن‌های iOS و Android و شبکه 𝕏 تجربه کنند و از امکانات خلاقانه، عاطفی و هوشمندانه آن بهره‌مند شوند.

انتهای پیام/

کد خبر 142506

نظر شما

شما در حال پاسخ به نظر «» هستید.
captcha