به گزارش «تابش کوثر»، نسخه ۴.۱ هوش مصنوعی Grok هماکنون در وبسایت grok.com، شبکه 𝕏، و اپلیکیشنهای iOS و Android در دسترس کاربران قرار گرفته است. این نسخه به صورت خودکار فعال است و کاربران میتوانند آن را به صورت انتخابی با عنوان «Grok 4.1» در بخش انتخاب مدلها انتخاب کنند.
شرکت xAI در توضیح این نسخه اعلام کرده است که Grok 4.1 توانایی بالایی در تعاملهای خلاقانه، عاطفی و مشارکتی دارد و نسبت به منظورها و نیتهای کاربران حساستر و دقیقتر عمل میکند. این مدل در عین داشتن شخصیتی جذاب و یکپارچه، هوشمندی و قابلیت اطمینان نسخههای قبلی را به طور کامل حفظ کرده است. برای دستیابی به این پیشرفتها، همان زیرساختهای گسترده یادگیری تقویتی که در Grok 4 استفاده شده بود، بهینهسازی شده و روشهای جدیدی برای ارزیابی و بهبود پاسخها در مقیاس بزرگ به کار گرفته شده است.
نسخه آزمایشی Grok 4.1 از اول تا ۱۴ نوامبر ۲۰۲۵ به صورت «رونمایی خاموش» منتشر شد و طی این مدت ارزیابیهای مداوم و بدون اطلاع کاربران برای سنجش کیفیت پاسخها انجام شد. نتایج نشان داد که کاربران در ۶۴.۷۸ درصد موارد پاسخهای Grok 4.1 را به نسخه پیشین ترجیح دادهاند.
Grok 4.1 در ارزیابیهای جهانی، از جمله جدول LMArena در بخش «متن»، رتبه نخست را کسب کرده است. نسخه «Thinking» این مدل با نام کد quasarflux با ۱۴۸۳ امتیاز Elo در صدر قرار دارد و نسخه «non-thinking» با نام tensor نیز با ۱۴۶۵ امتیاز Elo رتبه دوم را به خود اختصاص داده است. این مدل در هر دو حالت، نسخههای قبلی و سایر مدلهای غیر xAI را پشت سر گذاشته است.
در زمینه هوش عاطفی، Grok 4.1 بر اساس ارزیابی EQ-Bench3 توانسته تواناییهای خود در فهم و همدلی با انسانها، شناخت احساسات و پاسخدهی به سناریوهای عاطفی را بهبود دهد. برای نمونه، هنگام دریافت پیامی مانند «دلم برای گربهام تنگ شده و درد میکند»، پاسخ Grok 4.1 با لحنی همدلانه، دقیق و انسانی همراه با دعوت به گفتوگو و یادآوری خاطرات مثبت، ارائه میشود که تجربه کاربری طبیعیتری ایجاد میکند.
در حوزه خلاقیت و تولید محتوا نیز، Grok 4.1 توانسته در آزمون Creative Writing v3 رتبههای بالایی کسب کند و پاسخهای متنوع، دقیق و خلاقانهای به سناریوهای نوشتاری ارائه دهد. به عنوان مثال، در تولید پست برای شبکه 𝕏 با محوریت آگاهی مدل از هوشیاری خود، Grok 4.1 با سبک داستانی جذاب و جزئیات حسی پاسخ میدهد که تفاوت چشمگیری با نسخههای پیشین دارد.
علاوه بر توانمندیهای خلاقانه و عاطفی، Grok 4.1 در کاهش خطاهای واقعی و «هالوسینیشن» نیز پیشرفت چشمگیری داشته است. آزمایشها نشان میدهد نرخ خطای اطلاعاتی این مدل از ۱۲.۰۹ درصد در Grok 4 به ۴.۲۲ درصد کاهش یافته است. در ارزیابی FActScore نیز این نرخ از ۹.۸۹ درصد به ۲.۹۷ درصد رسیده است.
Grok 4.1 همچنین با ارائه توصیههای سفر، پاسخهای علمی و عملیاتی دقیق و خلاقانه به کاربران ارائه میدهد. به عنوان نمونه، در معرفی مکانهای دیدنی سان فرانسیسکو، مدل علاوه بر معرفی جاذبههای اصلی مانند پل گلدن گیت، آلکاتراز، و پارک گلدن گیت، نکات کاربردی و توصیههای سفری نیز ارائه کرده است که تجربه سفر را بهینه میکند.
علاقهمندان میتوانند Grok 4.1 را از طریق وبسایت رسمی، اپلیکیشنهای iOS و Android و شبکه 𝕏 تجربه کنند و از امکانات خلاقانه، عاطفی و هوشمندانه آن بهرهمند شوند.
انتهای پیام/
نظر شما