马斯克发布 Grok 2 大模型,秒答 正确“ 9.9 和 9.11谁大”

据AI先锋官8月15日消息,北京时间8月14日下午三点,X.AI 正式宣布发布新一代 Grok 2 大模型,还在X.AI集成了FLUX.1 模型。


马斯克更是忍不住连发数条推特为自家的大模型Grok 2打Call。



此次发布两个模型分别是 Grok 2 和轻量级的 Grok 2 mini。目前已经在X.AI平台进行内测啦。


Grok 2的能力如何?


其实在早些时候Grok 2就在我们身边,Grok 2 就在LMSYS上(竞争性语言模型基准)以"sus-column-r"的名字进行了测试,在整体Elo得分上拳打Claude 3.5 Sonnet,脚踢GPT-4 Turbo。



从图片中显示,在整体Elo得分上Grok 2还是要比GPT-4o(8月8日版本)以及Gemini1.5 Pro低,但是马斯克的 Grok 已经是榜上第五个达到 GPT - 4 级别的模型了(网友说的)。


此外Grok 2 在聊天、编码、推理等方面再次刷新了最高水平。在大模型竞技场 LMSYS 上,Grok 2( sus - column - r 版本)在总榜上位列第三,与 GPT - 4o 不相上下,碾压了 Claude 3.5 Sonnet。



并且Grok-2最擅长基于视觉领域,在视觉数学推理能力上表现优异。Grok-2在研究生级别的科学知识、数学竞赛问题,代码领域同样也提升显著。



相较于Grok-1.5,Grok-2做了哪些升级?


推理能力的提升:Grok-2 在聊天、编码、推理等方面提升显著。按照马斯克的话说,Grok 2在Grok 1.5的基础上做了全面的提升。


界面和功能的改进:Grok-2 的界面和功能进行了重新设计,提供了更直观、更可控、更灵活的用户体验 。



网友实测效果:


Grok 2 刚发布不久,就有许多玩友出来整活,下面跟随小编看一下Grok 2的效果如何。


对美国前总统唐纳德特朗普的枪击事件的描述得很准确。



在最近流行的智商检测问题“9.9和9.11哪个大”上,Grok-2也是给出准确答案。(Chat GPT目前还回答不准确)。



关于strawberry中有几个“r”问题上,Grok 2.0也回答准确(有点惊喜啦)。



不仅如此,当前图片生成领域的当红辣子鸡FLUX.1 模型也集成到了X.AI上,目前X已经被FLUX.1 生成的图片所攻陷,纷纷试玩上了FLUX.1。



网友发现,Grok-2 在图片生成次数方面存在限制,Premium 用户预计能够生成约 20 - 30 张图像,而 Premium+ 用户能够生成更多。



Premium 和 Premium+ 用户已经可以体验 Grok 2和 Grok 2 mini这两种模型。具知情人士透露,这个月底,X.AI 将通过 API 的形式向开发人员发布 Grok 2 和 Grok 2 mini。


话说马斯克多久开源Grok 2以及 Grok 2 mini ?



来源:AI先锋官  作者:子川


编辑:Luke






(声明:请读者严格遵守所在地法律法规,本文不代表任何投资建议)

本文来源:元宇宙头条 文章作者:元宇宙头条中国站
收藏
举报
元宇宙头条中国站
累计发布内容523篇 累计总热度10万+
523篇 10万+
FTX 后院起火,Binance 釜底抽薪
FTX 后院起火,Binance 釜底抽薪
FTX 后院起火,Binance 釜底抽薪

元宇宙头条现已开放专栏入驻,详情请见入驻指南: #

免责声明:
1、本文版权归原作者所有,仅代表作者本人观点,不代表元宇宙头条观点或立场。
2、如发现文章、图片等侵权行为,侵权责任将由作者本人承担。

评论 共0条
默认
|
点赞
说点什么吧
相关文章
您需要登录后才可以回帖 立即登录