数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

马斯克xAI新模型Grok 4.2公测,通过趣味测试,回答风格似“老马”亲临

2026-02-18来源:天脉网编辑:瑞雪

马斯克旗下xAI公司推出的Grok 4.2公测Beta版在争议声中悄然上线。这款参数规模仅500B的模型,与当前动辄数万亿参数的行业主流形成鲜明对比,其市场表现呈现出两极分化的态势——部分用户盛赞其创新功能,另一派则直言性能不及预期。

面对质疑声浪,马斯克在社交平台展开密集公关行动。他不仅连续转发十余条夸赞推文,更亲自下场承诺:"公测将持续至下月,正式版将比Grok 4快得多、聪明得多。"据其透露,模型具备每周自我迭代的独特能力,未来将形成固定更新节奏。这一表态与xAI联合创始人近期离职引发的动荡形成微妙对比,此前外界甚至猜测项目可能难产。

技术特性方面,Grok 4.2首次引入实时反馈优化机制。与传统静态更新模式不同,新模型能根据用户交互数据持续调整性能。在弱智吧风格测试题"50米外洗车店该开车还是步行"中,该模型展现出逻辑推理能力,顺利通过考验。不过官方至今未公布完整技术报告,仅在排行榜释放有限评测数据,导致讨论多集中于使用体验而非技术细节。

用户反馈呈现明显分化。批评者指出,在处理复杂逻辑问题时,500B参数规模明显力不从心,怀疑所谓"横扫榜单"成绩来自特定实验环境优化。更有开发者测算其使用成本高于竞品模型。支持阵营则强调代码生成速度和多模态处理能力,特别提及该模型通过"Caitlyn Jenner测试"——这道曾让ChatGPT和Gemini折戟的性别认知题,成为Grok 4.2的亮点战绩。

争议焦点还涉及模型偏见问题。尽管马斯克宣称Grok 4.2保持中立,但测试显示其回答倾向与创始人观点高度吻合。对此马斯克回应称:"这还是个宝宝模型",并预告中大型版本即将推出。AI工程师Mark Krechman的爆料得到本人转发确认——当前版本实为"精简版",完整功能尚未释放。

在模型发布同期,xAI还推出Grok imagine视频生成模板,目前仅限iOS用户体验。这款马年主题创作工具,为争议中的产品矩阵增添新变量。随着公测推进,每周迭代机制能否兑现承诺,将成为决定Grok 4.2命运的关键因素。

武汉曜华激光科技:以技术革新驱动光伏检测,精度效率双突破赋能产业升级
公司以“精准、高效、稳定”为核心研发理念,专注于自动太阳能电池片IV分选仪、自动太阳能电池片IV分选机、自动IV分选仪、自动IV分选机、太阳能电池片IV分选仪等核心产品的研发与生产,为光伏企业提供从单机设备到…

2026-02-18

谷歌官宣2026开发者大会时间,AI眼镜及Gemini大模型更新将成重头戏
2月18日消息,据CNBC报道称,Alphabet 旗下谷歌公司正式宣布,其年度旗舰开发者大会 Google I/O将于2026年5月19日至20日在加州山景城总部举行,活动将同步通过官网向全球观众直播。 …

2026-02-18

三星加速全球能源转型:拉美工厂将全面启用绿色能源 碳中和目标再迈进
该公司日前宣布,计划在今年上半年将其在拉丁美洲的所有生产基地完全转换为可再生能源供电。一旦蒂华纳电视工厂的PPA协议最终签署,拉丁美洲也将成为三星又一个仅使用绿色能源运营的地区。 三星设备体验(DX)部门的目…

2026-02-18

睡眠耳机怎么选?五款实测高分睡眠耳机深度测评与选购指南
诸如索尼、漫友等深耕音频及睡眠场景的专业品牌,会持续投入人力物力在人体工学适配、亲肤材质研发以及助眠声学调校上,其产品在佩戴舒适度、隔音效果和舒缓音质的呈现上更具优势,对睡眠敏感人群而言也更具可靠性和友好度。…

2026-02-18

红米Turbo4清仓特惠!旗舰配置千元价,1199元起抢高性价比神机
红米Turbo4内置的6550mAh电池,由SEI膜自修复+高强度铜箔+澎湃G1芯片组成的"四年耐用"方案,在1600次循环后容量保持≥80%。 在这个价位段,红米Turbo4几乎将所有成本都投入到了核心体…

2026-02-18

2026春节临夏地质公园博物馆:探地质奇观,品古生物韵味,共赴新春之约
这里不仅展现了亿万年的地质传奇,更与新春的喜庆相结合,形成了独特的年味体验。 在这个寒假与新春交汇的时刻,博物馆推出了一系列精彩活动,包括“史前”NPC秘境漫游、国潮杂耍戏春擂台等,让每位游客都能在欢声笑语中…

2026-02-18