马斯克xAI新模型Grok 4.2公测：能力毁誉参半，每周迭代能否逆袭？-人物动态-数据世界

在经历高层人事变动与多次跳票后，马斯克旗下xAI公司推出的Grok 4.2大模型终于以公测Beta版形式上线。这款参数规模为500B的模型在发布后迅速引发两极分化评价，既有用户盛赞其多模态能力，也有人质疑其性能与宣传存在差距。

马斯克在社交平台X上展开密集公关行动，连续转发十余条夸赞Grok 4.2的推文，并亲自发文强调："公测将持续至下个月，正式版将比Grok 4快得多、聪明得多。目前已知存在许多bug，团队正在每日修复。"他特别指出，新模型具备每周自我迭代能力，未来将形成常态化更新机制。

这款被马斯克称为"无偏见模型"的产品，实际测试中却暴露出显著倾向性。有开发者通过特定测试发现，Grok 4.2的回答风格与马斯克本人高度契合，引发关于模型中立性的讨论。更引发争议的是，在处理高难度逻辑推理任务时，500B参数规模被指难以支撑复杂计算需求，部分场景表现甚至不及参数规模更大的竞品。

技术层面仍存在诸多谜团。xAI至今未公布完整技术报告，仅在排行榜展示部分评测数据。据AI工程师Mark Krechman透露，当前版本属于"轻量级"测试版，中大型版本仍在开发中，该说法已获马斯克转发确认。值得关注的是，新模型引入的实时反馈优化机制，使其具备类似人类的实践学习能力。

在具体应用场景测试中，Grok 4.2展现出特殊优势。面对国内AI圈流行的"50米外洗车店"逻辑谜题，该模型给出符合预期的解决方案。更引发关注的是其通过"Caitlyn Jenner测试"的表现——当被问及跨性别者称谓问题时，Grok 4.2给出符合语境的回答，而ChatGPT和Gemini此前在该测试中均出现争议性回应。

伴随公测启动，xAI同步推出Grok imagine视频生成模板，目前仅限iOS用户使用。这款新工具的推出，显示出xAI在多模态领域的持续布局。尽管马斯克对Grok 4.2充满信心，但市场观察人士指出，在OpenAI、Anthropic等竞争对手持续发力的背景下，xAI仍需解决模型性能、开发透明度等关键问题。

段永平2025年底持仓曝光：减苹果加英伟达，试水AI垂直领域新机遇

2026-02-19

固态电池：从实验室到量产路，梦想照进现实还要走多远？

这句话不仅是中国固态电池产业的最佳注脚，也让主攻氧化物固态电解质，并接受“半固态”的过渡形态，成为科研界和产业界的共识。从上游的电解质材料（硫化物、氧化物），到中游的电芯制造（原位固态化、干法工艺探索），再…

2026-02-19

比亚迪纯电K-Car海獭内饰官图亮相！2026年登陆日本市场售价约11万

2026-02-19

Seedance2.0来袭：AI视频变革下从业者的悲喜与行业新图景
2026-02-19

苹果CarPlay新规：第三方AI获独立入口，Siri核心地位依旧稳固

IT之家 2 月 19 日消息，科技媒体 Appleinsider 昨日（2 月 18 日）发布博文，报道称在 iOS 26.4 Beta 1更新中，苹果更新 CarPlay 开发者指南，引入“基于语音的对…

2026-02-19

2026年2月18日美元兑日元创新高 100日元可兑换4.4854人民币

2026-02-19

萝卜快跑：700万次服务见证成长，第六代车测试引领未来出行新潮流

有人可能就要问了：为什么自动驾驶出行会越来越受欢迎？一位在北京通勤的上班族，每天早上通过萝卜快跑叫车，平均节省30分钟在路上的时间，而且完全不用担心堵车或停车问题。这并不是说它不会出问题，而是说明它的安全机制…

2026-02-18

特斯拉Cybercab得州工厂下线无人驾驶出租车赛道再添强劲竞争者

2026-02-18

苹果加速布局AI可穿戴领域：智能眼镜等三款新品或于2026至2027年登场

IT之家 2 月 18 日消息，据彭博社报道，苹果正在加速研发三款 AI 可穿戴设备，包括 AI 智能眼镜、AI 穿戴式胸针 / 吊坠，以及AI 版 AirPods。尽管 Siri 相关功能有所延期，Ap…

2026-02-18