数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

Claude 3系列模型实测:华为Mate50错认成Mate40 性能未超GPT-4

2024-03-06来源:数据世界编辑:星辉

【数据世界网】3月6日消息,近日Anthropic公司发布的Claude 3系列模型备受瞩目,甚至有声音称其为迄今为止速度最快、功能最强大的人工智能模型。然而,这一称号是否名副其实仍有待验证。据国内媒体对Claude 3系列中最强的Claude 3 Opus进行的实测显示,在与GPT-4的对比中,Claude 3 Opus在图片识别环节出现失误,将华为Mate50手机错认为Mate40。

在视觉能力方面,相较于GPT-4,Claude 3 Opus展现了更多细节,但准确率却不尽如人意。测试中,媒体上传了华为Mate50的手机宣传图,并分别向Claude 3 Opus和GPT-4提问:“这是什么手机?”Claude 3 Opus虽然正确识别出这是华为Mate系列产品,但却将图中的三款手机均误认为是“Mate40”。而GPT-4则表现稍逊一筹,表示无法确定具体型号,仅提到华为Mate系列过去曾采用过类似的设计布局。

经过一系列测试对比,该媒体得出结论:实测结果显示,Claude 3并未超越GPT-4。尽管如此,Anthropic公司作为一家成立不到三年的大模型公司,其核心成员来自ChatGPT-4的开发商OpenAI,其发展潜力仍不容小觑。未来,Claude 3系列模型有望在人工智能领域取得更多突破和进展。

同时,据数据世界了解,人工智能模型的准确率和识别能力受多种因素影响,包括训练数据、模型架构和算法优化等。因此,对于Claude 3系列模型的性能表现,仍需持续关注和验证。

苹果折叠屏iPhone新动态:尺寸小于预期,折叠后神似护照本便携性佳
来源:环球网 【环球网科技综合报道】备受关注的苹果首款折叠屏iPhone再曝新动态。12月28日,据外媒macrumors报道,设计师本·格斯金制作并曝光了该设备的实体模拟模型,令人意外的是,这款传闻明年发…

2025-12-29

预算有限想越级体验?iQOO Z10 Turbo Pro凭实力成高性价比之选
如果你是一个注重手机实际性能、讨厌电量焦虑,并且追求流畅体验的用户,那么iQOO Z10 TurboPro无疑是当前价位下一个非常值得考虑的选择。iQOO Z10 Turbo Pro正是这样一款产品——它…

2025-12-29

2025年发黑热处理服务商优选指南:南通汉科等六家企业技术实力与适配场景全解析
推荐理由: ① 深厚的技术积淀与研发导向:公司拥有超过十年的热处理技术经验积累,并持续进行技术升级,例如早年便从国外引进先进的渗氮炉等专业设备,构建了涵盖渗碳、碳氮共渗、真空渗碳、等温淬火、深冷处理等在内的…

2025-12-29

三星Galaxy A56:精准击中用户痛点,均衡体验成就高性价比之选
三星Galaxy A56精准捕捉到几类核心用户:需要长续航的实用主义者、注重手机质感的价值追求者,以及预算有限但想要均衡体验的学生和上班族。这正解释了三星Galaxy A56为什么被称为高性价比手机——在…

2025-12-29

中国历时15年自主攻关 国际热核聚变实验堆校正场线圈采购包在合肥圆满收官
12月28日,由中国科学院合肥物质科学研究院等离子体物理研究所承担的国际热核聚变实验堆(ITER)校正场线圈采购包,在合肥完成全部制造任务并交付。最后一批4个线圈的竣工,标志着该项目圆满收官。 校正场线圈采购…

2025-12-28