超越GPT-4,OpenAI前高管发布"最强"大模型
3月5日消息,美国时间周一,人工智能初创公司Anthropic发布了其最新的人工智能模型Claude 3。该公司声称,Claude 3是迄今为止他们推出的速度最快、性能最强的模型。Claude 3分为三个不同的版本:Opus、Sonnet和Haiku。
据Anthropic介绍,三个版本中,Opus的能力最为出色,它在多项行业基准测试中的表现超越了OpenAI的GPT-4和谷歌的Gemini Ultra。这些测试覆盖了从本科生知识水平到研究生推理能力和基础数学等领域。
Claude 3首次引入了多模态支持功能,用户现在能够直接上传照片、图表、文档等各种非结构化数据,由Claude 3进行分析并给出相应的答案。
此外,与Opus相比,Sonnet和Haiku两个版本虽然参数规模更小,但相应的使用成本也更低。从本周一起,Opus和Sonnet两个版本将在159个国家上线,而Haiku版本也将很快推出。尽管Anthropic没有公开Claude 3的具体训练时间和成本,但已经有包括Airtable和Asana在内的多家企业参与了对这些模型的A/B测试。
仅一年前,Anthropic还是一家由前OpenAI研究高管创立的新兴人工智能初创企业,尽管完成了A轮和B轮融资,但其产品尚未引起市场广泛关注。然而,短短一年内,Anthropic已经成为业界最受瞩目的人工智能初创企业之一,得到了包括谷歌、Salesforce和亚马逊等科技巨头的支持。
该公司的产品不仅在企业领域与ChatGPT等生成式人工智能模型展开了激烈竞争,而且也逐渐渗透到消费者市场。在过去一年里,这家初创企业完成了五笔不同的融资,总额约为73亿美元。
根据PitchBook的数据,生成式人工智能领域在过去一年中实现了爆炸式增长,2023年的投资额达到了创纪录的291亿美元,涉及近700笔交易,同比增长超过260%。同时,生成式人工智能已成为各大公司财报电话会议中的热门话题。尽管学者和伦理学家对这项技术可能带来的偏见传播趋势表示担忧,但生成式人工智能仍然迅速渗透到学校、在线旅游、医疗行业、在线广告等各个领域。
在一次采访中,Anthropic的联合创始人丹妮拉·阿莫代伊(Daniela Amodei)透露了公司内部的团队规模和工作分配情况。她表示,大约60至80人致力于核心人工智能模型的研发工作,而120至150人从事相关的技术工作。在今年7月的一份声明中,阿莫代伊还提到,在Claude 3模型的最后一轮迭代中,由30至35人组成的团队直接参与了研发,而总共约150人提供了支持。
Anthropic表示,Claude 3模型具有强大的处理能力,每次可处理多达约15万个单词,相当于一本长篇小说的长度,例如《白鲸记》(Moby Dick)或《哈利·波特与死亡圣器》(Harry Potter and the Deathly Hallows)。与此相比,先前版本的模型仅能处理7.5万个单词。用户可以将大型数据集输入模型,并请求以备忘录、信件或故事的形式提供摘要。而与之相比,ChatGPT模型的单次处理能力大约为3000个单词。
在风险应对方面,阿莫代伊表示,Claude 3相较于先前版本有了显著进步。她解释说:“在努力打造一种高度无害的模型时,Claude 2在某些情况下会避免给出回答,尤其是当有人提起敏感或具有争议性的话题时,Claude 2的回答可能会更为保守。”
Anthropic还指出,Claude 3对用户的提示有着更深入的理解。多模态功能——即为生成式人工智能添加照片、视频等输入选项——无论是用户自行上传还是通过人工智能模型创建,都迅速成为行业内的一大热点。
OpenAI首席运营官布拉德·莱特卡普(Brad Lightcap)在去年的一次采访中表示:“现实世界是多模态的。考虑到我们人类如何处理信息、与世界互动,比如我们所看到、听到以及谈论的内容,可以发现,这个世界远比单纯的文字要丰富得多。因此,仅仅依靠文本和代码作为单一界面展示模型的功能和作用是远远不够的。”
然而,随着多模态技术和人工智能模型的复杂性不断增加,潜在的风险也在逐渐增加。谷歌最近不得不暂停其Gemini聊天机器人的图像生成功能,原因是用户发现了历史错误和令人不安的回答,这些问题在社交媒体上迅速传播开来。
不同于此,Anthropic的Claude 3模型并不生成图像,而是允许用户上传图像和其他文件进行分析。阿莫代伊表示:“没有任何模型是完美的。我们始终在努力确保模型在功能和安全性方面达到最佳平衡。尽管如此,模型在某些情况下仍可能产生不准确的输出。”
加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码