打败GPT-4,Claude 3成最强大语言模型!背后的Anthropic是什么来头?

打敗 GPT-4,Claude 3 成最強 LLM!背後 AI 新創 Anthropic 什麼來頭?

3月4日,美国新创人工智能公司Anthropic发布了下一代大型语言模型Claude 3系列,包括Claude 3 Opus、Claude 3 Sonnet、Claude 3 Haiku三种版本,其中Opus性能最强大,号称目前最强大的大模型,并且它不容易出错,也更安全;Haiku速度最快且最具成本效益;Sonnet速度比上一代Claude 2和Claude 2.1快2倍,智慧等级更高,可面对绝大多数AI工作负载。

Claude 3不仅拥有强大的文字生成能力,更是具有出售视觉功能,能够处理多种数据格式并对图象数据深入分析,包括照片、图形、图表等。然而Anthropic选择不为Claude 3增添图象生成功能。Anthropic CEO Dario Amodei透露,客户对于图象生成并没有强烈需求。

▲Anthropic针对Claude 3进行一系列符合产业标准的测试,其中Opus表现优于GPT-4。

聊天机器人很容易说出不真实的话,这个问题被称为AI“幻觉”,“幻觉率达到零是非常非常困难的事”,Dario Amodei这么说。Anthropic在最新推出的Claude 3试图解决这个问题,提供正确回复的可能性是旧版Claude两倍,而且编造内容的可能性更小。

Anthropic强调安全、负责任地开发AI,这么一来可能限制模型性能。比如,旧版Claude拒绝无害的问题查询,是因那些查询就Claude来看是有问题的,如今Claude 3拒绝查询的频率低很多。

Claude 3全系列发表时即支持200K上下文长度,三种版本都能接受超过100万个token输入。目前Opus和Sonnet提供开发者及在claude.ai网页版使用,至于Haiku将在未来几周内推出。此外,合作伙伴AWS也将Claude 3在Amazon Bedrock提供客户采用。

模仿人们对话的聊天机器人已经成为矽谷以及整个AI业界一大关注重点,技术快速进步也助长投资热潮。现在不只ChatGPT、Gemini,还有Anthropic开发的Claude竞争这块市场。

Anthropic是什么公司?

Anthropic可以说是除了OpenAI之外,最受瞩目的AI新创,不论是它的团队或募资能力,都相当吸睛。

《纽约时报》指出,Anthropic从2023年5月以来,已经接获超过73亿美元的投资。它的投资人包含Amazon、Google、Salesforce等,大多数的客户都是企业用户,从网络搜寻引擎商DuckDuckGo,到旅游指南出版社孤独星球(Lonely Planet)等。

该公司的CEO兼联合创办人阿莫迪是前Google电脑科学家,主要研究AI神经网络功能的应用。之后,他加入OpenAI,担任研究副总裁,负责GPT-2和GPT-3的建置工作,并领导许多关于AI使用的长期安全研究团队。

阿莫迪与来自OpenAI、Google、微软等知名公司的科学家和工程师,在2021年一起创立了Anthropic。他们的使命是,开发对人类有益,且与人类价值相一致的AI系统。因此,在机器伦理学、AI安全和对抗性训练等领域,投入了大量研究工作。

Anthropic也坦承,为了要安全、负责任的开发AI,有时会使他们AI系统的性能受限。例如,旧版本的Claude经常拒绝响应一些看似无害的查询,因为软件判断这些问题有害。但在新版本中,同样问题的发生频率会降低。

“”控制AI系统训练的科学仍然不完美,(即使)它每天都在变得更好,但它仍然不完美。”阿莫迪说。

Anthropic Claude 3是什么?有哪些功能?

Claude 3系列可依据模型能力与使用成本,分成适合处理轻量任务,拥有最快速度的Haiku;中间版本Sonnet和最强大的Opus,客户可自由选择最适合自己的版本。
它不仅可以支持文字聊天,更强调「接近即时的响应」;此外,你也可以分享图片、和它讨论事情,例如:「这是我家客厅,如果我想要空间看起来更温馨,你有什么建议?」

值得注意的是,Claude 3虽然可以理解图片,并针对图象进行分析(ChatGPT与Gemini也都有此功能),例如识别出2张图片中不同品种的狗,但却不会生成图片,“我们看到企业对这种需求较少”,Anthropic联合创办人丹妮拉·阿莫迪(Daniela Amodei)在接受彭博电视台采访时响应道。

根据Anthropic释出的基准评比数据,最强大的Claude3 Opus,在数学问题解决、编写程序码、常识理解和其他领域,都优于OpenAI的GPT-4和Google推出的Gemini。

虽然业内人士对于AI系统基准评比的效力、规则尚无一套标准,但知名的英国软件工程师,也是DataSette、Lanyrd创办人威尔森(Simon Willison),在自己经营的科技博客上表示,Claude 3 Opus的胜出是一件大事,因为在GPT-4发布12多个月以来,还没有其他模型能做到,有另一个研究小组终于达到这个里程碑,这无疑令人振奋。

0

付费内容

查看我的付费内容