谷歌推出AI大模型Gemini股价盘前大涨3%

据《新科学家》杂志网站报道,谷歌公司于6日宣布推出了一款名为Gemini的全新人工智能模型。该模型在一系列智力测试中展现出的卓越表现声称超越了OpenAI的GPT-4模型以及被视为“专家级”的人类。

Gemini模型已经开发出三个不同版本,分别是Nano、Pro和Ultra,它们在大小和功能方面都有所增加。谷歌公司拒绝透露Pro和Ultra版本的规模、参数数量以及训练数据的规模和来源等信息。

Gemini的最小版本Nano旨在能够在智能手机上本地运行。实际上,Nano包含两种模型:一种针对速度较慢的手机,拥有18亿个参数,另一种适用于功能更强大的设备,拥有32.5亿个参数。据传闻,GPT-4模型包含高达1.7万亿个参数,而Meta的LLAMA-2则包含700亿个参数。

据谷歌称,Gemini的中档版本Pro在击败了其他一些模型,比如OpenAI的GPT3.5模型方面表现出色,但更强大的Ultra版本则超越了所有现有人工智能模型的能力。在行业标准MMLU基准测试中,其得分达到了90%,而被认为是“专家级”的人类预计能达到89.8%。

这是人工智能首次在测试中超越了人类,并且Gemini的得分也是现有模型中最高的。这项测试涉及了一系列复杂的问题,涵盖了逻辑错误、日常场景中的道德问题、医疗、经济和地理等主题。

在同一测试中,GPT-4的得分为87%,LLAMA-2的得分为68%,Anthropic Claude 2的得分为78.5%。而Gemini在其他9项常见基准测试中有8项击败了所有这些模型。

Pro版本的Gemini模型将会整合到谷歌今年3月推出的在线聊天机器人Bard中。谷歌公司表示,名为Bard Advanced的新版本将于明年初推出,并搭载更大容量的Gemini Ultra模型。

谷歌“深度思维”部门的艾力·柯林斯表示,Gemini是该公司规模最大、能力最强的模型,同时也是最通用的模型,意味着它能够适应各种任务。与目前许多专注于文本的模型不同,Gemini接受过文本、图像和声音方面的训练,据称可以接受所有这些格式的输入并提供输出。

柯林斯表示,Gemini在“几乎每个领域都处于领先地位”,并且仍在测试中,以确定其在不同媒体、语言和应用程序中的适用性。

在发布会上,Gemini并没有提供可供测试的版本,但谷歌展示了人工智能解决家庭作业问题和处理实时视频输入的演示。据称,Gemini比以往的模型更擅长开发软件。去年,深度思维部门发布了一款名为AlphaCode的人工智能代码生成器,该工具可以击败50%的人类开发人员,而新发布的Gemini声称能够击败85%的人类编程师。

Author: eclipse