谷歌上周推出了其全新AI模型Gemini,迅速成为整个科技行业关注的焦点。Gemini是一个训练了文本、代码、音频、图像和视频多种信息的多模态AI系统。它分为三个版本:

手机端的Gemini Nano能在Pixel 8这类智能手机本地运行;Gemini Pro现提供搜索引擎Bard使用,未来可扩展到其他谷歌服务;性能最强的Gemini Ultra号称在多项AI评测试中胜过最新GPT模型,但尚未对外发布。

谷歌似乎极力吹捧Gemini的优势。它声称Gemini Ultra在编程、数学和阅读理解上优于GPT-4,并首次在57项综合语言理解测试中打败“人类专家”。它还发布视频展示Gemini处理手绘图像和生成音乐的流畅响应,大有比肩ChatGPT的架势。

但业内分析指出,与之相比的GPT-4并非最新版本,真正支持搜索引擎Bard的Gemini Pro也仅优于旧版GPT-3.5。更遗憾的是,日前有消息披露该宣传视频存在误导——Gemini并未像显示的那样连续处理视频流,其“实时”反应只是对静态图像的编组;生成的吉他音频也仅仅是检索所得。

谷歌渴望超越OpenAI,以至于对其杀手锏Gemini能力的渲染失实且让人难以置信。这也使谷歌此次大张旗鼓的发布蒙上了一层阴影。

相关阅读  GPT-4相对GPT-3,有哪些新升级?

Categorized in: