谷歌Gemini1.5新功能揭秘:上下文挑战重现准确性
时间:2024-07-02 04:08:08 来源:带水拖泥网 作者:资讯 阅读:180次
CSS站长资源(ChinaZ.com)2月21日 消息:近日,谷歌Google Gemini1.5推出了一项令人瞩目的新功下文性技术突破,该版本引入了一个拥有高达一百万个令牌的秘上上下文窗口功能。这项新功能旨在处理完整的挑战书籍甚至电影,其准确性关注。重现准确
尽管Gemini1.5的谷歌上下文窗口容量庞大,但可能仍存在不准确再现信息的新功下文性可能性。在“海底捞针”测试中,秘上该系统需要提取多达100条特定信息,挑战但平均准确度仅在60%至70这项任务相对于复杂文档的重现准确摘要撰写而言仍然要简单一些。
值得一提的谷歌是,在谷歌对维克多·雨果的新功下文性《悲惨世界》进行的更复杂的测试中,他们提出了100个问题,秘上共涉及710,挑战000个标记,重现准确并使用“归因于已识别来源”的方法进行答案评估。结果显示,在人工评估中,80% 的答案可归因于源文档,而在机器评估中则有91% 的答案可归因于源文档。然而,这一基准倾向目前的权威及其与原著作者之间存在细微的差异。
在“大海捞针”测试中,模型必须在上下文窗口中找到一条信息。这与LLM的实际应用场景关系不大。 |图片:谷歌
尽管社交媒体上对Gemini1.5的积极评价络并不绝,但即将对其准确性进行更深入的评估。大多数评论焦点于功能测试,缺乏对源材料的深入了解。如果信息检索的可信度不高,即使在复杂的查询下,巨大的上下文窗口可能仍然存在问题。
可见, Gemini1.5Pro 提供了令人印象深刻的技术突破,但在实践中,提取复杂的信息仍然是一个挑战。如果其可靠性低于90%,那么实际中的巨大容量的上下文窗口运用中可能并不具备专业的帮助。
(责任编辑:热点)
最新内容
- ·营收占比 7%,库克谈欧洲App Store新规:竭尽所能保护用户隐私
- ·生产力爆棚!华为新平板预置自研绘画软件“天生会画”
- ·马斯克:SpaceX和星链都没用AI AI在这些方面表现糟糕
- ·极氪007人机大战!机械车位自动泊车战绩远超人类司机
- ·比尔盖茨中国小年送祝福:大家龙年幸福安康 对未来充满乐观和希望
- ·生成式人工智能岗位需求暴涨超300% 年薪超40万元
- ·全新iPad双层OLED技术被抢先发布,领先者竟是这家厂商
- ·Agent Hospital:一个先进的虚拟AI医院模拟平台
- ·AI智能剪辑软件AIMIX 支持短视频批量混剪、文案、字幕生成、语音合成等
- ·苹果发布新款iPad Air 国行售价4799元起
热点内容
- ·Media2Face:支持语音等多模态引导生成3D面部动态表情
- ·批00后已经开始做家政了:打扫3天赚了5000多
- ·官方发布耀斑黄色预警:未来3天仍有可能爆发M/X级以上耀斑
- ·vivo X100 Ultra前摄搭载JN1传感器,4K 60 帧拍摄、自动对焦
- ·假冒演员靳东用微信实施诈骗 8人获刑:骗取金额超31万
- ·男孩卡喉冲进超市老板一招救命 海姆立克急救法该怎么用?
- ·AI日报:干翻AI PC!苹果M4芯片首发;GoEnhance可生成粘土风格视频;DeepSeek-V2模型已在魔搭社区开源;苹果将添加AI图片擦除功能
- ·央视主持人版《庆余年》有声剧阵出炉:尼格买提、马凡舒
- ·比格PPT:AI一键生成精美演示文稿 具有智能排版功能
- ·DeepSeek V2模型在哪下载 DeepSeek V2在线体验地址多少