会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 麻省理工科技评论称:数据是生成式AI的基础!

麻省理工科技评论称:数据是生成式AI的基础

时间:2024-07-02 03:25:16 来源:带水拖泥网 作者:小程序 阅读:145次

麻省理工科技评论称:数据是生成式AI的基础

划重点:

- 💡 预训练的麻省大型语言模型(LLM)如 GPT-4和 Gemini 很棒,但真正的理工竞争优势来自将 LLM 与私有数据相结合。

- 💡 组织在连接 GenAI 并在需要时、科技以适当格式、评论清洁和准备充分地向 GenAI 应用程序提供数据方面准备得如何,称数成式础存在疑问。据生

- 💡82% 的麻省调查对象表示,扩展 AI 或 GenAI 是理工他们的首要任务,83% 的科技组织已经确定了要用于 AI 或 GenAI 的数据来源。

CSS站长资源(ChinaZ.com)5月31日 消息:预训练的评论大型语言模型(LLM)如 GPT-4和 Gemini 备受组织关注,他们渴望利用 LLM 构建聊天机器人、称数成式础副驾驶等应用。据生根据麻省理工科技评论的麻省最新报告,名为 “C 级领导人的理工 AI 准备情况”,该报告是科技代表 ETL 供应商 Fivetran 进行的调查发现,将 AI 或 GenAI 扩展是82% 受访高管的 “首要任务”。

图源备注:图片由AI生成,图片授权服务商Midjourney

调查发现,83% 的组织已经确定了要用于 AI 或 GenAI 的数据来源。但是,组织在实际连接 GenAI 并在需要时、以适当格式、清洁和准备充分地向 GenAI 应用程序提供数据方面准备得如何,存在疑问。同时还需要确保不会危及隐私或安全。

报告指出,平均来说,组织需要 “超过十几种不同的技术来收集关于其数据的所有智能信息,相同数量的技术来集成、转换和复制数据”,这带来了巨大的困难。由于过去为中心化数据仓库项目开发的数据集成和 ETL 工具可能不适合新的 GenAI 用例,因此获取更好的数据集成和 ETL / 数据管道工具显然是一项重要任务。

此外,调查发现,虽然64% 的调查对象表示数据集成和 ETL / 管道工具是其前两个 GenAI 投资重点之一,但35% 的人将数据湖视为优先事项,而31% 的人将数据转换工具视为优先事项。数据目录和 LLM 投资的份额仅为7%,而矢量数据库和计算层位于中间位置。组织在构建数据基础时面临着许多挑战,包括数据集成和构建数据管道、数据治理和安全以及数据质量等问题。

调查还发现,组织在数据治理、合规和报告方面存在诸多挑战。大量调查对象指出,准备数据供 AI 使用的最大挑战是数据治理和安全(44% 的受访者提到),以及数据集成或管道(45% 的受访者提到)。然而,深入调查数据却显示了一种明显的分歧。特别是,调查显示,对安全和治理的积极关注主要集中在政府和金融服务机构,而在制造业、零售业和其他行业的科技高管中,对安全和治理的担忧并没有同样的比例。

“组织可能无法控制某人在业务应用程序中使用数据并将其发送给生成式 AI 模型。这些都是重要的问题。” 调查报告引述 IDC 的 Bond 在报告中说道。建立强大的数据基础是 GenAI 成功的前提条件。如果组织不先构建坚实的数据基础,他们的数据科学家将在基本的数据集成和清理工作上浪费时间。

(责任编辑:自媒体)

相关内容
  • 一汽-大众公布限时优惠政策:涵盖迈腾、速腾、宝来等车型
  • Gemini 1.5官网体验入口 谷歌新AI助手模型怎么使用方法教程指南
  • AIGC之后,AI Agent又在颠覆什么?
  • 报道称:今年全球富豪财富增长几乎来自人工智能
  • 问界夺新势力销冠!余承东:“余大嘴”变成“余小嘴”了
  • 回城后的小狗患上节后综合症:眼神呆滞 过年没玩够
  • 美国专利商标局宣布与埃森哲签署7千万美元人工智能专利搜索工具合同
  • 星巴克推出龙年限定年丰咸香拿铁:68元 红烧肉风味
推荐内容
  • 12306回应高铁超载:不建议买短补长 补票需要咨询列车员
  • 春节期间最火品牌!vivo在W4-W6期间获中国智能手机市场销量市占率
  • 支持易四方泊车等功能:比亚迪仰望U9车身细节曝光
  • 谁还去电影院:网友吐槽短视频平台现多部热门电影屏摄直播 官方回应了
  • 30年来头次见!安徽一女子拍下罕见“冰针”雪:形成条件苛刻
  • 2024年抖音春节消费报告:生活服务业日均消费规模同比增长153%