会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 大型科技公司拥才有承担 AI 训练数据成本的能力!

大型科技公司拥才有承担 AI 训练数据成本的能力

时间:2024-07-02 04:01:07 来源:带水拖泥网 作者:资讯 阅读:781次

大型科技公司拥才有承担 AI 训练数据成本的能力

划重点:

⭐️ AI 模型训练数据的大型担重要性越来越显著,使得除了最富有的科技科技公司外,其他公司难以承担成本。公司

⭐️ 数据采集与整理对生成式 AI 的拥才有承改进至关重要,这为大型科技公司带来了竞争优势。练数

⭐️ 尽管一些非营利组织正在尝试开放式数据集的据成创建,但大型科技巨头仍占据着 AI 训练数据市场的大型担主导地位。

CSS站长资源(ChinaZ.com)6月3日 消息:AI 的科技发展离不开数据,而这种数据的公司成本越来越高,这使得除了最富有的拥才有承科技公司外,其他公司难以承担这一成本。练数根据去年 OpenAI 的据成研究人员 James Betker 的文章,AI 模型的大型担训练数据是决定模型能力的关键因素。传统的科技 AI 系统主要是基于统计机器,通过大量示例来猜测最 “合理” 的公司数据分布,因此模型所依赖的数据量越大,性能就越好。

AI 研究非营利机构 AI2的高级研究科学家 Kyle Lo 指出,Meta 的 Llama3模型在数据量方面明显优于 AI2的 OLMo 模型,这解释了其在许多流行 AI 基准测试中的优势。然而,并不是数据量越大,模型性能就会线性提升,数据质量和整理同样重要,有时甚至比数量更重要。一些 AI 模型是通过让人类标注数据来进行训练的,质量较高的标注对模型性能有巨大影响。

然而,Lo 等专家担心,对大型、高质量训练数据集的需求将 AI 发展集中在少数具备数十亿美元预算的公司手中。尽管一些非法甚至犯罪行为可能会对数据获取方式提出质疑,但技术巨头凭借资金实力能够获取数据许可。这些数据交易的过程并未促进一个公平开放的生成式 AI 生态系统,让整个 AI 研究社区备受其害。

一些独立、非营利性的组织尝试开放大规模数据集,如 EleutherAI 和 Hugging Face,但它们是否能赶上大型科技公司的步伐仍是一个未知数。只有当研究突破技术壁垒,数据收集和整理成本不再是问题时,这些开放性的数据集才有希望与科技巨头竞争。

(责任编辑:热点)

相关内容
  • 申通快递对12省份快件提价 以应对恶劣天气
  • 小米汽车APP登顶苹果App Store免费榜
  • 雷军回应送张颂文小米SU7:这就是张老师喜欢的橄榄绿 4月3日开始交车
  • 高端开局的Q1剧集市场,头部玩家当属腾讯视频
  • 苹果Vision Pro发售:竞争对手Meta单日大涨20%创纪录!
  • 小米SU7九款颜色怎么选 雷军:推荐橄榄绿 低调还不加钱
  • 王婆回应已婚男相亲事件:“自带剧本”的人不要凑热闹
  • 特斯拉中国 Model Y 全系涨价 5000 元 售价 263900 元起
推荐内容
  • Meta开发AudioSeal技术,可以秘密为 Deepfake 音频添加水印
  • Living Images:输入网址就能一键打造爆款电商主图
  • 成新一代许愿池!网友喊话雷军能不能生产一下相机
  • 特斯拉中国 Model Y 全系涨价 5000 元 售价 263900 元起
  • 高速服务区充电1小时花99元 官方回应:价格按标准执行 当时是高峰期
  • 芯片战争早已打响,谷歌15个月打造TPU,欲和老黄平起平坐