您现在的位置是:首页  币资讯币资讯

OpenAI寻求合作伙伴生成用于训练AI模型的数据集

风清月明 2025-08-04 01:00:35 币资讯 已有人查阅

导读11月10日消息,OpenAI发文宣布,将与组织合作生成用于训练AI模型的公共/私有数据集,数据合作伙伴关系旨在“让更多组织能够帮助引导AI的未来”并“从更有用的模型中受益”。IT之家从博客获悉,OpenAI称:“为了最终使AI变得更加安全且造福于全人类,我们希望AI模型能够深入理解所有主题、行业、文化和语言,这需要尽可能广泛的训练数据集。”作为数据合作伙伴计划的一部分,OpenAI表示,它将收集“反映人类社会”且目前不易在线访问的“大规模”数据集。虽然该公司计划跨多种模式开展工作,包括图像、音频和视频,

11 月 10 日消息,OpenAI 发文宣布,将与组织合作生成用于训练 AI 模型的公共 / 私有数据集,数据合作伙伴关系旨在“让更多组织能够帮助引导 AI 的未来”并“从更有用的模型中受益”。

IT之家从博客获悉,OpenAI 称:“为了最终使 AI 变得更加安全且造福于全人类,我们希望 AI 模型能够深入理解所有主题、行业、文化和语言,这需要尽可能广泛的训练数据集。”

作为数据合作伙伴计划的一部分,OpenAI 表示,它将收集“反映人类社会”且目前不易在线访问的“大规模”数据集。虽然该公司计划跨多种模式开展工作,包括图像、音频和视频,但它特别寻求跨不同语言、主题和格式“表达人类意图”(例如长篇写作或对话)的数据。

OpenAI 表示,如有必要,它将与组织合作,结合使用光学字符识别和自动语音识别工具,对训练数据进行数字化,并在必要时删除敏感或个人信息。

OpenAI 希望创建两类数据集:一类是公开的开源数据集,供任何人在AI模型训练中使用;另一类是专门用于训练私有AI模型的私有数据集

OpenAI 表示,私有集适用于希望保持数据私密性但希望 OpenAI 的模型更好地理解其领域的组织;目前,OpenAI 已与冰岛政府和 Miðeind ehf 合作,提升了 GPT-4 在说冰岛语方面的能力,并与自由法律项目合作,加强了其模型对法律文件的理解

【来源:IT之家】

欧意交易所最新推荐
OK交易所下载 USDT钱包下载 比特币平台下载
挖比特币方法 买稳定币教程 钱包注册指南

本文标签:

很赞哦! ()

极氪007惊艳登场!首款三厢轿车 Hidden Energy 前瞻设计引领未来
« 上一篇 2025-08-04
畅快《原神》不掉帧、VR沉浸式体验,今年双11你该买他们了!
下一篇 » 2025-08-04