OpenAI寻求合作伙伴生成用于训练AI模型的数据集

干货分享4个月前发布 Youzhizhan
1,530 0


OpenAI表示:”为了最终使AI更安全,造福全人类,我们希望AI模型能够深入了解所有主题,行业,文化和语言,这需要尽可能广泛的训练数据集。”

OpenAI寻求合作伙伴生成用于训练AI模型的数据集

It之家于11月10日宣布,OpenAI将与组织合作生成用于训练AI模型的公共/私人数据集。 数据合作伙伴关系旨在”使更多组织能够帮助指导人工智能的未来”和”从更有用的模型中受益。”

IT House从博客中了解到,OpenAI表示:”为了最终让AI更安全,造福全人类,我们希望AI模型能够深刻理解所有主题,行业,文化和语言。 这需要尽可能广泛的训练数据集。”

作为数据合作伙伴计划的一部分,OpenAI表示将收集”反映人类社会”的”大规模”数据集,目前无法在线轻松访问。虽然该公司计划跨多种模式工作,包括图像,音频和视频,但它专门寻求跨不同语言,主题和格式”表达人类意图”的数据(例如长篇写作或对话)。

OpenAI表示,如果有必要,它将与组织合作,结合使用光学字符识别和自动语音识别工具,将培训数据数字化,并在必要时删除敏感或个人信息

OpenAI希望创建两种类型的数据集:一个公共和开源的数据集,任何人都可以在人工智能模型训练中使用,以及一组用于训练专有人工智能模型的私有数据集

OpenAI表示,personal sets适用于希望保持数据私有但希望OpenAI模型更好地理解其领域的组织;到目前为止,OpenAI与冰岛政府和Miðeind ehf合作,提高GPT-4讲冰岛语的能力,并与自由

OpenAI寻求合作伙伴生成用于训练AI模型的数据集

[ad]
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...