Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 34|回复: 0
打印 上一主题 下一主题

ChatGPT 从哪里获取数据?

[复制链接]

6

主题

6

帖子

22

积分

新手上路

Rank: 1

积分
22
跳转到指定楼层
楼主
发表于 2024-2-15 14:06:29 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
您是否想知道 ChatGPT 在与您交谈时从哪里获取大量信息?你不是一个人。许多用户对从人工智能中流出的看似无穷无尽的知识流感兴趣,激发了对其数据源的好奇。 ChatGPT 到底从哪里获取数据? 在我们最新的博客文章中,我们将揭开这个大型语言模型的各个层面,以揭示其信息框架的具体细节。 我们将探讨庞大的数据集如何成为 ChatGPT 响应的基础,并讨论是什么使其成为生成类人文本的强大工具。 因此,请耐心等待,我们将研究 ChatGPT 从何处获取数据以及如何解决其局限性。 获取制作可排名、转化和获胜的 AI 内容的终极指南。 获取制作可排名、转化和获胜的 AI 内容的终极指南。 名 电子邮件地址 订阅 目录: ChatGPT 大脑背后的架构 ChatGPT 广泛的训练数据世界 ChatGPT 从哪里获取数据? ChatGPT 如何从人类交互中学习 维基百科和 Web 内容在训练 ChatGPT 中的作用 利用网络百科全书 公共网页作为人工智能的学习材料 ChatGPT 的局限性和挑战 应对错误信息挑战 减轻社会偏见 常见问题解答 – Chatgpt 从哪里获取数据 ChatGPT 从哪里获取信息? ChatGPT 是根据什么进行训练的? ChatGPT 中的数据准确度如何? OpenAI 如何获取其数据? 结论 ChatGPT 大脑背后的架构 深入了解 ChatGPT 的内部结构,您会发现一个突破性的人工智能,称为生成式预训练 Transformer 或 GPT 模型。

这种架构使 ChatGPT 等系统能够抓取并吐出非常人性化的文本。 GPT 就像一个虚拟的图书馆员,脑子里藏着大量的书籍。想象一下,您可以向图书管理员询问有关任何主题的任何问题,他们会使用他们读过的所有不同书籍中的内容为您写出来。 ChatGPT 已从互联网上读取了大量文本——从新闻文章到 2023 年 4 月之前的社 巴哈马电话号码 列表 交媒体帖子。它根据这些信息生成新的文章,可以回答问题、创作故事,甚至帮助完成任务。它不只是吐出所读到的内容;相反,每次有人提出要求时,它都会混合它所知道的所有内容,以提供新鲜且相关的内容。 图片来源: 扎皮尔 ChatGPT 广泛的训练数据世界 ChatGPT 深入挖掘在线知识的各个角落,积累了从经典文学到流行博客文章的不拘一格的组合。这种广泛的多样性确保它可以用看似无限的常识来谈论几乎任何你扔给它的东西。 我们在这里谈论的不是表面的东西;而是。这个人工智能工具很深入。它从截止日期之前发布的所有内容中汲取灵感,包括内容丰富的维基百科文章和各种公共网页,这些网页提供了对于生成连贯响应至关重要的现实世界背景。 用数字来形容文字:它的 DNA 由大量不同的文本组成,因此像您这样的用户可以进行从莎士比亚到量子物理学的对话,而不会错过任何一个节拍。



图片来源 从哪里获取数据 ChatGPT 数据来自互联网上的各种来源,包括: 书籍:各种书籍的摘录和文本,涵盖不同的体裁、主题和语言。 社交媒体:来自 Twitter、Facebook 等各种社交媒体平台的帖子、评论和讨论。 维基百科:来自多语言百科全书维基百科的文章和内容,涵盖广泛的主题。 新闻文章:来自不同新闻来源和渠道的新闻文章,提供有关时事和历史背景的信息。 语音和音频录音:口语转录本以及可能已转换为文本的音频数据。 学术研究论文:来自不同学科的科学和学术期刊、出版物和研究论文的文本。 网站:来自互联网网站的内容,包括博客、公司网站和其他在线资源。 论坛:来自 Reddit 和 Quora 等在线论坛和留言板的讨论和对话。 代码存储库:来自 GitHub 等在线代码存储库的文本和代码片段。 ChatGPT 的训练数据包含广泛的文本,使其具有多功能性并能够提供有关广泛主题和科目的信息。为了维护隐私和版权合规性,不会披露每个来源的数据的确切分布和比例。 OpenAI 使用许可数据、人类培训师创建的数据以及网络上公开的文本来训练 ChatGPT 模型。本次培训分两个阶段进行: 1. 预训练:在此阶段,语言模型在互联网上公开的大型文本语料库上进行训练。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Comsenz Inc.  

GMT+8, 2024-5-5 07:03 , Processed in 0.034963 second(s), 14 queries , Apc On.

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表