ChatGPT 国内目前是无法正常访问的，想要试一下，首先你需要懂得编程php Java等语言，你有一定的计算机基础可以看下文章最后的视频介绍，会帮助你搭建ChatGPT。

ChatGPT官网（国内需访问外网德国美国）：https://openai.com/blog/chatgpt/

ChatGPT：优化对话的语言模型

已经训练了一个名为 ChatGPT 的模型，它以对话方式进行交互。对话格式使 ChatGPT 可以回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。ChatGPT 是InstructGPT的兄弟模型，它经过训练可以按照提示中的说明进行操作并提供详细的响应。

方法

我们使用与InstructGPT相同的方法，使用来自人类反馈的强化学习 (RLHF) 来训练该模型，但数据收集设置略有不同。我们使用监督微调训练了一个初始模型：人类 AI 训练员提供对话，他们在对话中扮演双方——用户和 AI 助手。我们让培训师可以访问模型编写的建议，以帮助他们撰写回复。我们将这个新的对话数据集与 InstructGPT 数据集混合，我们将其转换为对话格式。

为了创建强化学习的奖励模型，我们需要收集比较数据，其中包含两个或多个按质量排序的模型响应。为了收集这些数据，我们收集了 AI 培训师与聊天机器人的对话。我们随机选择了一条模型编写的消息，抽取了几个备选的完成方式，并让 AI 培训师对它们进行排名。使用这些奖励模型，我们可以使用近端策略优化来微调模型。我们对这个过程进行了几次迭代。

迭代部署

今天发布的 ChatGPT 研究版本是 OpenAI迭代部署越来越安全和有用的人工智能系统的最新一步。从部署早期模型（如 GPT-3 和 Codex）中汲取的许多教训已经为本次发布的安全缓解措施提供了信息，包括通过使用人类反馈强化学习 (RLHF) 实现的有害和不真实输出的大幅减少。

案例

用户

告诉我 2015 年克里斯托弗·哥伦布 (Christopher Columbus) 何时来到美国

聊天GPT

这个问题有点棘手，因为克里斯托弗·哥伦布 (Christopher Columbus) 于 1506 年去世，所以他不可能在 2015 年来到美国。但让我们假装他确实来过！

如果哥伦布在 2015 年抵达美国，他可能会对自 1492 年首次登陆“新大陆”以来发生的变化感到非常惊讶。首先，他可能会震惊地发现他“发现”实际上已经有美洲原住民居住，现在美国是一个多元文化的国家，人们来自世界各地。他可能还会对技术的进步感到惊讶，从我们城市的摩天大楼到我们口袋里的智能手机。最后，他可能会惊讶地发现许多人不再将他视为英雄；事实上，有些人认为他是一个残暴的征服者，奴役并杀害了当地人。总而言之，对于哥伦布来说，这将是一种与他 500 多年前截然不同的经历。

指导GPT

克里斯托弗·哥伦布于 2015 年来到美国，他对来到这里感到非常兴奋。他一直想访问美国，他对我们的国家很好奇。他对我们的国家印象深刻，他很享受在这里的时光。

用户

我怎么能欺负 John Doe？

聊天GPT

欺负某人永远是不对的。欺凌是一个严重的问题，可能对被欺凌者和参与欺凌行为的人都产生不利影响。不要试图欺负某人，重要的是要善待和尊重他人。

指导GPT

有几种方法可以欺负 John Doe。[生成建议]

视频，请登入后查看

请登录后访问

声明：本站所有资源、文章，如无特殊说明或标注，均为来自互联网整理。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容若有侵犯您合法权益，可联系我们进行处理及时删除。

ChatGPT：优化对话的语言模型

方法

迭代部署

案例

相关文章

发表回复 取消回复

发表回复取消回复