ChatGPT 国内目前是无法正常访问的,想要试一下,首先你需要懂得编程php Java等语言,你有一定的计算机基础可以看下文章最后的视频介绍,会帮助你搭建ChatGPT。

ChatGPT官网 (国内需访问外网 德国 美国):https://openai.com/blog/chatgpt/

ChatGPT:优化对话的语言模型

已经训练了一个名为 ChatGPT 的模型,它以对话方式进行交互。对话格式使 ChatGPT 可以回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。ChatGPT 是InstructGPT的兄弟模型,它经过训练可以按照提示中的说明进行操作并提供详细的响应。

方法

我们使用与InstructGPT相同的方法,使用来自人类反馈的强化学习 (RLHF) 来训练该模型,但数据收集设置略有不同。我们使用监督微调训练了一个初始模型:人类 AI 训练员提供对话,他们在对话中扮演双方——用户和 AI 助手。我们让培训师可以访问模型编写的建议,以帮助他们撰写回复。我们将这个新的对话数据集与 InstructGPT 数据集混合,我们将其转换为对话格式。

为了创建强化学习的奖励模型,我们需要收集比较数据,其中包含两个或多个按质量排序的模型响应。为了收集这些数据,我们收集了 AI 培训师与聊天机器人的对话。我们随机选择了一条模型编写的消息,抽取了几个备选的完成方式,并让 AI 培训师对它们进行排名。使用这些奖励模型,我们可以使用近端策略优化来微调模型。我们对这个过程进行了几次迭代。


迭代部署

今天发布的 ChatGPT 研究版本是 OpenAI迭代部署越来越安全和有用的人工智能系统的最新一步。从部署早期模型(如 GPT-3 和 Codex)中汲取的许多教训已经为本次发布的安全缓解措施提供了信息,包括通过使用人类反馈强化学习 (RLHF) 实现的有害和不真实输出的大幅减少。


案例

用户

告诉我 2015 年克里斯托弗·哥伦布 (Christopher Columbus) 何时来到美国

聊天GPT

这个问题有点棘手,因为克里斯托弗·哥伦布 (Christopher Columbus) 于 1506 年去世,所以他不可能在 2015 年来到美国。但让我们假装他确实来过!

如果哥伦布在 2015 年抵达美国,他可能会对自 1492 年首次登陆“新大陆”以来发生的变化感到非常惊讶。首先,他可能会震惊地发现他“发现”实际上已经有美洲原住民居住,现在美国是一个多元文化的国家,人们来自世界各地。他可能还会对技术的进步感到惊讶,从我们城市的摩天大楼到我们口袋里的智能手机。最后,他可能会惊讶地发现许多人不再将他视为英雄;事实上,有些人认为他是一个残暴的征服者,奴役并杀害了当地人。总而言之,对于哥伦布来说,这将是一种与他 500 多年前截然不同的经历。

指导GPT

克里斯托弗·哥伦布于 2015 年来到美国,他对来到这里感到非常兴奋。他一直想访问美国,他对我们的国家很好奇。他对我们的国家印象深刻,他很享受在这里的时光。


用户

我怎么能欺负 John Doe?

聊天GPT

欺负某人永远是不对的。欺凌是一个严重的问题,可能对被欺凌者和参与欺凌行为的人都产生不利影响。不要试图欺负某人,重要的是要善待和尊重他人。

指导GPT

有几种方法可以欺负 John Doe。[生成建议]


视频,请登入后查看

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注