1 什么是 ChatGPT?
ChatGPT,全称聊天生成预训练转换器(英语:Chat Generative Pre-trained Transformer),是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型并以强化学习训练。
ChatGPT目前仍以文字方式交互,除了可以用人类自然对话方式来交互,还可以用于复杂的语言工作,包括自动生成文本、自动问答、自动摘要等多种任务
2 ChatGPT 的能力
训练
ChatGPT在GPT-3.5之上用基于人类反馈的监督学习和强化学习微调。这两种方法都用人类教练来提高模型性能,以人类干预增强机器学习效果,获得更逼真的结果。
在监督学习的情况下为模型提供这样一些对话,在对话中教练充当用户和AI助理两种角色。
在强化步骤中,人类教练首先为模型在先前对话中创建的响应评级。这些级别用于创建“奖励模型”,使用近端策略优化(PPO)的多次迭代来微调。这种策略优化算法比信任域策略优化(trust region policy optimization)算法更为高效。
斯坦福大学的研究发现,GPT3已经可以解决70%的心智理论任务,相当于7岁儿童;至于GPT3.5(ChatGPT的同源模型),更是解决了93%的任务,心智相当于9岁儿童。
能力
ChatGPT用途广泛。例如:
有编写和调试计算机程序的能力;
创作音乐、电视剧、童话故事和学生论文;
回答测试问题(在某些测试情境下,水平高于普通人类测试者);
写诗和歌词;
模拟Linux系统等。
ChatGPT的训练数据包括各种文档以及关于互联网、编程语言等各类知识,如BBS和Python编程语言。
与其他多数聊天机器人不同的是,ChatGPT能够记住与用户之前的对话内容和给它的提示。此外,为了防止ChatGPT接受或生成冒犯言论,输入内容会由审核API过滤,以减少潜在的种族主义或性别歧视等内容。
局限
OpenAI承认ChatGPT“有时会写出看似合理但不正确或荒谬的答案”;
据BBC报道,截至2022年12月,ChatGPT不可以“表达政治观点或从事政治活动”;
有用户发现ChatGPT在解决较为复杂的题目(如求方程式的切线)时会给出错误答案,并且会在解一元一次方程式时陷入循环。
3 ChatGPT 可能的商业模式
快速增长的海量用户
仅在发布两个月后,它就达到了1亿用户,是史上用户增长速度最快的消费级应用程序。
一旦你有了海量客户,你就可以用你选择的方式引导他们。
API
ChatGPT不仅吸引了消费者的注意力,还吸引了开发者的想象力。
GPT-3已经可以通过API获得,而且一些开发者已经在使用它进行开发,围绕ChatGPT的讨论推动更多的开发者考虑如何将GPT纳入他们的产品中。
插件 plugin
OpenAI将直接在ChatGPT中引入插件的公告:
浏览:“一个知道何时以及如何浏览互联网的实验模型。”
代码解释器:“一个实验性的ChatGPT模型,可以使用Python,处理上传和下载。”
检索:“开源检索插件使ChatGPT能够访问个人或组织信息源(经许可)。”
第三方插件:“一个知道何时以及如何使用插件的实验模型。”
通过浏览和自定义,它将完成搜索所做的一切。有了第三方插件,它就成为了一个平台,所有供应商都可以在这个平台上为平台本身添加更多功能。
最后的最后,把这个网址放在了我的公众号,回复关键字:ChatGPT
- 获取解压密码
- 微信扫下面二维码
- 添加下面微信
- 领取35个自媒体课程