现在,许多企业都开始借助AI技术来提高自己的生产效率,那么在了解了AI的强大之后,我们是否有可能搭建一个专属于自己的AI机器人呢?这篇文章里,作者便尝试教你零基础学会搭建,一起来看看吧。
AI 这么强,你或者你的公司一定想有一个专属的机器人。
就是那种问它问题,它回答像 ChatGPT 一样流畅,但回答的内容是关于你或者公司的业务介绍。
但是看了一些资料后,都被里面那个“向量[1]知识库”给劝退了。
这篇文章,只会提三次“向量[2]”(最后一次在文末)。
我们先讲一下原理:怎么让 AI 机器人回答问题的时候,回复跟你自己/你公司相关的信息。
当你正常问 ChatGPT 问题时,它是这么干活的:
你:张佳是谁?
ChatGPT OS:(把你的问题拆开,“张佳”“是谁”)—>(理解到你想问一个名字叫“张佳”的人)—>(在大模型里匹配查找关于“张佳”的信息)—>(没找到“张佳”)—>(决定糊弄一下)
ChatGPT:很抱歉,根据我的知识截止日期(2021年9月),我无法提供有关”张佳”的具体信息,因为这个名字可能属于普通的中国姓名,涵盖了许多不同的个体。如果你能提供更多上下文或信息,我将尽力提供更准确的答案。
但是如果你这样问 ChatGPT:
你:张佳是谁?请根据以下信息,整理成通俗易懂的介绍,告诉我:张佳,咨询顾问,句子互动 CMO&解决方案专家,TOP1 医疗健康MCN运营VP,新榜高级咨询顾问,专栏作家,《短视频内容算法》作者。在私域、流量、运营、数据和产品方面有丰富的经验,深谙商业逻辑,可以为个人和企业提供非常棒的解决方案和 idea。持续关注最新趋势、最新玩法,希望每个人都能先进。
ChatGPT OS:(拆解问题:给了个提问,给了参考答案,让我根据参考答案整理一个个人介绍)—>(这是个文本编辑题)—>(说点好听的给他)
ChatGPT:张佳是一位……他在……他擅长……总之,……。
看出第二次提问和第一次提问的区别了么?
这就是打造个人/企业专属知识 ChatGPT 的精髓所在。
你会问了:我怎么让用户提问问题的时候带着你说的那些资料啊?
想要打造一个专属对话机器人,我们需要先“劫持”一个机器人,也就是在用户问它问题之后,它带着问题去问大模型之前,在传输的信息上动点手脚。
我画了一个图,你大概就理解了:
所以,想要打造一个私有/企业专属的 ChatGPT,你应该有一些可以加到用户问题后面作为参考资料的知识库。
这个知识库可以是一些个人、公司、产品的介绍文档,也可以是一些 QA 问题库,或者你的客服应答用户的聊天记录。
接下来,你需要把这些知识资料拆成一段一段的,尽量保证是「一个问题+一段答案」,或者一段一段的「概念描述或介绍」性的文字。
因为我们知道,AI 的对话都是有字数限制的,太多了 AI 处理不了或者容易整不明白,并且我们调用人家的大模型,是按照字数收费的。(如果你以前不知道,现在已经知道了)
所以每次发给大模型的文字尽量少一点,拆完了大概是这样的:
然后我们只需要再解决一个问题:用户发过来的问题,我们识别出来以后,在拆好的一段段文字中找到最相关的,加到用户的问题后面发给大模型就好了。
原理搞明白了吧?
摩拳擦掌,开搞!
这里推荐一个已经相对成熟、应用范围比较广的国产“玩具”
大概花 5 分钟就能拍桌子大呼:“我自己真牛逼”。
网址在这里:https://chato.cn
注册完进去以后就会让你创建个机器人,选 AI 创建。
相信我,AI 创建的比你自己琢磨的要牛逼。
把角色名起,写一下希望这个机器人完成的事,简单一俩关键词就好了,剩下的等 AI 给你输出。
创建完以后,其他的先不用管,直接进入知识库。
这里支持两种方式:问答式和文档式。
「录入问答」这种机械性的工作咱不干,直接选文档式。
文档式有三种选择:第一种是你有现成的文档,支持 N 多文档格式(连epub都有,摆明了让你上传电子书);第二种是输入文档,手打编辑复制粘贴这样,上限 10 万字。前两种你上传完成以后系统自己给你分段,你决定不了啥,只能随缘(Chato 的 PM 看到以后加个班)。第三种就“硬核”一点了,直接粘贴网址,它直接帮你采集(违法抓你不抓他们)。
我这里把白皮书里《如何使用企业微信添加客户为好友》的一篇文档上传到知识库了。
然后等着机器人来学习,说是 5-10 分钟,如果字数不多一两分钟就完事。点击上面的聊天演示就可以测试一下 AI 的能力了。
问了一个“知识库”里有答案的问题,AI 的回答基本上就是一个“抄”。
测试差不多,现在可以把我们的私有机器人拉出去溜溜了。
之所以给大家用这个玩具来展示,是因为它可以接入到其他位置非常便捷。你可以把它嵌入到你现成的网页里,比如官网;可以接入到企业微信账号上,拉到你们的企业微信群中;也可以嵌入进公众号、飞书机器人、微信客服和抖音私信!
基本都是手把手配置,复制粘贴一些 ID 和密钥就可以直接用的状态。
我来展示两个:
比如我有一个官网,它长下面的样子:
我想在官网里接入这个机器人,只需要把他们提供的代码,复制粘贴到我的官网代码里即可(给大家看源代码了,证明它不是 PS 的)。
比如我想让这个机器人在我们公司群里协助回答一些问题,可以按照后台的指引文档,配置一个机器人应用(也是手把手的,我就不一步一步教了)。
把飞书机器人拉进群里,可以@它问问题。
回答也是完全按照知识库资料来的,只是顺序变了一些。
其他类似企微客服接入、公众号接入,也都是一步一步手把手教程文档。(这里其实可以夸一下 Chato 的产品团队,写的教程很好)
另外,如果你感兴趣的话,可以在 Chato 后台的规则里配置各种模型、索引量(就是从你的知识库里找几段知识放在用户问题后面给大模型)、角色的设定(也是预设提示词的一部分,让角色更听话的)、默认的关键词回复,比如加上一个联系客服的二维码。
这些自己探索吧,都是“增值”内容了。
还记得我们在文章开始的时候说要再提一次“向量[3]”么?
现在说一下:
因为GPT 大模型支持的字符数是有限的;
为了尽最大可能的节省 token 的消耗,所以很多技术同学会把拆开的一段一段知识库文字,通过 OpenAI 提供的 embedding 接口,转化成跟大模型的参数存储形式一样的格式,也就是本文承诺只提三次的那个词,这样也更适合大模型去匹配自己的知识能力。
但如果你不差钱,就不需要学习这些脑仁疼的技术。