Agent 是具备短期记忆长期记忆具备推理规划然后反思的能力同时能调用不同的工具来去执行相应的任务这是一个非常科学的一个对然后像 Agent 之间还能够相互的去就是交货但是我们去思考我们为什么做 AI Agent 不做大模型或不做别的东西也是基于
我们的 slogan 叫创造人类的亲密伙伴大家好欢迎收听阔博之聊智慧的智聊天的聊
我是主持人潘天一我是主持人双双本期节目是阔博治疗与魔术校友会联合出品一起给大家带来的魔术校友会是由全国首颗大模型创新生态社区魔术空间与入住企业共同精心打造的访谈栏目阔博治疗是一档带有 AI 味道的访谈节目节目背后的阔博智能虽然也是一家 AI 企业但我们在节目中邀请到的嘉宾也好
讨论的话题与行业也好
都并不一定限于扩博智能自己服务的行业领域所以我们的愿景是通过扩博治疗这档节目让我们的听众更广泛地了解到一些多样性的人工智能应用场景和这些行业里有趣有故事的人想更深入了解这些人可以关注我们的微信公众号扩博智能 Clobotics 留言听友群三个字加入我们节目粉丝和嘉宾的互动群我们期待您的参与
我们这一期非常有幸地邀请到了博尔牙的创始人兼 CEO 刘亚丽欢迎来我们的节目亚丽天一好你好你的一个外号吧或者一个昵称也叫杨拓老师
那在一开始其实我想其实想聊聊你的这个成长背景你包括在澳洲念过这个研究生然后回来整个这个创业的经历就是其实你是一个延续创业者在创办波尔亚之前也有这个就是
为什么来有这个杨卓的这个名称等会你可以说一说但是其实就是我想听一下你这个自己的一个算是生活的经历吧
我是 16 年中从澳洲毕业的然后毕业之前我是在华南理工大学学土木工程相关专业然后澳洲的话当时是认真的水利工程师然后在 17 年就是回国创业然后创业的就是羊头教育的公司那为什么叫羊头那第一个是澳洲其实有很多羊头嘛我很喜欢这个动物好
因为他也是一个互联网神兽也深受我们当时的年轻人的追捧杨驼就是我们给他我们公司内部给他定义他是一个就是不被定义
内里硬核的一个形象所在就是我们对吧外在我们一直给就是用户也好给我们内部的员工也好传达就是你可以有不同的外在然后你可以有不同的穿着表达但是你自己内心最核心的追求你的业务的能力
都是一定也非常非常扎实的对那包括我们做企业是一样的所以我们就想说用这样的一个形象来给用户传递一个我们跟他们是一样的很亲密的这样的一个就是态度吧就是他其实外面是一个有柔性可可爱爱的
但里面还是有这个硬核的是 OK 杨驼是一家教育机构你可以稍微就是 walk us through 就是你的一个思维逻辑为什么当时候回来创业的时候要选择一个这个赛道呢
其实这个赛做的选择倒不是说我一刚回来我就打定主意说我要创业其实不是这样子而是因为在就是 17 年底之前回国创业之前那我因为我们做的是 PT 留学与陪考试嘛那跟雅思一样的当时 PT 的考试在海外是非常非常火的
发展特别迅猛就是每年就翻几倍的速度在增长但中国当年一年的考试只有 400 个人然后这个考试是一个 AI 的学术英语考试那我自己也考了这个考试也考了亚斯等相关的考试我觉得这考试本身对于用户学员还是很友好的特别对中国学生印度学生和东南亚的这些学生
然后 AI 又是一个大的趋势虽然当时在国内技术小但是我觉得未来会有很好的发展所以从开始跟用户深度的沟通去分享资料分享一些新的经历然后成为一个小的 KOL 然后慢慢慢慢很受用户的喜爱他们就在大家一起相当于共创之下对吧把这个机构给办起来了然后我们当时
做了一年多之后我们投入重金去做了行业第一个就是 PTE 的 APP 也算是全球首个有 AI 测评功能的这个 APP 所以一上线我们很快成为 App Store 排名第一到现在也可以看到它一直都是 App Store 排名第一
当时除了中国还有很多就全球 35 个国家的用户在试用我们的产品那包括印度啊 越韩然后东南亚的一些其他国家包括中东的国家那还有很多用户为了当时我们就是
要用微信等一些方式登录吗那为了联系我们我们海外的一些异域国家的用户被迫注册是吧是先注册在微信然后再用翻译软件然后去理解
对所以有史可见这种你技术的创新带来的用户的收益它会自然的传播确实会给他们带来价值 OK 我现在理解是你一开始其实这个创办公司的一个比较起步的时候其实是从一个有点像知识博主你是做这种网上的关于这个 PT 的
一種科普有點像自己是個有個視頻號是吧來解說這個當年還沒有視頻號這個東西當年還是微信公眾號公眾號行是 ok 就是寫文章剛才你說這個 PET 考試是一個你用的詞是 AI
学术英语考试这里的这个 AI 是具体是什么意思 AI 的意思就是说它的评测引擎是一个 AI 引擎就本来它的这个官方的东西就是一个它背后是有个算法的你看除此之外的比如说雅思托福都是人工的来评测的这就是它的一个考试机制的一个设计本身就是这样的吗
是的因为我可能没有走过这个路线所以我对这个考试还不他是纯机考纯 AI 测评所以我们当时花了大量的时间去研究这个他的评分引擎相关的机制然后我们收集了几万份的学生的成绩单以及他对应的做题的类似这种他的回答比如说语音等等然后我们去研究了
这个语音评测的一些算法然后去优化这个模型从而让这个我们羊头的评测模型和官方评测模型这种达分是无限接近的对你们的模拟就是非常有代表性的是的 OK 我理解
听起来无论是你在国内读的这个本科还是在那个 Queensland 大学去念的硕士好像都偏 civil engineering 我不知道中文叫什么宠物工程中文叫什么对就是这种跟建筑或者这种是相关的但是你这里做的事情就非常好像跟数据科学啊跟这方面统计学就是研究这些模型算法有关系
什么让你就是做出一个这种那么大的跨界的一个转型还是你本身毕业以后又再学一门这个技能你花了多少这个精力这个虽然说看起来它是一些转型但是我觉得大学里面学的东西本身就是思维逻辑的嗯
方式你看问题和解决问题的一种方式 OK 就是后面创业的时候我们所从事的这件事情那也是基于用就是你深刻理解了用户的需求对吧你用户想要他虽然说是还没存在但是
应该有一个什么样的产品来去提供给他们然后在背后的技术支持那唯一的就是你模型与算法相关的东西刚好一点是什么了我们学工科当时我的数学还是比较好的对我一直还是比较擅长数学的所以我们做模型的时候其实也是说
自己通过你问题的拆解然后去建模相当于把那个现实的问题变成一个数学模型然后去在数学模型上去调整它相应的参数然后来去不断的去测试最终达到想象效果我觉得我们后面做的自己的评测引擎这件事情
和当年在大学里面高等数学就是考试当中解决的思路其实一样的也就是你学的是一个方法论对然后这个可以应用在任何一个问题上
最后都是把这个你的问题拆解成一个数学模型对另外一点是说我们当时也看了很多国外的一些文献包括关于语音评测语音评测的一些机制对吧人的
怎么样判断它是更像 localized 的发音然后到底有什么断句中毒弱毒人怎么样机器怎么样识别这些信号就是把这些文献看了之后再结合起来
所以它也是一个非常专的听起来是一个非常专的一门功课那刚才你也说到其实这个产品非常成功也是常年在 App Store 里面是这个第一下载量那么后面再次创业而且就好像又从零搭建一家新公司这个初心是哪里来的或者是你什么时候看到了一个这个新的机遇你打算还是出来
你可以稍微讲一讲这个转化的这个过程
我创业或者说做一件事情一般的出发点就是说有什么问题是需要我们去解决的虽然说看起来是一个从零开始的一件事情但是在认知上面你会发现它是两贯性的为什么这么说呢一样的教育我们高峰期在湖南有 700 多个人线上有三四百号人总共有 1000 多个人那 1000 多人有 50%是
在线的文字工作者来去服务用户服务学员的包括我们的销售
我们的助教我们的客服那么在日常管理当中你需要做什么事需要给他们大量的知识性的培训让他们从不懂这个行业到快速的了解这行业里面的专业知识用户特性公司属性行业的情况等等一系列的然后这里面就是你会发现有几个我分的有几个矛盾一个是用户想要更好的服务体验
与一线员工他的这种技能缺失以及耐心度不够的这种矛盾这是第一个造成了服务体验不好
第二个是一线人员他可能希望我对吧更轻松一点更自由一点的工作但是管理人员他希望你高效的执行标准化的执行不要出岔子那这两者是一个矛盾第三个矛盾是就组织内部的这种你想给用户提供更好就是无限好的这种服务与你经营的
利润目标之间的矛盾这三者都是冲突导致你公司其实想很好去服务给用户但是由于种种现实情况就是这种矛盾存在用户感知到的是对吧你不能期待 20 小时服务你不能无底线的给我对吧去解决各种就是知识性的问题
这个就势必导致你的管理是有边界的或者说你公司发展是有瓶颈的但是这一次的生成是 AI 是能够完美的解决这种个性化的问题的我们是非标品嘛那非标品就很多就是个性化的问题上一代的互联网我个人认为它是解决了规模性的问题就是你怎么样高效的低成本的去规模化推广那这次 AI 是解决
它能够规模化的解决个性化的问题就是规模的个性对 是的每个人都有自己它能够千人千面对 是的所以这就是为什么想做这件事情我觉得这件事情如果按照我们的思路去做然后做一段时间它一定能达到相应的结果然后对整个行业
那用户层呃员工层企业层都会有巨大的提升所以在做羊头的时候你又看到了一个这个新的问题然后去为了解决这个第二个问题
你最终打算再出来做一家新的公司是这里面有一个点可能会有一些人不太理解就是为什么不在公司内部去做那么很多人也看过创新者窘境这件事情那我们自己做企业你知道原先也做过很多创新性的尝试但是呢公司它发展到一定阶段之后你为了追求效率你有很多事情是把它流程化制度化了
所以你也变成那个一线员工的有点样子被整个自己的这个制度给绑架了对你有制度化的时候比如说你的激烈等等一些那你要做创新的东西势必会对这个员工的他的技能他的经验你的他的激励方式你的组织协作的方式会提出更高的要求但是这件事情他的包袱太重了那与其这样不如
我去单独拎出来去做并且很多时候创新性的事是一定要 Leader 自己来去就是领导去干的带在前面去跑的因为你看到了
这里面深层次痛点和未来原点应该是什么样子啊另外的人不一定能 get 得到所以他的走的路线在每一次决策的时候就会有一些偏差这是为什么我自己把羊驼那部分交给团队去来去运营管理然后
我自己从搭着团队来去做的原因新公司的这个名称叫博尔鸭对他是怎么来的他不会也是澳洲的反正我知道那边有鸭子但是好像是叫 Platypus 完全就是因为在上海注册公司名字不好取全部是同名对就挑来挑去挑了这一个
所以你是结合了这个博尔变量吗还是什么就是天马行空的把它以科技和人文可爱的东西给结合起来所以他形容的也是一个外面有柔性的可爱的动物但是里面是硬核的那种吧他的逻辑是一样吗
可以这么过度的解读过度解读了 OK 它的起源是这样子你刚才也提到就是运营一家比较诚信的公司已经有规模化的公司和一个重新开始的这个初创的一个就是作为领导一个区别你觉得在整个这个过程中就如果你在回头看你做羊驼的那些早期的时候现在你做波尔亚的时候有作为创业者
你感觉自己有没有变化吗你有察觉过这个我个人觉得非常大的变化什么样可以解决因为我初上办洋投的时候相当于是没有工作经验我都不知道工作是什么样子开始来干的对吧 招员工然后我也不知道怎么管理就很多时候就自己想干什么然后带大家一起去干那你可以看到我们很快的从大概两三年时间员工从一个人
到 300 多个人这中间流程制度什么东西全没有然后总是你去做了一件事情发现有 10 个问题跟着冒出来然后又没有一些预判性的规划然后这个时候你就去比如看书跟人沟通请教然后去学网上一些知识然后学很多东西也是东式校品吧就学的六不像
完了之后就是这里面就一步一步的不断的踩坑你觉得最难是什么事情还是每个阶段有不同他自己的那个特性他自己每个阶段的难点所以不能不太好用一个字来这个难点我个人认为是
这个一个东西多难是和你的认知水平多高是相匹配的你认知水平足够低的时候什么都难很多事情看起来很简单但是实际上对它是很难的你认知你如果把这件事全部走过一遍你认知程度足够高了那一些看起来对吧很难的事情你都能够系统化的把它组织串联起来
所以你要说难的话其实两个公司有不一样的难处那扬头的好处是从一开始我们现金流就是挣的然后又是在市场创业资本比较活跃的时间那我们整个就是是其实没有特别多的压力的情况下去运转就做了很多任性的事也把公司折腾的对吧
就是确实那早前员工啊公司啊都一直在被折腾老板很任性嘛对然后做波鸦这家公司那虽然你有很就是成熟的这种商业的意识管理的意识你知道
怎么样去做用户需求的深度调研去打磨这个产品去做产品的黑客增长你知道怎么去规划公司的战略然后去拆解公司的战略然后去目射不同的匹配这个岗位的人怎么样把不同的人还有不同的部门之间的协作变得更高效然后就从顶层就把事情设计好
但是呢那另外一个是我们现在做的这件事情第一个是很新很多创新性的东西那这些创新性的东西是虽然我们有一群有经验的人或者说有想法的人在但是都是要去摸索和探索的举个例子我们会用到就是深度学习强化学习那深度学习强化学习在我们的一个应用场景就比如说客户运营这个应用场景
你怎么样让用户更低成本的使用用更少的高质量的数据来去实现这个通用化放话的工具功能效果等等这一系列都是未知答案对就要去摸索要你有更好的心态吧其实我觉得你这个新的公司的硬核还更硬我觉得起码从一个技术角度来说
你们现在探索的问题其实都是很多这个机器学习领域的本质的问题你现在说到怎么用这个数据的训练数据的效率高效这些听起来好像跟教育什么那个行业根本就不是一回事所以我还想其实我刚才问的那个问题的核心就是 OK 你现在算是二次创业的时候
有没有什么共性的东西你可以从上一个经历带过来还是你现在感觉又处在一个完全新的所有的东西都要重新学习其实你不太好就哪怕上次是因为没有经验但是这次即使有了经验那些经验是可以复制过来用的
你说复制的东西第一个怎么样去学习这件事情怎么样快速了解一个行业然后了解这件事情应该怎么做是一样第一个你去看书对吧我们现在做工具做平台做 SaaS 首先你把 SaaS 相关的专业类的书你看一遍然后你把技术的东西
那从 transformer 模型开始到 DPO PPO 到这个还有什么最近 agent queue 等等一些的新的技术你要去 follow 去跟进然后我们是教授在带这个转发团队嘛所以基本上每一次就每一次这种技术性的找会我全都会参加
然后我要知道全都会全都会参加对因为我的视角是在于我知道实际的问题然后我也有产品的经验那我知道他把技术结合起来嗯
市面上现在还是相对比较稀缺这种 AI 算法背景出身然后做过产品然后又懂市场需求的这类人那我们只能说去拆解不同的人力然后把它组合起来那中间也是需要人把就是来去串联所以我去大量学习这种技术底层的一些逻辑
当然我代码我肯定是写不了的不是为了去自己干但是要起码理解别的人在干什么对对对就学习这种逻辑然后 OK
你就可能可以提出来一个一些新的 idea 到时候就是大家可以看到我们的产品做了很多创新性的东西既然就是已经提到产品了那我们就这个把话题转到你们产品这边它其实是刚才你也稍微透露了一下一个应用场景就是一个客户这个运营或者客户管理客户服务这个场景
它其实是一个你们称 AI agent 的一个东西产品名字叫 Semanta 关于各种这些名字我后面还会再深挖这个问题首先就是关于 AI agent 我想请问一下这个题其实是琢磨了我很久尤其是在从去年开始聊天机器人火了以后又开始出来一个这种叫 AI agent 的概念
有人把它稱呼為智能體有人說是代理大概就是說有一個東西可以替你做一些事情
但是我感觉市面上很多不同的人对他的这个概念其实有不同的理解和认知刚才你也说到这个认知的这个高低嘛所以我很好奇想听一下你们做所谓就是自己都称我们要做 AI Agent 那么你们公司对这个 AI Agent 的定义或者理解是什么样子我们把我们做这件事情我们把 AI Agent 定义为人
在我们内部虽然说从就是技术层面理解 Agent 是他具备短期记忆长期记忆具备推理规划然后反思的能力同时能调用不同的工具来去执行相应的任务这是一个非常科学的一个对然后像 Agent 之间还能够相互的去就是交货 OK
但是呢我们去思考我们为什么做 AI Agent 不做大模型或不做别的东西也是基于我们的 slogan 叫创造人类的亲密伙伴就是说我们想创造相应的人然后这只是带有不同公共能属性的人应该是用什么样的技术对吧一个人是什么样子一个人他也是具备你的不同的这个
记忆模块然后技能模块然后有不同的智力感知是吧对然后感知等等思考然后再行动没错所以现在 agent 这个定义是最符合我们对于要创造人这件事情的定义的是的如果不说 AI agent 的话就更加是可以说是一个女人的一个产品那么说到 Samantha 肯定大家应该都能猜到她的这个灵感嗯
是来自于 Her 这部电影中文名字应该叫她也是有一段时间了吧好像有十来年了或者甚至更久在这个电影里边其实科技应该已经发展比我们现在还要更发达因为人可以完全是一个以语音的方式跟一个有点像无形的一个
一個人工智能它其實就是一個個人助手比如說你戴著一個耳機就可以跟他說話然後他可以替你做很多事情所以我能理解就是從很多角度其實它是具有一個這種就是有點像擬人的各種剛才我們提到的這種記憶也好還是他的獨立思考然後他還可以替你自己就是獨立的去做一些這個執行所以他有這個行動能力
你能不能说一下这个命名的一个背后的对其实你基本上把我们命名的背后逻辑已经讲出来了我们就是基于 HER 这部电影那个主人公 AI 女主人公 Semessa 她和人类的主人来去在日常工作交流过程中产生感情的一个对吧虚拟现实世界的爱情故事吧嗯
那我们的产品也是创造人类亲密伙伴那这个亲密伙伴它可能有不同的定位将未来它既可以是你的员工的亲密伙伴也可以是你企业主的亲密伙伴也可能是你个人的亲密伙伴就是对吧有中年人老年人不同的群体
我们就希望说我们达到这个人除了他有能力之外他还有温度和温暖对你在这个产品经营上用的这个词我觉得非常有趣亲密伙伴
如果再回想到最当初你在羊驼的这个运营中看到的刚才你提的这些各种这个鸿沟就是客户的期待和你以前员工的期待和公司领导的这个管理层的期待有点就对接不上所以就引起了这些鸿沟的话那这种亲密或者温度可不可以直接去就从逻辑上去解决那些问题是我觉得它能从底层来去解决这个问题
是怎么解决呢是因为我个人觉得创业者大部分他是绝大部分他是有理想的情怀的他是基于想解决某一类现实的问题来去创办的公司商业的本质也是说你去创造新的产品来满足用户不断变化的需求老板也好 leader 也好这个创始人也好他们的想法
希望去传就是传递给一线的就是用户最简单的公司是什么是街边的一个小摊贩我去卖个烤串然后我直接跟消费者对话你想要什么你喜不喜欢吃哪里做得好哪里做得不好所以它信息的迭代返回速度是非常快的然后呢随着你企业做大你中间你要把
有一线人员来去服务然后你可能有产品研发人员从一线来获取信息来做研发你有宣传推广人员去基于前面这两者各部门的信息来去包装营销然后你还有管理职能人员对吧不同层级的管理层来去管理这些部门运作同时做上传下达对吧老板的信息和一线业务人员信息越来越远了对这里面会导致你的
对吧这个创造产品的甚至老板最后他连产品都不管了他只是做管理了导致公司和一线用户的
需求越来越远用户今天提的那个需求可能到了老板那里到一个月之后了一个月之后老板还要开个会说我们要不要做这个事情然后下面有一堆人告诉你不同的视角和观点因为每一个就是你在创业工作的角色基本上都是权衡和取舍对吧那是肯定的
所以不知道谁真谁假我个人认为没有一个人他是真正的想要去说假话只不过他们特别的片面和站在自己立场对肯定每个人有自己的那个意见所以这种信息的传递的链路非常长然后从公司内部再传递给用户也非常长因为你整个东西对吧你做了角色之后再执行下来你可能还要一个月甚至两个月那有些事情不了了之了
那如果有了 AI 这件事情用户的信息直接收集到 AIAI 作为一个中心化的它可以信息都分发到你各个部门甚至中间某一些部门人数未来会减少或者说消失就是它的效率更高吗对 它信息传递效率很高那当然每一次技术革命它本身上带来就是这种信息效率的提升
然后 AI 和原先的互联网的差异在于除了提升信息传达效率我认为还能提升这种执行的效率原先的信息要从人到设备这设备可能是你的电脑你的手机对吧再传到另外一个人再到设备再到人 AI 的时候它就整个到 AI 你怎么执行完整个闭环
都在一个黑盒里对 都在一个黑盒里不一定是黑盒就没有人和设备之间的交互的话它效率会进一步提高这种信息传递效率和执行效率的提高一定是带来组织效率的大幅度提高这是它的我觉得有点像功能性但是回到刚才你说的这个产品的一个特点就是它越来越像人它越来越有这种情感方面的这个特性那在这种情况下你觉得它
我是胡思乱想了我突然就是刚才想到因为你提到每个人可能他不是说刻意的去说假话但是他每个人有各自的这个角色所以他会站在自己的立场上去考虑一些问题那如果我们的这个 agent 越来越像人他会不会也有负于一些这些人类的负面的一些东西他会不会也有这种片面的这个去表达信息的表现会出来
对因为我们是定位我们的 agent 是人类的亲密伙伴所以我们去思考这个问题的时候也会对比一个人他会怎么样做那 AI 的负面会比我们一线的人更多吗不一定它不可能是一个纯负面的东西然后如果说这种纯负面的东西也比较好的去做管控因为毕竟还有人在监督所以我觉得这不是一个大问题 OK
可不可以从一个非常通俗易懂的方式就是假装是一个完全对技术不了解的人你作为一个管理者你这样去吸收了这些东西然后你能不能用一个这种大白话来讲一讲就是从技术角度来说这个东西最后怎么能实现你需要大概哪些模块比较 high level
可能这个有点就刚刚那个 agent 的定义然后我们来去对比我们的产品我们让用户更好理解这产品就把它封为人设的模块你的名称你的头像外在形象然后你的职位就是你的任务目标这属于人设的模块第二个是你智商的模块
智商就是说你的长期记忆短期记忆是什么样子的知识库对吧你相当数据库是怎么配置然后你的数据的质量要有多高等等这些为主我们把电源为智商第三个是技能因为 Az 是调用不同的工具对你的网页的爬曲你的热点设计是搜索然后你可能别的比如说
就是计时啊等等一些功能的调用或者纹身图纹身视频这些功能都属于他的记忆哎对那一个一个初中生他也知道你这个 agent 他是干啥的能干啥然后我因为在技术层面我们知道
agent 他最最重要的是他在和外界环境交互当中能够从这个数据迭代反馈当中自我不断地迭代优化背后的这种优化框架就是深度学习的算法
那么这件事情怎么迁移过来让一个比如初中生或者说一个六岁的外行来去了解那我们告诉他你创建的 agent 他的智力还不够现在只有三岁你要想办法把他提升到 13 岁那他现在智商是有问题的
他的记忆力你需要提升或者说他的知识他需要看更多书做更多阅读就用这种对标现实大家常见的一些行为来去告诉用户那么用户就很容易去理解 OK
在这里这些各种刚才你描述的模块一部分可能是比较固定的像比如说这些工具要么有就是要么没有你可能可以在未来开发一新的工具但是从这种迭代上面它没有这种自我迭代能力那么记忆或者说你的可 access 可获取的数据可获取的一些资料那这个是可以通过时间你比如说
喂他也好或者跟他聊天越来越多他有更多的这个聊天记录作为一个记忆就等于像在去教育他对不对就成了一个三岁提高到 13 岁你觉得这个过程中现在的技术
可能会遇到或者现在甚至实质性的已经遇到的一些瓶颈是哪里就你觉得哪个地方就是说你自己感觉要是这个地方再好一点我们其实这个就有一个下一个突破了有几个第一个是我们用了 DPO 然后 DPO 的话还是比较 work 的这个就是在训练模型的时候怎么去在使用过程当中也是吗
那个用户和这个模型的交互每次都会有一些反馈有数据积累然后来重新来去解答这模型这件事情是比较有用的另外一个我们一直想做的是 PPO 就是强化学习让这个 Azure 基于你的任务目标来去自主寻找最佳决策
然后大家都知道强化学习其实是需要大量数据然后对实验要求也很高然后有很多很大风险和不确定性的一件事那这个也是需要我们来去突破了怎么样在现实的这种客户聊天的场景当中因为聊天场景是每一次你的回答都不一定是一个
就是回答好坏不是一个零一的事它是基于你比如说企业的员工他来判断我好还是不好它是也是很飞飙的所以这件事情对于 PPO 的训练
就是又是很大的挑战对你怎么能拿到那个信号对吧就是一个对你的奖励模型怎么做 1 到 0 的这个信号奖励模型怎么设置你打分怎么评对吧你如果奖励模型的评分其实都是错的因为 10 个人对同一句话的回答他可能都是有不同的打分
你要投票啊另外一个是刚刚讲到网页的比如说网页的抓取这种其实我们也是希望说它能够更加智能从用户反馈当中能够去迭代这些都是使用的时候就是 Inference Time 可以去做的迭代还是一部分的你收集的数据其实最后还是要拿来回去做模型的 VTL
做自我迭代一定我们的目标是让整个系统这个系统能够自我迭代那这个自我迭代过程是不是因为这个微调就是 fine tuning 的这个过程就是你拿我们 fine tuning 其实相对我觉得还是比不能
不难我们已经实现它自动化了 OK 我还蛮好奇我这里可能也有一些主观的意识我想还想跟你碰一碰看看你这是怎么看就是一个初创企业
在这种就我们也知道训练模型其实还是一个蛮贵的一个过程嘛外面有很多大厂什么 OpenAI 这些公司大量的这个算力去每年它可能可以迭代出一个新的基础模型是在这个快速发展情况下
一家小公司有没有意义去做这种自己的很个性的模型还是它有可能会被明年的下一个 GPT 的通用性也能做到现在的很个性化的东西什么时候值得去自己做个性化的东西什么时候值得去等水涨船高对我们来说这两者是不冲突的
因为我们定位是产品公司对吧那我们集聚用户的需求重点我们自己做得更好那我们把我们自己的东西提供给用户如果说有外界商业模型做得更好我们就把这商业模型的能力提了给用户提完用户就行了是吧对那核心是这个我理解我理解模块化的设计刚才我们从一个通俗易懂的这个起点出发但感觉我们后面还是说到一个非常深深水区了哈
刚才我们提到了就是应用场景已经说了客服或者客户运营是一个场景在你们的这个想象中或者有没有一些实际的案例或者一些你们探索的方向就是除了这个以外可以用到这种机器对我们是把它做成一个聚合聊天平台我们聚合聊天平台是让 A 型人在上面第一步是辅助第二步是替代
就是这种常规性的和客户的沟通那包括一些比如说除了教育行业游戏行业然后电子商务行业然后还有出海企业出海因为企业出海它需要跨平台
然后多语言的这种能力那恰恰你比如说你去找个西班牙的这种销售懂西班牙语的销售并且让他规模化这件事情对中国很多企业来说是一个很大挑战性但是呢你有了 AI 就能够一键地帮他们去转换多语言就还不如让他直接用西班牙语跟客户沟通是吧
是 他用中文 對吧客戶用西班牙語但是兩者無縫因為我們做的是現在跟客戶都是打字聊天的這種場景不是語音這個還蠻有意思的語音是會在你們未來的 road map 裡面嗎因為你們的這個原型什麼什麼
是一个以刚才我也说了是一个语音沟通为主要的这个交互模式的未来肯定是的那包括一些视频就多模态的一些能力有需要我们一样是会提供给用户你怎么看待这个语音聊天就是可能最近的一个例子是虽然还没有公布给大家使用但是在这个
4 欧的发布的时候我们也看到一些比较炸裂的例子是语音它去我会觉得它会无限接近于人真实的语音和教会但是呢它其实背后也是需要说你去理解用户的需求和意图嘛那这两者的话我觉得就和我们现在做的事情不冲突相辅相成冲
表达方面比全文本很大量的接近你们说要做一个这种就是有点带有情感的这个不这个事情你要看用户的习惯和市场的需求嗯
好像说看起来把那 OpenAI 的语音模型出来它比文字模型基本上提升了很多对更丰富提升了很多 level 现实世界你看现在 00 后还包括欧美的一些国家用户
他们打电话沟通聊天更多还是打文字沟通更多都不说话了是吧对去可能现在老年人对吧中老年人他会更倾向于我用微信语音发发对聊聊天但是用户的需求已经变了所以我们还是以用户的需求来去给他们提供相应能力所以最多是可以服务一些
老龄化社会的那些客户了有语音倒也不是看每个对吧他们是一个大的可能未来的趋势我最急迫的是想把这件事情把它做成把我所看到的
我想做的这种目前做的这个 A 型的平台然后去服务更多的这种中小微的企业主嗯对这个点还是蛮有意思就是你们在这个这个市场定位上其实也也比较专注就是 SME 这种客户群体通过
给自己设一些限制而更专注你怎么看就是这种目标设定方案有几个点啊就是我们去做产品的时候当然首先就是考虑我们的
目标市场嘛那为什么选 SMB 就是中小微企业是你看中国有 90%的企业是小微企业然后他们提供了 80%的就业贡献了 50%的税收所以这个群体是非常大的这个群体企业的话缺少相应的技术人才资金那员工缺少体系化的更专业化的这种培训嗯
那我觉得 AI 的价值不应该仅仅是被大公司垄断或者说去谋取更多的第一的一个工具而应该更平等的去提供给每一个人然后让大家能够在相对公平的这个环境当中去竞争吧我觉得一定是要有人干这个事所以说虽然确实有很多人问我那哪些哪些哪些大公司在做这件事情你为什么还要干这个事
我觉得对吧市场那么大需求那么大大公司干了他不一定愿意去公布出来给这种小微企业去用当然也有可能啊他们去专门去做这件事情但是我
我个人觉得这件事情还是有非常大的价值的虽然总体这个提量很大但是也是比较碎片化是吧就除非你真的能做到一个病毒性传递的话你真的能 reach 到这个所有的还是我觉得这个方面还是比较有挑战这也是就是为什么可能你说的连大的公司都不一定愿意或者都没有能力去向这些每个用户去卖这个产品
你看我做 PTE 的时候全国只有 400 个考生对吧他照样这个行业能够发展能够推动那我相信我们现在在做的这件事情的市场是很
可能大于 PTE 的 100 倍嗯那既然有这么大的市场需求去债就天花板会目标是明确的嗯你思考的就是你怎么样从最小的切口开始最小的那一拨人开始去把它放大那这个同时也可以用一些 C 端的打法就是和 C 端很类似的打法来去做这件事情这并且也是我和我团队擅长的嗯
是正好就聊到你们关于 AI agent 也好可能比较宏观或者你们自己公司的比较微观的角度去看去畅想一下未来它的一个发展的趋势第一个这个东西它会改从一些行业开始去改变这行业的格局
特别是对于那些行业你会发现有 T 字型有公字型的有 T 字型的有橄榄型的那 AI Agents 我们做的是很适合这种橄榄型的市场就是说头部也很小尾部也小但中间特别大特别分散嗯
它会改变第二个是企业的规模会由原先的很多很多人大的公司变成它可能营收很高利润也还不错然后人员的规模变小就是中小企会越多大公司小型化小公司低型化对会越来越多那第三个是
很多管理或组织的形态会颠覆掉经典的这种管理的理论并且我觉得我们的这个平台未来会有很多的不同的有能够提供专业能力的 agent 在上面那这些 agent 未来我们会让他直接面对这段客户嗯
那么 Cedent 变成一个比如说 PGC UGC 一起聚合的平台也是有这种可能性的所以现在主要还是 2B 是 OK 我们也接近尾声吧所以最后我们会有一个推荐环节你有没有什么比较特殊的想给听众给他们这个复述一下关于创业的经历啊或者你自己的个人爱好啊或者讲一下创业的心得吧
嗯 蛮好的对 第一个 几点啊 我觉得第一个 我也看了接触了很多创业者从过去到现在有见到长得大的也有 对吧消失了的要确实要胆子大灵活 变通
这些软件东西就是你想了就去做你不用去听别人的比如投资人也好对吧行业的媒体也好同行也好或者说你是一些专家顾问什么告诉你这件事不能做那件事能做这件事没有对标那件事情没有人成功过你找准底层的核心的价值你找准你要去解决问题当中一些
存在的矛盾然后想清楚这种解决方案觉得逻辑上 work 就可以大胆去试不要怕投入时间或投入金钱来去犯错你只要保证底线就是公司不要去死掉对这个底线你就应该大胆地跟包容跟开放地去试就快速失败是吧 fail fast
或者 fail cheap at least,就是要便宜的去试错。对,这是第一个。第二个,你要做一件事情,你首先要想尽办法搞清楚就成功的应该是什么样子,不仅是一个贷款,就是这公司,对吧,你学习或说对标的公司,
它多少规模多少营收它品牌做什么样子而是要真正搞清楚项目就是用显微镜一样的方式去猜清楚它的发展历程它的组织架构它的战略打法它的定位
他的干部的特性他的激励方式就假设你已经成功了是吧未来他是什么样子一个完美的产品对你是一定要真的是像素级别的去搞就是对摸清楚了这个有点像亚马逊的那个 working backwards 他从一个结果就是他虽然这个事情还没有做但是他现在已经当做这个事情已经有了
已经存在了然后再从那倒推是你为了达到那个你需要在中间做这件事情非常重要这件事情会让你少犯很多错误并且让你你搞清楚让你不会那么急切的去做短期的一些决策因为你有个长期的目标在那因为你知道路创业它不是说我个人一直觉得创业不是在交叉路口选 ABC 哪条路去走嗯
创业是在大草原上面是海洋上面你完全没有方向你要去摸我觉得这个是难点所以一定要想办法搞清楚你要相信你做的事情是一定有人做过很多遍的这个可以再深挖一下这个原理是什么就是你做的事情很多人已经做过意思是他们尝试过但是他们没成你还是第一个还是
虽然我的意思是说虽然你现在做的事情可能技术上面有一些创新对吧你实在流量分发方式营销方式有创新但是这件事情本质和一百年前两百年前他做生意的是一样的所以更加是说你实际上其实有很多可以参考的例子你可以去学习的对对对我理解你搞清楚已经相当于是战略店的嘛然后第三个重要的是在人员
就是和组织方面确实要下大功夫有一句话说战略电脑最重要的就是干部你要什么样的人他什么样的能力怎么样评估这个人然后怎么样把不同的人结合起来一起良好的运转来去使用然后特别是怎么样给人一定程度的包容就不要去太苛责一些细节然后用稍微长远的眼光去审视这个人
然后让他们去发挥自己的价值你要相信工作的人大部分他其实是想把事情做好的很多人他最后变成不是你想要的样子是因为他没有和你和他做这件事情工作形成一个正反馈
他很努力了但是不断被批评对吧不断的就是由于某种阻碍然后失败然后没有人去理解他们心态就崩了就变了所以在人和组织上面下功夫是非常非常重要的然后第四个再补充一点你做的事情的用户的需求一定要充分的去调研你可以花 60%70%更多时间去调研因为你调研之后你就知道
问题是什么我认为绝大部分人知道应该做什么他其实找得出来解决方案的就这四点更加是我们要花很多的时间去首先了解最根本的问题是什么我们要问什么问题如果我们问对这个问题其实这个答案就在眼前
非常有精华的整个过程非常感谢刘亚丽 杨头老师来给我们今天带来的分享谢谢谢谢天一您现在收听的是《阔波治疗》一档带有 AI 味道的访谈节目如果您喜欢这一期节目请给我们留个言或点个赞也欢迎在各大播客与电台平台上搜索订阅并关注《阔波治疗》智慧的智 聊天的聊
同时欢迎关注我们的微信公众号 扩博智能 Clobotics 留言听友群三个字可以加入我们节目粉丝和嘉宾的互动群并且收到下一期扩博治疗的上线通知我们期待您的参与