Hello 大家好,欢迎收听新一期的数据女孩的终点危机,我是 Amy 大家好,我是 Stella 每周二我和 Stella 会与来自各行各业的有趣灵魂畅谈带你深入探讨科技、工作和生活的交汇点带来独特的洞见和思考
今天我们的嘉宾是魏华魏华老师呢是 Arizona State University 亚利桑那州立大学 School of Computing and Augmented Intelligence 的老师魏华老师跟大家打个招呼吧哈喽大家好我是魏华大家可以叫我导导老师或者导导
达达达你好我们的这个栏目也来了好几个 ASU 的老师了刚才在录之前我和 Amy 还在开玩笑说我们可以去 ASU 申请一个 grant 或者申请一笔专门的这个 marketing 的 funding 对啊对啊你们对 ASU 的 marketing 还是蛮有用的对吧我还是有贡献的
从不住在凤凰城的人看起来 ASU 确实是一个一直在走上升的学校感觉很多机会而且通过这个评论大家可能认识了很多 ASU 的老师这段到时候剪下来去要钱我们刚才提到导导是在这个 School of Computing and Augmented Intelligence 导导自己的背景是 Computer Science 是计算机
对的,这个 School of Computing and Augmented Intelligence 其实下面有很多个专业方向,Computer Science 是其中一个,然后 Computer Engineering 是其中一个,还有 Data Science,还有 Industrial Engineering,大概这四个大的方向。当然后面还有一些小的 Master Program,比如说 Software Engineering,这些也都在 ASU 的 School of Computing and Augmented Intelligence 学院下面。
导导和我们之前有一期的嘉宾也是 ASU 的老师是 YZ 是同事的关系嗯嗯对我们是同事导导的研究方向具体是什么呢我具体的研究实施是 AI 当然因为我在 CS 所以我的 Artificial Intelligence 是我主要的研究方向然后具体的应用领域可能偏交通一点那在这两个者的结合可能在现在大家最常听到的就是 Intelligent Connection
Transportation System 叫智能交通系统这个方向其实是一个交叉学科在 ASU 可能在 Civil Engineering 然后在 Computer Science 都有我们合作的老师
你本科是 CS 背景的但是为什么后来研究会做到这个智能交通系统这个在 CS 里面是不是算大家比较少选择的一个研究方向我觉得我自己一开始对这个智能交通系统完全没有什么概念基本上所有的 CS 老师都会寻找一个先应用的方向除了做比如说人工智能的算法研究之外可能还要希望把它落地具体应用到真实的世界里面
然后我自己最开始研究兴趣没概念然后大概是研究生的时候最开始的时候天天刷社交网络就想说就是能不能去研究一点社交网络的事情然后后面在实验室里就看到我们实验室有一些交通的数据我们当时开始做社交网络分析就想说比如说 GPS 的轨迹和路网的数据我们就想说能不能研究分析一下分析分析就发现自己慢慢就变成了 AI 和 Computer Science 用到智能交通系统里面了
也是比较老了大概就有十年前了吧正好是 Uber 和滴滴在中国国内进行大战然后就感觉交通和计算机的技术真的有应用的场景了然后变成了
以前每个人生活的那些关键技术比如当时可能大家没有这种打车的习惯后来有了这个 DD 和 Uber 进入然后有 CS 的这个技术支持之后被每天就是打车折磨的用户就可以享受到比如更快的打车更优惠的补贴这种就让我感觉好像自己的技术真的能有所应用然后还能改变每个人的生活就有点知情合一的这个感觉所以就后面对智能交通就慢慢做得深了一点
所以是你自己的兴趣我刚才以为是另外一种走向比如说你在读 PhD 的时候你的 PhD Advisor 他正好是做这个方向的或者是有这方面的项目然后你就不得不做了这个方向是
其实最开始我读硕士的时候是跟着老师来因为我刚刚说的就是比如说我们当时做社交网络的然后后面来了一堆交通的数据然后我们就想说能不能做点交通然后后面在做做发现就是对这个感兴趣然后我就在升 PhD 的时候去专门去寻找比如说做了一点交通的老师也是 CS 背景的老师那就是选导师的时候就会选跟自己兴趣 match 的老师
在美国如果要念智能交通相关的项目一般有什么学校啊因为这个感觉不是每个学校都会做的研究因为智能交通是一个交叉学科嘛所以要么你是读 Civil Engineering 要么你就去读 CS
我个人的建议是 CS 的学生就还是读 CS 会更合适一点因为你做智能交通领域你可能重点做算法研究而不是去做场景比如说你是 CPU Engineering 的学生你可能更注重什么场景需要解决那做 CS 的学生可能会 care 的是我什么方法能够用到各种程度相当于 CS 学生是一把锤子
我要把这个锤子吹哪里的问题然后 Civil Engineering 是我有一把钉子然后我需要 CS 的人给我这个锤子来解决我的这个钉子的问题所以美国的学校里就是 CS 和 Civil Engineering 比较强的学校可能传统的工科学校 Civil Engineering 都会比较强然后 CS 就是大家看 CS 的那个 ranking 就可以知道 CS 的方向具体有哪些人做就好了哇
我因为以前读的是 Civil Engineering 这个方向当然现在已经过去了有些年头了我不知道 Civil Engineering 的这个排名是不是还是和以前一样 UC Berkeley UIUC UT Austin 这几个学校是 Transportation Engineering 传统上来讲比较强的对 是的 是的我们刚才一直在说的这个智能交通系统导导可以给我们用通俗的语言解释一下智能交通系统到底是什么吗智能交通系统
真正系统最简单形象的比喻比如说给大家的这个交通系统或者城市的交通里装上脑子和眼睛比如说让我们的城市的交通系统能看能计算然后能想还能自我调整这是一个交叉学科它有比如说传感器的技术数据分析人工智能通信网络包括传统的汽车制造行业都
是能够 contribute 到智能交通系统里的它的目的就是希望这个系统更高效更安全更环保大概就是让大家上下班少堵车一点然后车祸少一点油钱省一点然后可能现在做交通系统的时候也会考虑说能不能让每个人更平等一点可以让城市的管理者少掉几根头发去解决交通问题更平等一点是什么意思就比如说我们在
规划交通网络的时候可能也要考虑说哪些地区需要让他们更 accessible 我们不只是让更富有的人有更好的交通也要让那些没有那么富有的地区变得更好到他们的工作的目的地
我在大学的时候稍微接触这一块还有就是行人的平等就是你的路权是要给人还给车的平等这样你刚刚说这个让我想到凤凰城的印第安人保护区不住在菲尼克斯的人可能不知道就菲尼克斯有很多一块一块的印第安人保护区
你在非印第安人保护区的地方就是马路都很宽然后基建很好你一旦进入印第安人保护区变成了土路是的然后你可以看到城市的边界其实划分的很明显从路网就可以看得出来是的智能交通系统这个概念听起来是非常的大它包含的内容也很多导导你是在这个领域当中你的 research 主要是集中在哪一部分呢
我其实主要在乎的还是以效率为主就比如说人怎么走就是车怎么开然后我们的交通灯是怎么变就还是说车人和灯的这个协调每个环节都有数据和计算的引入然后也都有可以优化的空间具体来讲就是可能包括交通预测我们可以预测哪里人多车多
交通控制比如说我们可以控制交通灯然后让这个拥堵变得少一点最近可能我们 care 的是怎么看让大模型能够引入到交通里面帮我们去做协作和协调举个具体的例子比如说大家可能觉得交通预测跟生活没有特别大的关系其实我们现在在滴滴 UberLift 里面已经用到了这个交通预测的算法
比如说十年前我当时在国内读研究生的时候当时正好是去滴滴实习然后天天都处理的就是大家的出行数据研究就是今天哪儿打车可能难一点然后明天哪儿可能堵然后滴滴的数据就非常多非常接地气比如说可以看到哪个商圈一下班就拥堵哪个小区一周末就有出去旅行的这种趋势
比如说音乐节就可能带动就是方圆几公里的这种打车场就是你就可以真的可以部署自己的模型然后看看我们预测的结果准不准那个时候通过你的预测结果比如说滴滴这种打车的公司就可以提前进行派单然后可以让大家等待的时间短一点这个就是交通预测上面最直接的一个显现
这个模型当时你在第一届的时候有机会是把它做出来应用在产品当中的吗?是的,这也是为什么我后面很喜欢交通这个场景,因为你是真的可以感受到你的模型是改变可能几百万人的生活的这样一个感觉。
我之所以离开 transportation engineering 这个行业就是因为我当时在做的时候我觉得所有的项目周期都特别长一做就做个十年十年之后你才知道十年之前自己的工作最后变成了什么样子但是当时我知道有这一个
应用方向的话我可能就不用完全的脱离 Transportation and Engineering 这个行业了对我觉得就是计算机的行业的引入可能很大一部分的帮助对于传统行业就是它可能你的反馈的周期变得很短我记得你们之前有一期是讲广告的从传统广告变成数字广告可能你用户的点击量就可以是一个直接的反馈但是如果传统广告的话可能要需要很久你可能没有一个很直接的 measure
所以我觉得计算机的这个引入在传统领域里可能最大的改变就是你的数据的反馈可以更直接你当时做的这个交通预测的模型它的 input 是什么你放进模型里面的数据大概是什么样的有没有特别有趣的跟我们分享一下就当时我们一堆人在做交通预测都是 CS 的人可能在传统的 Civil Engineering 可能大家也不会那么 care 交通预测问题然后
然后就没有一个 domain expert 我们可以去问因为我们比如说做 data scientist 在公司里如果解决一个传统的问题的话可能最直接的就是去问那些 domain expert 你们觉得哪些可能对我们有用然后在交通预测问题里我们当时是没有找到一些 domain expert 是可以告诉我们交通预测应该怎么用的所以我们当时最直接的用法就是把我们能有的数据感觉能相关的都用进来就比如说什么
过去一个小时多少人叫车啊然后昨天有多少人叫车啊上个星期有多少人叫车这种时序的数据然后还有一个就是空间的数据就比如说上一个小时周围的人都有多少人叫车然后还有一个就是比如说天气怎么样然后这个路网的大小是什么样子的所以就很多各种 feature engineering 的工作在十年前的时候是需要做的
然后具体的模型 10 年前大家还是在用那个数模型决策数的模型可能用的比较多的就是 XGBoost 慢慢慢慢后面大家会转到 Neo Network 神经网络这种模型但是最开始的时候可能因为神经网络在工业界的这个部署和 serving 并不是做那么好所以数模型还是做的效率最高的因为
比如说我们要求这个延迟可能要很短要很快地给出预测所以数模型还是当时的主流你们当时做的是什么模型就是数模型吗对当时做的就是数模型交通预测在预测什么就比如说预测在滴滴里面是有一个六边形的方格或者是四边形的方格里这个地图上的这个方格的区域里有多少人会在未来的五分钟或者十分钟内叫车
就是预测这个需求对所以你们的需求是只是看起始点你会看是从哪里到哪里的这种 origin destination pair 吗我当时的那个项目也是不 care 但是我知道后面他们会做这个 origin destination 的这个预测我不仅要预测起点有多少人我还要预测这个起点里有多少人会去到终点嗯
当时我们直做起点的原因是我们只是希望优化乘客的等待时间就尽快地 match 到乘客的等待时间但是如果你去做 Original Destination 的 prediction 的话可能会能更加帮助到司机在拍段的时候考虑到司机的这个需求但是当时因为我们在和那个 Uber 进行大战所以考虑的就是怎么把自己的乘客端的需求给满足的更好一点先让司机骂脏话没关系
对当时还是顶到很大压力对于司机来讲你们当时这个 deploy 部署下去之后能看到的马上的这个效果是什么马上的效果就比如说叫车的人就变多了还有就是我们自己的衡量就是乘客的等待时间变短了你还有印象吗就是大概是什么样的
这个有点太久远了我有点不太记得了但是可以明显地看到说我们的模型部署上就有很好的效果然后这也是为什么当时滴滴开始大规模地使用机器学习的算法他们也因此成立了一个人工智能和数字的那种研究院所以他们的确是看到了这个 CS 对交通领域的帮助
所以你们当时那个项目等于是第一个让滴滴看到 CS 在这个领域应用前景的一个项目我不敢说是不是第一个但是至少是当时我的 mentor 是因为这个原因被滴滴全职 hired 你们当时有多少个人在做这个项目
其实现在想想真的机会蛮好的就是我当时是我的 mentor 他去从密歇根大学就是他当时在 Spatical leave 学术休假然后就返回中国然后加入到 TT 我当时他第一个实习生然后他当时带了他的两三个 PhD 然后加上我一个实习生就是相当于我们几个人去做这个东西然后做完这个东西就部署上线就是真的是机会蛮好的我觉得
就是其实现在想想可能也没有那么好的机会可以真的把自己的模型部署上线改变世界的感觉
对对对就是现在想想可能在那个时候这是一片蓝海可能大家都很愿意尝试等一下老师 sabbaticalPhD 没有 sabbatical 啊对 PhD 没有 sabbatical 但是比如说老师在 sabbatical 跟公司进行 negotiate 的时候说我在你们这边 sabbatical 那你们可不可以放到我的学生这样子学生的钱就不用老师出是
是公司出因为有些人可能不知道滴滴跟 Uber 大战这段历史后来是谁赢了是 Uber 惨淡离开离开中国市场对从一个 insider 的角度来看你觉得 Uber 是为什么输的
我当时其实只是一个实习生我当时知道的感觉就是工作氛围的不一样我当时关注了 Uber 的公众号当时我记得 Uber 决定撤出中国市场还是被收购的时候他们的公众号上发出了一篇就是他们的工程师的一个文章然后就说很 proud of 自己的 product 然后工作氛围很好好像也不用怎么加班就我当时看了其实蛮羡慕的哈哈哈哈
但是心里也会想说 Oh this is why you fail 因为没有加班后来这类型的模型应用除了在打车方面还有运用到什么样的 Internet products 就比如说
就是变到我博士的项目因为我当时最开始的是做预测嘛然后就想说那预测完了我怎么真的改变大家的生活呢在滴滴里面可能是我可以通过派单派司机派谁去接谁让乘客等待时间更短但是后面我
变成博士生之后在学校里可能就没有机会再接触到像公司这样的第一手的数据,那就讲到说那我们能不能做一些偏学术性质的能够控制,能够影响世界的东西,就是去做交通灯的控制,比如说我们预测好了这个路段上可能会有多少车,那假设这个路段将来的车会很多,那我就尽量给这个路段多一点绿灯,
然后让这个车尽快通行过去这样会减少大家在车里的等待时间这也是一个交通预测的职业应用可能和滴滴不一样的是滴滴是做一个区域的交通预测那我们现在后面就变成了做路段上的交通预测这样子可以方便控制整个路段
做路段上的交通控制这个问题的 scope 就比之前滴滴说的那个要小了很多是这样吗我没有理解错吧也不但小了很多就比如他们的力度是细了很多滴滴可能是 care 的是 10 分钟或者是 15 分钟或者 5 分钟的这样一个力度但是如果你想做路段的交通控制我们可能想的就是一分钟或两分钟这样的力度
这样的一个交通控制的问题 optimize 你们优化的这一个指标是什么是每一辆车的等待时间吗对就是作为系统层面上平均的每辆车的等待时间比如说这个车从进入到你这一个路口到离开你这路口的一个时间比如说我们想要生一个十字的路你从进到这个十字路到离开这个十字路它的这个时间就是
就好像是水流经过一个水管然后它这个流速对它在这个水管里待的时间在水管里面待的时间相当于你这一个路段它的 friction 对对那水管是哪里到哪里啊
从进入到红绿灯前面的路段到离开你这个红绿灯的后面那个路段当然我们可以想象如果是我们考虑一个独立的交通灯它就是这样子但是如果是两个相邻的交通灯那它就是进入到这个路段到离开红绿灯的时间就是不同的 scopeOK
你们当时做交通灯控制的这一个研究你们是做模拟吗还是有现实世界的真实的数据去做当时也是有一些真实的数据但是真实的数据是还是交通灯上面的摄像头的数据我们知道车什么时候来
但是我们没有办法真实的去在真实世界里控制等等所以我们都是还在做模拟但是因为我们那一套的控制方法叫做强化学习的方法它的学习的机制就是我通过不断的试错然后知道在这个场景下我应该做什么样的最好的动作
然后不断的试错不断的积累所以才能学到最好的这个控制策略当然如果你在真实世界里你不可能不断的试错对吧你试了一个错你可能就有很多的 cost 或者交通灯的这个 crash 所以我们当时就是基本上在模拟器里去做然后模拟器里可能我们可以去不断的试错然后也有不同的数据流量然后车怎么动我们都可以去把这个模拟器设置的跟真实世界更接近这样
你说的模拟器是什么我们当时用的模拟器叫 SUMO 是一个专门的交通模拟它模拟的是车在路面上的移动比如说每 0.1 秒的移动方式这个模拟器里也包含了交通灯的哪个方向是可以走的这样子你通过控制交通灯的方向的哪个地方可以走车就根据一些交通规则就可以自动的完成他们的移动
然后就可以在模拟器里衡量什么时候进到这个系统里的什么时候完成离开这个系统的然后这样子你可以得到一个衡量的指标
reinforcement learning 强化学习这个方法应该也算是比较近的研究方法诶等一下是 deep reinforcement learning 比较近 reinforcement learning 对 reinforcement learning 其实很早大概八九十年代就有了然后深度强化学习是在深度学习之后大家会发现说因为传统的强化学习会有一些比如说空间太大然后我们没有办法优化的情况所以就用深度学习的模型去进行 approximate
去把他们的空间进行近似然后所以深度强化学习在 16 年的时候 15 年的时候 Deep Mind 他们发表了一系列论文证明说我们可以比人达到更好的效果还有他在和比如说李士实进行围棋比赛的时候击败了李士实大家都会真的相信了说强化学习可能真的可以在决策方面比人做得更好
你们当时做 Traffic Control 做交通控制用的是 Deep Reinforcement Learning 是吗是的交通控制这个领域在 Deep Reinforcement Learning 之前最流行的方法是什么呢大家还是在做优化吧
就是传统的 optimization 比如说我去 formulate 把这个问题变成一个假设我的车是恒定的速度进来的然后它遇到交通灯它会立刻停止没有这个减速时间然后它遇到绿灯的时候就会立刻达到它最大的速度给出一系列假设然后它会有一个优化目标就是说希望把大家的平均速度变得更高或者是希望让这系统的吞吐量变得更大变成一个优化问题
要解优化你需要有一些 assumption 然后再用传统的优化方法去解这个优化问题很多时候能够得到一个 close form 的 solution 这样子就是传统的交通方法
这个算是一个 paradigm shift 吗就是现在还有人在用 optimization 优化的方法来解决这些问题吗当然有啊传统的优化方法就是有一个比较好的就是他们很多时候能够给你保证最优解但是比如说你用深度强化学习可能很多时候你得到的解并不是最优的或者是深度强化学习你可能会有一些可解释性的问题你没办法解释你为什么
做出这个决策但是传统的优化方法他们可以给出一个路径说为什么但就是真实落地的时候有很多需要现实的考虑但是如果把不同的算法都放进模拟器里面去的话就应该会有一个很客观的比较到底哪一个算法更好
对对我们其实最开始的时候做强化学习也是先验证说在模拟器的各种场景下强化学习的方法能不能学到那些传统优化方法的自由解那我们实验其实证明说他是可以学到那个自由解的但都是模拟器下的结果
你真正的在真实世界里去应用的时候就可能就会有很多问题啊比如说刚刚说的可解释性的问题你要去把它做到真实的城市里那那些控制交通灯的 expert 就会问说啊你可以解释一下自己为什么做了这个决定然后以及假设你的 sensor 坏掉了你的那个强化学习的方法的输入就坏掉了那你可能没有办法很好兼容这种场景就是 robustness 鲁邦性啊这些都是在现实世界里落地的时候很多的问题
所以现在很多时候强化学习的方法我个人感觉还是在模拟器里进行验证和实验的会比较多真正落地的有但是也是比较少所以其实应用到反而是 self-driving car 真的在路上跑的还比较多
对对就真实的应用自动驾驶或者是不是在智能交通里的在机器人的领域里做那些手的控制啊家庭机器人其实还是用的蛮多的导导刚才还提到你最近做的有一个研究是跟大语言模型相关的
大语言模型是要怎么应用在智能交通系统里呢这个其实还是跟我们当时做交通灯控制遇到的问题相关比如说我们发现在模拟器里非常聪明能够拿到 optimal solution 的重力灯它
变到比如说下雨天的时候就没办法解决了就是我们的 train 模拟器里可能可以模拟正常的天气车是怎么开的我们就在这种车正常开的情况下就可以知道交通能怎么控制但是当下雨天的时候人的行为就变得非常多种多样那我们怎么去模拟人多种多样的行为呢这个时候我们就想到说不大语言模型其实它有很多 world knowledge 它大概能够知道说人在下雨天是怎么
进行开车的是一个 aggressive behavior 你可能只需要一个 prompt 就可以定义出不同类型的 driver 那你这样子有了不同类型的 driver 之后你就可以通到模拟器里知道说我遇到不同类型的 driver 我应该怎么去做协调做控制
说起来这其实是我对于 reinforcement learning 和 deep reinforcement learning 一直以来的一个问题就是那个 environment 要怎么设置就是你刚刚说的模拟器其实就是那个 environment 对这个模拟器它其实有很多可以 tweak 可以改变的东西那做强化学习你当然是希望你的模拟器能够尽可能多的 cover 真实世界的场景
那很多时候很多真实世界的场景如果人去主动去设置可能会比较麻烦如果你交给大于阎模型去说你帮我想说各种场景这个改变环境的 process 是由大于阎模型去优化的那我觉得是一个非常好的具体是怎么做的呢就比如说
下雨天我就问大雨天某些人说你可不可以给我生成出各种天气下的人的 behavior 可能是什么样子的可能就会给我各种比如说下雨天人的加速度和减速度是什么样子的下雪天人的加速度和减速度是什么样子的那这样子加速度和减速度其实就是现在模拟器里的那些叫做 hyperparameter 超参数那你有了这些超参数之后你就再去做模拟
然后你的交通灯的控制算法进行控制然后你会有一个 performance 然后这个 performance 就再位给大语言模型说在你这个设定下我的交通灯是表现不好的那你能不能生成出类似的更难的场景然后大语言模型就会给我生成出更多的更类似的场景可能稍微变一点那些加速的减速的数值那这些其实就是具体的比如说大语言模型怎么去 automate 这个优化模拟器的这个 process
它这个生成出来的 hyperparameter 的这些 input 跟实际生活都很接近吗对我们在有一篇 paper 里其实做过一个验证就是我们会看传统的说在下雨天人的驾驶行为的一个 paper 他们有些数字然后我们当然带预言模型去预测在相同的天气下它是什么样子会有一些误差但是大概的趋势都是一样的
所以我就会怀疑说大元模型是不是已经把那个 paper 见过了然后他就去 overfeed 到我们问的那个问题然后遇到相同的问题他就给出一个类似的答案所以就是大家在做这个研究你把文章放出去然后放到网上你真的说不准大元模型到底有没有见过它
你们都试过哪些大元模型大元模型其实比如说 Lama 然后最近的 DeepSeek 就是开源的模型我们都会试闭源的模型我们也会去买一些他们的 key 买一些他们的服务然后去调他们的 API 去试当时在我们的文章里我们用了千问然后也用了 Lama2 还有一些验证的时候就是小规模的验证的时候用了一些闭源模型比如说 GPT-4 O 的模型
不同的模型应用下来有什么不同的感觉吗我其实就是作为 researcher 来讲我们当然是觉得哪些模型便宜我们就用那个我以为你要说哪个模型最准确当然我们也会去衡量它的准不准确当然现在也有研究发现说同一个 scale 就是你的
那个参数量级是类似的情况下大家的模型其实大差不差了只要你改变你的 prompt 可能大家都可以达到相同效果就是你想假设可能有一个 Lama270B 或者是 Lama213B 的模型它表现没有那么好但是你可以通过人工的方式你可以让自己去或者学生去做一些 prompting 花一些 effort 去让它的模型效果达到跟 GPT4 或者 GPT3.5 相同效果但是
LamaTool 它是 open source 的也是免费的然后你人工可以 compensate 这个花费你干嘛要去花钱去做避炎的学生的时间不是很值钱你这样前五分钟铺垫的这个很高大上的 researcher 形象突然就 drop 了
没有因为真的就是如果你要用币源的模型当时这是一个 hard lesson 有一篇 paper 就是我就跟学生说你们就去用 gpt 的模型多少钱我们用 funding 去 cover 帮你们报销我们在家之后附近下来发现一篇 paper 可能要花个 1000 到 2000 刀
这个我们每年要做那么多实验要做那么多 paper 这个花费其实是蛮大的所以后面当我们知道说我们可以通过开源的模型然后加一些人工的 effort 让它输出的更准确的时候大家都可以理解说你去做这种方式更便宜当然是最好所以我觉得 DeepSeek 出来让把价格打下来然后造福人民群众我觉得是非常有意义的
你们有遇到过大模型 hallucinate 的状况吗会遇到比如说刚刚艾米问到说它的准确率到底怎么样我们看到说它虽然可以给你一个趋势但是它还是会有一些误差的那我们可能在那种情况就把它认为是 hallucination 对于 hallucination 现在学术界的一般的解决思路是要么你就去做不确定性的估计比如说你不仅给出我你这个答案你不仅给出我
我还要去衡量一下你这个答案给的准不准确然后你有多自信这种分数其实防止他胡编乱造这个其实是一个比较好的技术这也是我们组现在的一个方向另外一个就是比如说给他一些规则的约束然后还有一些专家的反馈看到这个答案然后你就说这个不是我想要的你有一些人的参与在这个过程里面告诉 GPT 去优化这其实也是另外一种方式还是有一个人在 review 这个结果的这么一个步骤对
你们做的这些研究也是有 founding 的你们这些 founding 的来源是哪里
可能很多学校的 researcher 大家的 funding 都是来自于公共的部门的资助比如说 federal 的 government 的 funding 像 national science foundation 比如说你做 transportation 的研究可能还会有一些 department of transportation 交通部的 funding 比如说你做一些 energy 的研究你可能会去拿到 department of energy 能源部的 funding
联邦级别的 funding 其实是很多的大头然后还有一些比如说州里的也会有一些 funding 像州里的比如他要做 planning 他也需要一些 research 的帮助那他会就州里的 DOTArizona DOT 也会去放的一些项目去做落地的这个工作另外一部分小的就是比如说来自公司的比较像 Uber, Lyft 这种做交通的项目和 Google 也会给 research 一些 funding
这种拿公共部门的基金做的项目是不是没有那么大的要落地的压力我觉得这是很多时候大家的误解吧尤其是交通领域就是它的资金来源是非常多面的更多不同 level 的机构大家关注的重点完全不同
比如说我刚刚讲到联邦的项目州的项目和产业界的项目工业界的项目的基金来源可能都是要求不一样的比如说联邦政府的项目它可能就是研究去懂这是为什么很多 researcher 希望能够拿到 National Science Foundation 的研究因为它可能会要求你 deliver 一个产品可能很多时候的衡量指标是你的文章然后你的 patent 的这种数量
它可能支持的是更多的是长期的探索州政府的话它就重点在于说你能不能真的用在我这个州里因为州政府的钱可能真的就是要建一条路然后就真的要去优化交通等等所以很多时候州政府的钱比如说加州的 CalTrans 然后 Arizona DOT 这些州政府的资金可能专门支持州政府交通项目的落地它的钱比如说可能更多的给的是大学和企业和地方政府共同合作的项目
去确定要搞真的要以交通优化的问题比如说最典型的州政府的项目可能是用 AI 去优化 Fenix 的公交调度或者用传感器去改变某条高速公路的这个用途管理在哪里拓展多少条路这种这是在州政府层面的研究项目就是重点看能不能用
然后产业界的就是就真的就冲着落地去了比如说 VIMO 然后特斯拉他们就可能需要的是那些能够快速落地的东西它是更倾向于说老师和学生能够拿到他们的数据帮他们去解决他们产品里的问题然后看看哪些技术能够对他们的产品直接有用所以这些钱基本上都是给到大学的实验室没有任何州的东西也没有任何别的 party 来 involve 进来所以就是不同的 level 的层级他们会开不同的事情
谈到科研基金就很难不说到最近的美国的新的政府对于各种研究基金的一些动作现在这个政府是砍了很多的科研基金这个对你们有影响吗我觉得影响肯定是有的但是也是得分情况来看他们可能能够影响的是 Federal level 的 funding 然后对于学校来讲你可能还会可以拿到州政府的 funding 和工业界的 funding 这个应该是
不会受到影响的像那些基础研究的资助可能比如说能源的研究啊但是我不太清楚就是具体哪些会被研究但是我个人觉得对于 AI 和智能交通这些方向它还是美国联邦政府核心竞争力的一部分所以也不会全砍
我能听到大家说的最多的是影响最多的可能是比如气候变化然后公共政策相关的研究可能看得比较厉害周里的变化就不随着联邦政府走作为 ASU 一个好处就是你是周里可能最大的学校可能还是有很多州政府的钱需要给到周里最大的学校现在已经知道了吗现在是 2025 年的 3 月 1 号今年的 funding 能不能下来已经有眉目了吗
像 Funding 的申请其实它并没有一个说我一月份就能知道结果它可能很多时候是 rolling 的它没有固定的时间就会放出一些比如说尤其是州政府的 Funding 它可能会说我经过研判我们可能需要解决菲尼克斯凤凰城夏天炎热的问题了那我们可能就要在最近的时候放出一个 call for proposal
然后等到冬天了我就会说那我们要解决这个 Winterbird 来到 Phoenix 然后增加交通用途的问题我们怎么去解决这个问题我觉得对于很多时候州政府的这个 deadline 并不是那么明确然后对于联邦政府像 National Science Foundation 他们会有一些固定的一些 deadline 然后也有些 rolling deadline 所以很多时候你是不太确定的而且现在 NSF 没有明确说他们会砍掉哪些项目
但是你是可以教的只是说你的基金可能不会被那么快 review 或者是你的周期会很长所以这个大家都还不太清楚但是目前看来导导你们系的招生包括招新的老师是没有受影响的是吗对我们系还是没有受影响就刚刚说 ASU 它是很大的一个学校然后它有很多的本科生也的确需要那么多老师来教学然后资金也比较充足
对我听说 ASU 还有一个比较有意思的地方是这个学校它有很多不同的投资又给 ASU 插一个广告 ASU 投资了很多房产这也是我后来才知道的它其实靠那些房产也收入不少所以它还比较 diversify 我知道 ASU 有一些部门受到了这个 cut funding 的影响但是好像总体来讲还好
他有很多房产我倒不清楚但是说我们现在的 Sky 的系楼就是当时好像他们 08 年有房地产大亨破产之后 ASU 买下来的就变成了我们现在的系楼 which is a good strategy 别人帮你建好楼你就直接买就好了对
砍 funding 有些是不确定性的问题就是你不确定能不能拿到所以你就不敢做很多事情我觉得对于老师来讲就是你不确定性能不能拿到我看到我周围的老师都是你接着教接着还是按就办的做你该做的事情该交的 funding 你还是交
因为你不交就是拿不到 funding 你交了说不定他们还会有一些延迟那你可能 dp 在那个铺就当于现在排气一样你就越早交你可能越早被审到你可能越早知道结果就如果他的这个 budget 的砍掉那他肯定还是要支持一些 funding 那可能越早交的人所以你还要在排前面对对对
导导在中国也工作过然后在美国也是非常深入的去做很多 ITS 智能交通系统的研究对比中国和美国智能交通系统的发展你觉得差距大吗哪一个国家做得更好
我觉得就智能交通的技术上来讲我觉得差距不大我觉得更多的差距是在政策和推广的节奏上面中国的政策推广非常快然后美国的政策可能州跟州之间的差异比较大美国也有推进非常快的
比如说举个例子中国的试点它会有很多试点政府说要搞一个试点或者是学校和企业联合政府搞一个试点就很快一个城市决定要试点智能交通项目开始到落地就直接就几个月就可以搞定但是美国可能往往是那种点状的或者不同城市和不同州之间的步调非常不一样可能审批流程也比较长所以导致就是全国性的推广可能比较慢
美国有哪些州是推广相对而言比较快的亚利桑那我们要去给州政府申请 marketing budget 对州政府有没有 grant 还有就是加州也会推广比较快我觉得这可能是为什么亚利桑那的分红场会变成自动驾驶汽车的这个孵化的地点吧很多都会来这边去做测试
但我也知道有一些州就非常严格比如说纽约它对这个数据的隐私要求非常高像中国你可以装很多摄像头包括你在凤凰城可能会看到有一些摄像头但是在纽约的话这个智能的摄像头啊然后红绿灯的联网的这种
隐私的这个考虑就会变得非常多我以为加州也会比较慢因为加州做其他的一些比如说基建项目也都是拖很多很多年基建的项目和智能交通的项目可能还会有一点点差别比如说像这种软件形式的像这种微博它就是做推广的如果不去做建设不去动用土地就觉得加州还是非常欢迎所以加州政府是它并不是说反对这些新的技术它就是做事慢而已是吧
我觉得加州他会挑有 PR 的做有酷炫的可以上新闻的那个会先做就像威某好酷哦 YouTube 来拍这种就很快可是你说那种好几年或者是像这次山火他不是马上能够看到或者他是一个 preventive 的东西那就很慢就不会发生
我觉得这也是一种策略吧就是你更激进的你希望可以做出一些能够抓人眼球的那它就往往就是技术创新给人的最强烈的印象这也是是点它的意义所在对啊我听说凤凰城已经有蛮多无人驾驶的威某了
从你的角度来看这些 Vamo 对你做交通系统研究有什么影响吗你有参与过这样的项目吗我没有直接参与无人驾驶汽车在 Phoenix 的研究但是我有朋友也和我关系非常好的在 Vamo 然后在 Uber 和 Lyft 这些公司工作其实我个人的感觉就我现在在 Phoenix 地区的研究上其实没有什么特别多的影响耶
因为它可能一个大的原因是它的渗透率还不是很高有些研究说明说如果你渗透率达到 5%你可以明确地明显地影响整个城市的交通但现在我感觉好像没有到 5%的这个场景所以我们现在也没有明确感觉到微博对这个城市层面的交通有什么影响但是的确你会看到会有一些特别的景象就比如说像如果你在 ASU 的附近或者 ASU 的校园你真的可以看到
VM 的车比较多驾驶的风格偏保守那比如说我开车去走在 SU 校园的时候看到我前面是一辆 VM 车我就会尽量绕开它或者是尽量超过它因为它的驾驶风格太保守了你要等到左转的话大概会等到左转最后几秒的黄灯的时候它才会过去那黄灯它过得去那我不就不一定过得去了你已经是第 N 个这么跟我说的人了
在 Fenix 有好多人都跟我提过这件事情就是说在路上看到 VIMO 了就很想赶紧超过它因为 VIMO 开的相对比较慢一点
那 Tesla 呢?Tesla 因为我们也不知道他这个司机具体在城市里开驶的时候是不是自己开所以我也不太确定但是遇到特斯拉我也会稍微绕着开走因为我感觉有的时候特斯拉他如果他使用自动驾驶的话可能跟特斯拉自动驾驶风格 autopilot 的风格有点不太一样有的司机就感觉他们开的时候就非常 aggressive 就稍微前面有一点点空隙他就插进去了哇这个是牛啊如果是自动驾驶的牛我用过一段时间的 autopilot
但我觉得它太 aggressive 了我后来就没敢继续用但是我看好像特斯拉是不是你可以选不同风格的模型你可以 aggressive 是不是也可以不 aggressive 我倒还真没有挑过但它的不 aggressive 可能也指的是一些比较直观的参数上因为它最
因为它最新这个 update 我身边人人快然后我身边蛮多就是比较老人群体他们都会很自豪地说他开的比我好因为他们现在反应已经比较慢了所以他们都很爱用 Tesla 对啊我觉得这可能也是自动驾驶对城市里的驾驶的文化产生的影响就是如果路上的自动驾驶车多了可能大家都会习惯他们开的比人还要稳然后稍微就相应地调整自己的驾驶方式
我有一个觉得比较好笑就是 Tesla 看到前面是 Vemo 不知道 Tesla 的 AI brand 你们在想什么就想了这台车很慢说起 Vemo 我前一段时间在 ASU 附近看到了两辆非常搞笑的 Vemo 就是因为 ASU 附近也经常修路嘛就是那条路大概是有三条车道最里面那条车道就是在前面封住了有一辆 Vemo 开在那个车道上它就要并到旁边的车道嘛
他就真的很保守我在后面看了真的觉得很好笑他就是一点一点一点的蹭过去然后他就希望这样蹭过去旁边可以有一辆车给他让出位置来但没有任何的车让他直到他遇到一辆 vamo 也开过来他的 brother vamo 让他先进去了他才开过去我当时觉得真的很好笑
所以如果有一天所有的车都是自动驾驶然后信息都是互通的这交通系统会变什么样会不会对你的 research 其实是会方便很多
我觉得是因为我之前做交通灯控制的嘛所以对我的设施直接影响就是我不用做交通灯控制就没有红绿灯了大家都排队就是协商通行然后就跟渔群一样到了路口不用等红绿灯然后直接车流自动比如说编队的这种穿插然后闯红灯的概念也没有了
就没有红灯了然后第二个我觉得可能最值得影响就是可能不会堵车但是会变成对 AI 的算力的一种考验比如说所有的车都知道彼此路径那城市规模比如说有十万百万辆的车你同时在这个城市里你 AI 要去优化它的这个路径和它的驾驶的风格驾驶的行为就谁先走谁后走谁先拿到 AI 的这个权利就还是一个挑战吧
我在想像导航是不是也会变得完全不一样因为你如果全部都是自动驾驶的话它反而不是怎样是最快入境而是可以把要去同一个地方的人去把它绕去同一个路线那它转弯就比较少所以
所以它整个路径优化的概念可能会变得不一样现在的这些导航是不是更类似于一个局部最优解的概念就是它的目标是我要让我这辆车的路程是最短的或者是有什么别的这个目标
目标函数但是如果所有的车都是信息共享的那它其实做的是一个全局最优解我想想这个还蛮好笑的就可能说如果真的有这一天我打开我的手机 APP 进行导航它可能给我推荐一个特别绕的路线因为这条路线是全局最优解的一部分
是有可能的这是刚刚我们最开始提到的可能会有比如说这个更平等的这个问题现在其实在设计路段的时候就已经有这个问题了怎么说如果你要让整个城市的交通最发达的话那你就让建更多的路给那些人口最密集的地方那人口不密集的地方比如说印第安人去你不建路可能对于整体的这个最优解来讲没有什么影响
我刚想到这个全局最优解我就想到很多社会问题假设只要有一个人他不想要走最优解的话那全部就不是最优解了对啊对啊感觉会有一些比如说博弈论的这个思考在里面对吧如果你是自己比较贪婪的时候那可能大家都自己比较贪婪就会立得出一个社会上大家都自己 local optimal 的 solution
如果未来有一天所有的车都是自动驾驶并且它只能自动驾驶的时候是不是汽车这个概念会变得更偏向于有轨电车有点像有轨电车也有点像 Uber 吧就是共享汽车就是你不用然后我就去接别人这种有可能会变成公共设施的一部分
对而且甚至可能都不会再有停车场了就是因为所有的车都会去接别人都在 run 车场不开心还得买比较少车
导导做这个智能交通系统的研究你有设想过十年或者是二十年之后我们社会的交通系统会变成什么样吗我有想过其实这个问题也是我当时在博士答辩的时候我的导师们和 committee member 们问的问题哇你看我这个水平开玩笑当时他们的想象是十年二十年可能就很多的车都是自动驾驶就不需要
不需要交通灯但是我不觉得那是一个十年二十年能够完成的事情我还是觉得十年二十年之后是一个部分车是自动驾驶然后部分车是人工驾驶的这样一个条件是要 mix autonomy 就像是说混合自动模式你的系统里有部分是你可以控制的或者你可以影响的有一部分是人的你不能去控制不能去影响那在 mix autonomy 的情况下通过控制
联动那些你可以控制的部分其实可以影响整个系统的表现的
导导你这个外号还蛮特别的你为什么叫导导啊其实最开始的原因是因为我在大学里当辅导员带了大概 120 个学生我的学生可能大概都是 95 后大家的称呼就会就是叠字然后比较萌一点然后就叫我导导魏导导然后后面朋友也开始叫我导导然后我现在的学生有时候也叫我导导老师这样子
你刚才有提到你在滴滴比较早期的时候加入,在业界工作过,而且算是一个蛮 exciting 的机会,你为什么想要又回到学校?其实我自己在业界也曾全职工作过,就是我的完整的经历是,我先读了博士在宾夕法尼亚州立大学,然后又去回国工作在腾讯,
全职工作了一年然后又回到了美国当老师然后说白了为什么去回到学校呢就是感觉更自由一点吧我自己个人是不太喜欢那种朝九晚五的生活我可能喜欢的生活是啊
随时比如说想去买咖啡想去外面晒晒太阳就去外面晒晒太阳然后决定 remote 工作就去 remote 工作这种自由的感觉然后我也不太喜欢有人天天盯着我完成今天的 KPI 然后每天去开个早会这样子我希望能够自己去决定自己研究什么而且可能这个自由还提醒在我可能能决定自己的研究方向吧就是你在工业界里你可能会随着公司的需求走
然后虽然学术界有压力,但是我感觉更像是给自己打工,然后自己给自己挖坑,然后项目经理或者是老板 push,然后自己 push 自己,可能听起来稍微高雅一点,或者稍微压力没有那么大一点,但是可能会更累。当时找教职会很难吗?
我当时找教职其实心态上是比较佛系的然后行动上是比较紧张就是因为我当时已经有一份全职的工作了嘛所以我的心态上就是说能够找到就去然后找不到就继续工作因为我在腾讯的工作其实也蛮开心的然后我的团队也是做研究行职的我的 mentor 和我的 leader 都还蛮支持我做的研究的所以心态上找工作的时候
并不像那种背水一战的感觉但是行动上就是当时的教职市场还是非常紧张因为我当时找到的是 20 年疫情刚刚开始很多校都 close 他们的教职都不开就当年说要开然后后面就 cancel 掉了所以当时开的学校不多然后一边工作又一边申请待烂也是排满
很多材料教职申请的时候要准备然后还要练习 rehearsal 自己的 presentation 这种行动上还是很多的我以前有听说如果 PhD 毕业没有继续留在学术界而是去了业界再回学术界就会比较难了你当时找教职的时候有这个感觉吗因为你当时是已经在业界了嘛
嗯我觉得看方向和看自己在工作的时候有没有继续做研究吧比如说最近几年在 ASU 或者是很多别的学校在老师的时候就有从工业界回来的大家宣传一下又在打广告当然这不只是 ASU 了在别的学校可能也有就是嗯
你可以看到之前在 Meta 在 Google 或者在 Intel 工作过的人他们一直也在发论文然后他们也有非常影响力非常高的论文如果你一直在做研究的话其实学术界是一个比较开放的心态的英雄不问出处大家都会有比较自由的维度去衡量你适不适合做老师这个职位我自己其实是因为我当时刚刚毕业然后可以是一个 fresh PhD 的一个心态所以大家看我的时候也不会把我当作是一个从工业界回来的人
我听说你的 PhD 的 advisor 反而辞去 tenure 终身教职回去做业界你当时有没有觉得还蛮讽刺的就你要回来做教职然后他跑去做业界了对当时我的第一反应其实是理想最终还是败给了金钱哈哈哈哈
所以你觉得他是因为钱吗对我当时第一反应肯定是就是因为业界真的就是你知道做 CS 你的业界的钱其实是你比你较值的三倍四倍
我当时的导师已经拿到了终身教职他在回国其实是可以有很多帽子可以戴的所谓的帽子然后你其实就有很多钱可以拿我当时第一反应其实理想最后最终败给了金钱但是后面了解更多之后我再跟他聊现在跟我的导师还是保持非常良好的关系我就跟他聊之后发现其实不只是钱这么简单就是我的导师他自己是一个对 research 非常有热情的人
他非常希望自己的这个项目能够落地我现在也是希望我做的东西能够是一个落地的项目然后他在国内的新工作可以给他这个机会去让他落地那我觉得这是一个非常好的机会就是很少能有机会你可以真正把握住可以落地就像我当时在 DD 实习的时候我真的可以让我的模型落地能够改变世界这个理想还是有的
当然他也有家庭方面的考量比如说回国可以让他的工作和生活更稳定然后对他的小孩的教育可能也更好但在他的角度我觉得那个选择是让他更开心不只是单纯的理想和这个现实的这个抉择无论在业界还是在学术界好像如果能落地都会觉得很爽那
对啊对啊我当时其实在实习的时候也做过很多项目然后有些项目没有落地其实真的挫败感蛮大的能有机会落地看到就像就是送自己的孩子然后出征然后送他世上大学的那种感觉你知道就是他达到了他人生的理想这样子那对于你的研究领域来讲有什么项目是业界比较好落地做得更好了有什么是在学术界反而机会会比较多的
嗯因为我是做人工智能就是如果除去智能交通以外做人工智能这个问题其实变得非常非常的微妙现在就是大家看到比如说大模型
过去的时候大家觉得学术界是做基础研究的然后业界是做应用的然后现在大模型的时候大家会看到好像很多的令人印象深刻的大模型都是工业界做出来的然后学术界还能搞出那些大的事情吗但是我其实个人还是觉得大模型推向市场的市场化
是业界去做的然后大模型的底层概念然后关键的原理然后还是来自于叙述节然后业界最擅长的就是堆人堆资源然后可以快速地验证一个概念是不是有商业化或者是有落地的价值比如说很多海量的数据然后算力这个支持的很多尤其是现在大模型大家在做验证那种 scaling law 随着你的规模的上去你的表现是不是会更好
学术界还是有很多方法的探索其实比如说 Transformer 它的核心的概念最早还是在学术界的论文体现出来的所以我个人感觉业界可能更适合规模化和优化比如说在我的智能交通的领域里可能要落地业界的确非常擅长要考虑很多现实的问题然后学术界可能更擅长的是创新和理论的探索
但是现在呢就是量子的边界也越来越模糊我也说不准可能未来随着很多优秀的设施去工业界那可能工业界的做基础研究也会变得更好当时有考虑在中国做教职吗就是从做教职而言中国跟美国有什么不一样
我当时在毕业的时候找工作的时候有找国内的教职但是最后没有入职我自己没有在中国做教职的经验但是我面试了嘛从这个面试的过程里然后包括我也有很多朋友和同行在国内
反馈来看感觉中国的学术环境更像是一个团队作战你选的不只是这个学校你作为一个助理教授你可能不只选这个待遇是如何你可能更选择的是一个团队比如说你的学校里有没有院士或者是有没有更厉害的人然后你可以去跟他一起加入他的团队然后你们可以一起带学生有一个很多个学生一起来做事情
然后在美国的话可能更注重的是比如说我们 tenure 的 evaluation 更注重的是你是不是有自己独立的学生自己独立的 founding 这种更像是个人的独立探索还有一个就是就师生关系差异在中国和美国还是不太一样的比如说在国内导师和学生的关系更像是上下级的关系
然后很多时候导师会有很大的话语权,然后在美国可能私人关系更平等一些,更像是一个合作者的关系。对我的感受而言,比如说我个人的生活上的事情,我是不会让我的学生就参与了,比如说去个快递什么的,这个是在美国是绝对不可能的,但是可能有的时候在国内这个是可以发生的。另外,
另外就是研究和落地吧就是中国的高校可能越来越强调科研成果的转化就是鼓励教授创业然后去接这种横向的项目去做落地的应用但是美国的学术界可能还是更偏基础研究一点然后虽然也有技术转化但是整体来讲产业界还是主导这个应用的这个趋势比较明显
虽然就是在美国我们老师不能叫学生去拿快递但是刚才我们录音以前今天是礼拜六然后导导还在帮学生改 paper 所以这个角色感觉有点反过来你一般帮学生改 paper 你的心理活动是怎么样的
我一般就是对于不同阶段的学生你可能他们写的 paper 的这个感觉会不一样比如说我今天可能要帮一个比较 junior 的学生国一的学生改 paper 我当然自己的期待是就是他可以写出一个他自己觉得比较好的就是自己再也改不了的他已经达到他 try his best 的一个 paper 然后当然我打开的时候我还是倒吸了恩口良机哈哈哈哈
然后还是要比如说打开完车大概漏了一眼就有一些明显的错误然后放在那里然后出去泡一杯咖啡然后再回来慢慢地改慢慢地给他 comment 这种就是我的一般流程就是让学生先写然后让他有个自己思考的过程
然后写完之后我再给他说这个对于一个外人或者对于一个 reviewer 来讲这个是不行的那为什么觉得不行希望你下次可以改正我觉得这样一个 feedback 的过程是学生可能学得更快的一个流程所以就是如果学生主动找我说你能帮我改一下 paper 我已经 try my best 那我当然是非常乐意去帮他只是中间可能还是要做一下心理建设
你现在改的 paper 有感觉 AI 感越来越重吗有如果这个学生他直接从 Tri-GPT 复制出来或者是直接让 Tri-GPT 生成出来的我们还是会有一些 sense 他是 Tri-GPT 生成出来的就我们自己的实验室有一个 handbook
然后我们的 handbook 上面有一个建议是说你把这些 prompt 输进去比如说有一个 prompt 就是说请不要用这些词比如说 pivotal 什么 paramount 这种字在你的 paper 里一看就是 AI 生成的我们就会让它变成 prompt 让学生为给差 GPT 让他不要生成这些东西
说起这个有一个词也是一看就知道是 LLM 生成的就是你在看简历的时候如果看到 spearheaded 哦 spearheaded 好讨厌基本上是可以判定是 AI 生成的可是我觉得至少 chatGBT 也越来越好他有把这些比较浮夸的词现在比较少出现了嗯
嗯 是是是 而且现在比如说新的产品出现比如像 deep research 这种的产品出现我觉得对于学生来讲其实是减少了很多去做 survey 的这个过程他们可能只需要去做 verify 因为有一些别的 discipline 的教职人他可能会觉得就不能用 AI 写你们对这样的立场有什么感觉
我其实觉得它既然已经出来这个工具就在那里你肯定需要用的那至于说怎么用然后你决定要不要用这个就是学生和 researcher 的责任就是它给你的结果然后你自己是要 take responsibility 的它写出来的东西比如别人说这是假的或者这是错的那你不能说这是 AI 产生出来的我不负责任这是任何的技术的使用者都需要考虑的问题你如果要使用了它做这些事情那你就要对这个技术负责
所以我个人比如说我上课的时候我也会跟学生说你可以用但是你要对他的东西负责然后也会告诉学生说哪些场景是适合用的哪些场景是不适合用的我觉得让学生越早的去熟悉和熟练的使用 AI 越能更加帮助他们在后面的工作
完全统一而且我觉得这个是一个不可能反抗的发展方向我们之前也有听说过有一些领域的这些期刊它可能要求你提交的 paper 是完全不可以用 AI 的但是我觉得这个怎么可能做到就是
你怎么可能能够百分之百的判定一篇 paper 到底是用了 AI 还是没有用 AI,除非他用了我们刚才提到的那些 spearhead 这些比较浮夸的词,现在来说我觉得基本上是不太可能要求人不用这些工具的。
对而且现在从技术上来讲你要检测一个东西是不是 AI 也是难的对啊那导导老师一般看 paper 你看什么 paper 会觉得很开心什么是一个好的 paper 刚刚讲到我们做 handbook 就是在做 research 的一些 handbook
我们学生就发明了一个叫 paper reading games 就是我会让学生在读 paper 的时候带着一些问题去读就是问题是什么呢就是我希望在读完这本 paper 之后我有一个一句话的总结然后如果我用一句话总结这个 paper 我应该是怎么办然后如果我要用一段话去总结这个 paper
我应该怎么办如果是要更详细的比如说做 presentation 的时候我应该怎么办我们读 paper 其实一般就是去读 introductionabstract 简洁的就跳到了比如说文章中的一些图它的实验结果然后它的 future work 这些部分这是最快最快读 paper 的方式然后我学生其实都被建议要这么读 paper 但是我也有一个学生做的比较好他构建了一个 AI 的 agent
然后他只需要把 paper 喂给那个 AI 然后他就 AI 就可以给他生成的这一计划我不知道这个过程他有没有真的学到东西但至少他可能自己还会去做一些 refine 然后也会真的去读去 verify 产生的对不对但是他这样的方法读 paper 就会读得会很快现在导导就是在给我和 Amy 看他们实验室的这一篇 How to actively read a paper 的
这个是你的学生写的还是你自己写的不是就是我们的 handbook 上比如说你看到的 paper tips 里面有一些是我们同学在网上看到觉得还不错的可能有些东西我们已经自己在用了但是我们不知道怎么把它系统性的总结下来然后看到别人总结了那我们就转载回来有一些是我们自己总结的准结成体系的那就放到 handbook 里比如说新的 PhD 他们在写 paper 的时候就可以 refer 到
其实我们的 handbook 有很多就是真的学生每天都在用的比如说我们有一些 day to day 的 expectation 然后 paper writing 的 checklist 就是说七天前你应该做什么然后 dialine 一个小时你应该怎么干什么把每个都过一遍有的时候比如说我们在 main 的 dialine 的时候你会觉得自己有很多东西没有做但是你把它写下来之后你就会发现说我 check check check 这个你的心理会好一点而且你不会 miss 掉很多东西
你这个很像公司里面的 onboarding material 对啊我们我们用 onboarding 啊像这种 hello 然后会告诉学生说如果你是新的你应该把这些这几步给做完这样管理实验室的老师多吗我了解的好像没有特别多你这个行为跟这个模式比较会发生在待过业界的老师对我刚有一句话没有说我就觉得斑味很重哈哈哈哈
可能跟我自己的心态有关系我当时在读博的时候我就把博士当作是一个工作我当时跟我的导师的第一个 meeting 我就问他我要怎么才能毕业就是毕业的要求是什么那我知道他的明确的毕业要求那我就去 optimize 我的这个 behavior to 他的这个要求哇把以中为始直接贯彻到哈哈哈哈不过这样比较好啊
就是跟导师好像也要 set expectation 会比较好一点不然很多人到后面有时候会不太开心念 PhD 的时候是的导导感觉花特别多心力在培养学生上面这跟我遇到了很多研究型大学的老师不太一样你为什么会对学生这么有热情愿意花这么多心力连周末也陪他们改 paper 啊等等的
我觉得就是在业界工作过然后在 deploy 就是我刚刚说到我可能很希望能够改变世界在业界 deploy 模型改变人的生活落地这可能是一种方式然后培养优秀的学生也可能是作为老师来讲是最直接的能影响
我觉得这可能也是很多人觉得生孩子是一件很 fulfilling 的事情他可以看到能够把一个小孩子培养成一个健全和优秀的人一样就是你培养出优秀的学生也是一个非常有成就感的事情我生孩子没有想改变世界哈哈哈哈
我觉得就是可能每个人心态不一样这也是为什么我现在没有想要生孩子我可能有很多的学生需要我去带我就不需要生下来来来来来来来来来来来来来来来来来来来来来来来来来来来来来来来来来来来来那现在的学生跟你当学生的时候有什么差别其实每个学生都不一样但是总体来讲我觉得现在学生的社交能力很强就是我那个时候感觉是有点社恐但是
但是可能现在也是因为社交网络就是用的比较多了大家在 LinkedIn 上开会啊什么 networking 做得很好然后社交能力其实技能点都点满但是大家不是经常说因为这些社交媒体所以让年轻一代在现实生活中的社交能力变弱但是你观察到的是其实现在年轻一代他的社交能力是比我们那个时候强的
我说的是在学术上的社交能量就比如说在开会的时候然后写 email 的时候有的学生在 reach out to 别的 faculty 的时候 CC 我然后我就可以看到他们就会明显说我们在 LinkedIn 上 chat 过然后 very enjoyable 这是一个非常好的打开话题的方式我就是在我那个时候可能没有这个机会去做这个事情然后我当年比如说开会就是默默地听听报告然后拿一拿纪念品然后看看有啥好吃的
而现在学生开会可能更像是去做做 marketing 就是投简历啊面试啊找合作都还是蛮自然的就是比我们那时候社交能力很强
那从收学生的角度来看你最欣赏什么样的学生我觉得学生和老师之间的关系可能看合拍就是合不合适是最重要的有的老师是比较 hands on 的他可能就希望学生能够尽快把自己的东西做完有的老师是只给你大的方向然后学生自己去探索的然后有的老师不希望周末学生来打扰自己然后
然后我可能无所谓就我自己来讲我觉得我喜欢的学生可能就三个方面吧就是他能力强就是他做事比较靠谱啊然后学习能力比较好啊
执行能力比较强另外一个我们比较看重的还是可能性格比较好就是你团队合作能力然后跟别人沟通是顺畅的这个其实我觉得在我们组我自己的学生我其实比较看重的然后还有一个就是可能有想法就是你敢想然后不只是执行任务你还要想自己常常去思考说我将来想做什么要 dream big 然后想搞些大事情的这种想法可能会比较多
现在的学生就是如果你学生能力强只给老师等任务也可以然后如果学生有想法执行力跟不上也可以但是如果两者都兼备基本上就是一个 dream 学生了
学生有梦想中的导师导师也有梦想中的学生对这是一个双向选择的过程就还是看合适不合适吧几个月前我有一个机会去导导的课上做了一个 lecture 当时这个 lecture 到最后的时候导导问了我一个问题你问我说对在场的女学生有什么建议我当时挺惊讶的你为什么会问这样的问题呢作为一个男性来说
为什么会问一个从女性角度出发的问题因为大家可能对直接的印象就是女性在 STEM 专业里是一个弱势的群体我自己其实觉得弱势不只是性别群体的划分也有很多种在 STEM 专业里女性是少数的
每个人都可能在某种意义上是一个少数群体比如说我们作为亚裔是少数族裔然后是国际学生或者是非主流的研究方向然后都可能在某个圈子里变成弱势然后我自己作为亚裔可能也经历过比如在某些场合不是主流的情况所以可能自然而然会对少数群体做一些关注然后我觉得这个不需要可以多做什么就是习惯性地考虑一下他们问一下他们的处境和需求基本的
共情能力做到其实就可以了
我觉得当时在课上特意问了你对女性群的建议是因为这些问题不会被自然而然的提出来没有人会特意默认大家都觉得说这个是所有人都适应但是可能对于弱势群体来讲没有人会主动聊这个问题如果有机会可以让弱势群体感觉到自己的声音被听到那我就还是挺愿意去多问一句那时候 Stella 讲什么导导当时那门课是 Data Mining 对吗嗯
导导就问我对在场的女性学生有没有什么建议我
我当时说的是我在以前这个是真实的我在几年前我经常跟在 tech 或者是在 data science 这个领域的女性讲说 data scientist 是一个非常适合女性的就业方向但是我现在不会这么去讲了因为我不愿意去说某些工作是适合女性的因为我觉得 imply 有些职业是不适合女性的我当时给的是一个这样一个非常 vague 的答案啊
学生听了就想说那不是几年前的事情跟我有什么关系那导导作为老师来讲你觉得男学生跟女学生他们在能力跟就业的难易程度来讲是有区别的吗就无论从客观还是主观他们自己的心态是有差别的吗
就是我当时听到 Stella 的那个回复其实我非常认同我觉得男生和女生的什么不同与相同可能都是社会富裕的可能我自己的样本量也比较小就是我觉得如果一定要说就是男生和女生有什么不一样的话我会觉得女生的审美和共情能力会更好一点就比如说我的男学生写 paper 画图的时候我通常都会说你先让我们组的别的同学帮你看一下有什么问题
但是女学生的画图啊排版啊然后合作能力和沟通能力尤其是在汇报然后写论文的时候 presentation 能力就是确实很明显然后比我族里的男生的学生画图然后 presentation 都要好很多来我来给你一个机会讲男学生的好话哈哈哈哈
我还是说就是男生女生其实没有什么不同我也有男学生他经过一些 training 之后画图的能力和沟通能力变得很强我觉得这个都是大家经过一些训练可以完成的
我前两天跟我们附近一个大学聊他说他们现在很明显感觉到女学生比男学生多尤其在大学部整体的表现女学生也比男学生强这是他个人的观察从你这边看起来有这样的趋势吗
在我这边我的课上女生还是比较少的包括我自己族裔的博士生女性也是比较少的但是我觉得如果能到就是同等的技能和经验上面我没有看到女学生和男学生之间特别明显的差异
很多时候找工作啊或者是读博可能不只是你的 technical 的能力你还要有沟通合作的能力啊然后很多软的 soft skill 我觉得这个时候可能经过培养啊大家都还是能够有提升的那导导的学生毕业都去哪里啊会继续在学术界还是去业界因为我现在教职才是第四年然后我在 ASU 才第二年所以我毕业的学生不多啊
我有一个学生要毕业了他最近拿到 Walmart TikTokAmazon 的 offer 还在纠结但是最终确定的还是会去工业界我觉得 CS 这个行业 PhD 去学术界的人还是相对少可能跟其他的领域的 PhD 相比绝大多数还是去工业界了因为毕竟钱多然后机会多他自己做的研究如果能够落地对他的吸引力其实还是蛮大的我觉得除非是特别热爱学术的我觉得大部分还是更倾向于去公司
那你这个样本数可能小一点但你有感觉到 CS 专业的就业寒冬吗我觉得 PhD 还好但是 Master 和本科生的确压力大一些就是 PhD 的学生的
会要求他有一定的研究能力和技术壁垒你要去做这个领域的 Expert 所以市场需求还是相对稳定一点但是 Master 和本科生如果是做一点点项目然后加刷 Litcode 然后来模式准备求职的话
确实竞争压力大的不少但是我最近有一个我的课上我去年课上有一个同学一个女性然后她每次上完我的课之后都会去写一篇 medium 的 blog 然后发在 linkedin 上然后她自己就是通过这个 medium blog 然后发在 linkedin 然后我会帮她转发然后她自己就被 amazon 主动 reach out
所以然后拿到了这个 offer 所以我觉得其实在新的这个条件下可能需要做一些不一样的东西才会能够让你的竞争力变得更明显我不知道导导有没有做什么内容或者是 online 的他的 paper 就是你的 paper 好那请大家 follow 你的 paper 其实就是有一些纠结
前段时间我上了小红书然后就有学生转给我说或者我朋友转给我说就是有人问 ASU 我的组怎么样我就想自己亲自下场去招生但是我也有纠结因为我对世道网络还是有一些 panic
就是他可能是一把双刃剑你在社交网络上你做那个 influencer 你的话语权会影响更多的人当然是这个很吸引我的点但是有的时候你的行为可能你的本意并不是那样子会被曲解和放大所以我自己在纠结说要不要做自己
做自己的社交网络账号但是我看到我的同事还有我的一些好朋友他们在社交网络做那个网红嘛然后也是非常受欢迎但是他们 sometimes 也是受到一些心理的冲击我觉得我可能还没有 ready 去 handle 那些所以我没有做自己的账号 maybe sometimes in the future 我可能会去做一些这种事情要不要做自己的账号这个你可以再慢慢考虑但是既然今天到我们的 podcast 上来你有什么招生广告要打吗
对对对我们组呢是在做 AI 然后智能交通最近我们在做具体的就是我们组里现在有机器人啦如果大家对 AI 然后对大语言模型然后对机器人交通感兴趣的话欢迎大家访问我的主页我们主页上有一个 Google form 欢迎发邮件给我我都非常欢迎大家来申请
导导是 ASU 来我们节目的第三个男老师了有的比较帅反正每个都对学生很好大家就想说在 ASU 是什么神仙学校你们真的对 ASU 的这个招生做了很大的工作不过 ASU 老师真的目前我遇到的都还不错我百分之百好评我遇到三个三个都很好嗯
谢谢大家拜拜