We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode EP85 借 "字节的AI训练被攻击" 聊聊职场违法那些事

EP85 借 "字节的AI训练被攻击" 聊聊职场违法那些事

2024/12/3
logo of podcast 硬地骇客

硬地骇客

AI Deep Dive AI Chapters Transcript
People
依夏
赛头
龟龟
Topics
赛头:字节跳动大模型训练被实习生入侵,注入恶意代码导致训练成果不可靠,损失可能超过千万,字节准备向实习生索赔800万。实习生入侵手段简单,例如直接kill进程,造成数据丢失。事件暴露了企业内部安全管理的漏洞,以及对类似Python Pickle库序列化漏洞的防御不足。 依夏:实习生利用Hugging Face库的序列化漏洞注入恶意代码,并非Hugging Face本身的漏洞,而是利用Python的Pickle库的特性。攻击者在checkpoint文件中注入恶意代码,并在模型加载时执行。这种攻击方式难以防御,除非分析代码或拒绝执行代码。Java领域的JSON序列化反序列化漏洞也很多,需要不断修复。攻击持续一个月才被发现,是因为一开始怀疑是系统或模型本身问题,而非人为攻击;攻击者潜伏在debug群中,并根据排查思路调整攻击方式;攻击者持续攻击,直到模型训练无法进行。checkpoint数据非常重要,任何人都可以访问并修改是不合理的。实习生有反侦察能力,行为令人难以理解,字节起诉并向行业协会通报。 龟龟:实习生的行为可能源于道德感缺失、法律意识淡薄,而非严重不公正待遇。 中国公民法律意识淡薄,对民法等与生活息息相关的法律知识缺乏了解,例如闯红灯、贩毒等现象普遍存在。大学应开设职业道德教育课程,教授职场行为规范和职业素养,纠正将工作视为被剥削的错误观念。企业风控需要权衡成本和收益,高频低损事件可采取预防措施,低频高损事件可通过保险分散风险。独立开发者和创业者也需要有风险意识,通过诉讼等方式进行风险控制。法院依法判决比赔偿金额更重要,能够警示他人,但风控难以完全防范恶意行为。企业文化建设和普法教育是防范此类事件的关键。

Deep Dive

Chapters
本期节目讨论了字节跳动大模型训练被实习生入侵事件。实习生通过注入恶意代码破坏训练成果,造成巨大损失。攻击手法利用了Python的Pickle库的漏洞,难以防御。
  • 字节跳动大模型训练被实习生入侵
  • 实习生注入恶意代码,破坏训练成果
  • 利用Python的Pickle库漏洞进行攻击
  • 攻击持续一个月才被发现

Shownotes Transcript

大家好,欢迎收听尼海克,我是赛头,我是依夏

我是龟龟本期节目由 Podwise 赞助播出 Podwise 是一款为播客听众制作的 AI 学习软件产品的 slogan 是 Read before listenPodwise 通过 AI 对播客内容进行转录提取总结分析等一系列操作帮你掰开了揉碎了硬核的播客内容同时与 Notion、Readwise 等平台的打通嵌入知识管理工作流协助您的其他包括新闻 Newsletter、Vlog 的内容帮你打造第二大岛

Podwise 也为本期听众准备了三个五折优惠码针对本期在小宇宙与我们互动的精选回复欢迎大家踊跃来玩好的,那开始我们本期的节目吧

有句老话说的好啊堡垒都是从内部攻破的相信大家也都知道了一件事儿就是字节的大模型训练被实习生入侵了然后说是注入了一些破坏代码然后导致他的训练成果不可靠可能需要重新训练然后据说是这个入侵代码注入了有 8000 多张卡损失可能有超过千万当然这件事儿最近有了一个新的进展啊就是说字节准备向这个实习生求偿 800 万人民币

然后附带民事赔偿但说实话它怎么造成的这个损失超千万为什么还没有被别人发现其实这个事我还真不清楚一笑能不能先给我们深入浅出的介绍一下就这个事是怎么发生的因为你刚才也提到了首先这是一个从内部攻破从我的角度来理解的话如果从内部入手存在着内鬼的这种情况的话其实我们要去制造一个攻击

它其实是没有任何门槛的你想一下我们自己在内部公司里面我要破坏

某一个集群里面的任何的一个数据我觉得这是一件毫无门槛的事情你想做到这件事真的是一如反掌比如说在网上也有很多人提到这个哥们在整个攻击或者说叫破坏的手段里面就有一些什么把人家的进程给直接 kill 掉来我们都知道如果他用 kill 刚久的话其实训练的整个中途的数据可能全都丢掉了

可能很多東西要從頭又重新開始

这些破坏方式对于我们来理解的话其实是非常非常简单的方式当然大家分析了所有的这些破坏的方式里面除了内部的这些简单粗暴的行为手段之外还有一种大家猜测的攻击方式是利用了 Hugging Face 的一个漏洞进行攻击我先讲一下它利用 Hugging Face 这个漏洞其实就是利用了一个库比如我去加载那个 Checkpoint 的时候它可以执行一段

恶意代码就完成了攻击那首先其实我们要明白一点其实这个漏洞它其实不太算是 HuggingFace 的漏洞其实 HuggingFace 的库它也是底层去调用了另外的 Python 的一个很非常非常通用非常非常基础的一个序列化的库所以说才造成了这个问题所以这个问题它本质上不太算 HuggingFace 的问题当然所有使用这些库的人在这个点上的防御也没有做得太好

对,但其实我想一下这个防御还挺难的我先解释一下这个 checkpoint 这个东西就像刚才我说的它如果用 Kill 这样的手段把那个训练的进程给杀掉过后如果用 Kill-9 可能内部的这些状态都丢了可能就要重头训练但如果我们正常去停掉我们的整个训练的过程的话其实你在停的过程中它可能会生成我的整个训练的当前的状态的整个 checkpoint

把它全部给保存下来持久化成持久化的数据下一次你再启动整个训练过程的时候我又可以恢复整个训练的进程所以这个东西就是 checkpoint 所以整个 checkpoint 里面它其实保存了非常非常多的模型训练中的一些状态的数据包括模型的权重还有一些参数包括整个

整个地规下降的一个过程里面涉及到的一些收敛等等很多东西全部都在这个 Checkpoint 可能是一个文件但有些框架它是多个文件是不是一个文件这个事不重要反正就是有一份 Checkpoint 的数据其实我们所有做工程的人非常容易的去理解这个 Checkpoint 像我们可能平时让我们去实现怎么去保存我们的程序的内部状态

我们可能想到的是在程序停止的事或者说我们运行到一个阶段过后我们可能就会把这些内部状态给它序列化成一个 json 对象对吧给它直接写到磁盘里面这就对我们所有做软件工程的人来说就是非常非常正常的一件事但是呢甚至 Python 的世界里面至少现在看到的这些做机器学习的框架的训练过程里面他们都没有采用可能 json 这种方式还是

相对着比较简单我们都是只是保存一个对象的数据部分但是在 Python 里面有一个模块叫 pick 模块这个 pick 的这个序列化的模块它其实是用来保存一些非常非常复杂的对象有那个对象上除了挂有数据以外甚至还可以序列化它的一些方法之类的也就是说它序列化到持久化的那个文件或者数据里面它其实是还带有代码的

当你反映的话的时候这个代码可以被 load 进来

同时恢复执行这个就很恐怖了所以说你可以理解成字节这件事就是说它生成的 checkpoint 文件被这个哥们在那个 point 文件给它修改一下你可以理解成就是一个 json 的序列化的文件但是里面有段代码我给它加一段额义代码放到这个 checkpoint 的文件里面最后当你在去训练的时候拿着这个 checkpoint 去 load 到你的整个训练的过程里面去的时候你发现这段额义代码就被执行了

听了过后就污染了我所有的这些这次训练的所有的机器了它的本身是这样的一个过程所以说它的核心的问题点就在于使用这个 Python 的 Pickle 的这个序列化的这个库的使用的方式的问题怎么去防御别人就是相当于说现在 Sight 也好 GuiGui 也好你们生成了一个 Pickle 的

持久化的文件数据然后远程发给我让我 load 进去就可以恢复整个状态结果一 load 里面在里面加了一点额异代码也会在我的电脑上运行了留点代码留点代码 part 一下把我的电脑的所有的数据给拧布给删除掉了

这件事里说就我这一段作为漏的段其实我要去防御这个俄译代码我想了一下其实还挺难的因为除非我要真的去分析那个要被执行的代码它是什么代码

他真的是在干什么事要能够自动分析这件事情才比较好执行要么就是直接拒绝掉执行代码这件事当然人家可能就是要利用这个执行代码这个特性嘛因为他们这些机器学习框架可能都利用了这个特性所以就造成了这样的一个问题其实

在我自己的整个职业生涯或者编程的过程当中其实我好像还没有遇到过需要去序列化这样复杂的序列化的方式需要好像除了序列化数据以外我还需要能够执行方法这种其实在我的场景里面确实没有遇到

这可能是我自己孤陋寡闻没有遇到这样的复杂的场景但总的来说我个人的观点是我觉得像类似于 Pico 这种序列化的模块可以执行代码的我觉得真的是一个非常非常危险的一个事情对你提到这个 Pico 危险啊

其实在 Java 领域里边所有的 JSON 序列化反序列化都不知道修过多少轮漏洞了每次都是因为反序列化的时候里边可能可以执行恶意代码然后就去修复每一个 Java 的这些什么 JSON 框架都不知道修复了多少轮了

总是有各种各样的小问题但是人家在 Python 里面 Pyko 人家就专门支持做这种事对吧我觉得这个就是一个理念上面的一个非常大的不同我觉得这个哥们做的事挺奇葩的就是别人可能训练到一个中间阶段搞出来一个 checkpoint

然后他就偷偷摸摸的把人家这个 checkpoint 改了是吗然后改完之后发现怎么训练都不对怎么训练都不对我觉得这哥们也是挺神奇的对但我有点疑惑啊就说为什么这个攻击说是已经持续了大概有一个多月了吗为什么这个攻击搞了这么久才定位到最后是他这哥们好像最后还不承认对

我觉得你像我们以前做 Linux 的各种权限管理啊等等之类的因为我们最终其实按照 Linux 的权限然后你去看它的文件修改权限嘛然后它到底最后是谁修改再反过来倒倒倒倒倒到最后倒的那个堡垒 GIP 的话理论上只要字节管理的稍微规范一些的话找到它应该不难呀那为什么搞了这么久才找到它其实我觉得最开始的这个相当长的一段时间里面啊应该大家都没想到是有人在在搞鬼那也没错

第一时间肯定都会怀疑自己因为这种大模型炼丹本身就很容易出各种问题它规模又那么大机器数量又多然后模型又复杂你不管是说哪台机器硬件上出个问题或者说调度框架有点问题或者说有网络波动或者模型本身有问题但其实有问题的可能性就很多机群又那么大一开始的时候估计

运维也好程序也好算法也好就都在怀疑说我自己这个地方是不是哪里有问题然后就开始各种排查我估计一定是要等到排查进入死胡同了或者就顺便正巧

正巧就看到一些好像有人为捣乱的迹象才会往这方面想对吧你们其实自己想一想估计也是这么一个思路很难想到说自己他这个应该算是兄弟团队吧对吧兄弟团队有人这么变态而且刚刚一向其实也讲了这个哥们注入的恶意代码利用的这个原理他其实本身是不需要提交代码仓库的所以你从 code review 上其实看不出什么东西然后

然后因为执行他这个注入的恶意代码的是是 Hugging Face 嘛这不是他本身去执行的所以我估计就算有文件修改你从这个文件修改上也看不出太多迹象因为修改的那个是这个 Hugging Face 的进程还是什么对吧

所以从这个文件修改的这个用户上你估计也看不出什么迹象唯一能留恒的可能就是这个操作历史那这个也就是要等到真的有人开始怀疑了之后才慢慢的会查到这个部分没错对吧当然我觉得最最离谱的就是这哥们居然潜伏在人家这个 debug 群里面看人家排查思路来调整这个真的是有点夸张就是

查无法复现的 bug 简直就是不可能完成的任务我们如果在线上遇到一个什么 bug 然后复现不了你真的头都要抓破对但是说真的就是如果这哥们儿捣捣乱之后见好就收不要做得这么绝我觉得可能最后这事都不会被发现就是他可能捣乱了一个月觉得差不多了可以了我就不接着搞了

大家发现问题消失了可能也就不查下去了就是不管问题再诡异吧只要最后稳定消失工作能继续下去我也可以说服自己说我就是倒霉遇到了一个诡异的问题反正现在已经好了那就接着搞吧可能也不会再花大量精力回头去找问题所在就变态就变态他就一直弄一直弄就是要把你弄死为止

没错对这个问题它其实从注入攻击的方式其实从代码层面确实也是看不出来的它毕竟是在一个数据文件里面去加了一段代码所以它这个事其实可能都不需要登录机器甚至都可以完成的一件事情但其实这里有一个问题大家仔细想一下其实我自己是不太理解

因为这个 checkpoint 这一份数据其实是非常非常重要的比如你训练完了一个基础的模型它其实就导出一份你可以认为就导出一份 checkpoint 这里面就包含了我们整个推理的权重这些数据它其实就是一个基础模型

我们可以把它理解成就像 Docker 的 Base 的 Image 这样的一个东西所以这个东西它其实是非常非常重要的比如说我们今年第一个季度完成了一个基础模型的训练导致一份 Check Point 了这个东西肯定就是我们的资产了非常的重要难道任何一个人都可以接触到这个东西吗我就可以在里面随便的修改一点内容加点代码吗

对吧 那这个不是很夸张的一件事情吗那后面大家的工作都是要基于这个 base 去进一步去训练的嘛去训练后面的工作内容 对那后面你的努力不都全白费了吗所以我觉得这件事情在整个字节的这个权限也好或者说整个 checkpoint 的运维管理的机制反正想想觉得是有点离谱的不知道他们是

怎么再管理这件事情对你想想其实大模型训练这个事也就这几年才出现嘛再往前倒其实是大数据的嘛这两年才开始出现了这种大模型训练我估计在整个运维层面上面还是有蛮多漏洞可以去补的对吧大家以前可能都没有经验或者说大家都没有想到说还有人去这样子去搞对吧我反正这么看过来这哥们还有各种反侦察技能对吧感觉这哥们是真的是蠢坏

然后我还挺同情跟他一个团队的成员的就我估计这些人啊就搞着搞着都有点怀疑人生了觉得说怎么搞都不对每次为什么训练的结果都不一样现在因为字节在公司层面不是也起诉了吗他现在是说民事求偿 800 万人民币然后还要附带赔礼道歉为什么附带赔礼道歉是因为这哥们一直都不承认是自己

然后他学校也没处理直到现在这哥们还在否认那我觉得钱的这个事可以先放一边啊我觉得说不定他家里人可以给他还上对吧那你们觉得说未来这哥们还有没有机会去从事我们这个行业他这个我其实看网友们讨论啊都说这个真的是赔偿 800 万人民币可能不太可能

可能就是法院不会支持这么多但是我觉得像这个字节他诉求这么大其实很大一个程度也是在表达自己的态度嘛对吧然后他其实还把这件事同步了这个东西像什么来着行业什么反欺诈什么协会啊什么的反正就是把这件事给整个行业都同步了说这个人有点有点那个什么所以其实字节也就是那意思就是说我也不想在这个行业里面再看到你了

我感觉就是像他能做到这种程度我自己觉得是多少有点道德感缺失就是有点反社会性人格当然也有可能纯粹就是无知觉得不是什么大事法律也管不到我反正我自认为一个正常人的逻辑出发我是根本无法理解他这么做的原因的感觉是属于纯粹的报复损人不利己而且就是对吧感觉也没有考虑过这件事一旦暴露会对自己带来的影响

也有网友说这个人其实是觉得说只要对方弄不出进展那资源就会重新分配到他的研究方向上那这个确实你要这么说还对他有一点好处但我觉得只能说想的也是太单纯了点怎么可能就就不会去查原因对吧然后就说人家没进展就把人家停了不太可能这个样子那你说如果说啊是他是受到了什么非常严重的不公正待遇

宁可玉石俱焚也要报复我觉得是可以理解的但是他只是说遇到的团队内资源分配的问题都不能说是资源分配不公对吧是大家最后决定说我就是先做这个方向然后那个资源是一人一半不是说我全部给那边他就觉得说应该全部给自己这那这个都不是一个分配不公的问题他纯粹只是资源分配的问题我感觉实在是远远没有到要做到这个玉石俱焚的程度啊

所以我比较倾向于你说的这个说这哥们是纯坏就是缺失道德感的体现也包括可能就是对法律意识淡薄那这种对违法违纪毫不在意的人我觉得是无法被信任的

其实看到这个的时候我还想起来前不久看到的一个案例啊他是一个化学博士博士在读然后他干啥事呢他是因为楼上邻居的这个日常起居声音啊影响他休息他说他自己神经受伤比较严重邻居什么关个门啊关个冰箱啊之后他就觉得吵

然后他就每天从门缝里头往邻居家注射麻醉药物因为他是个化学博士嘛天天给人家注射麻醉药物人家就每天都觉得头晕啊然后恶心啊什么的他连着搞了几个月然后后来才被发现你说这是正常人能想出来的解决问题的办法吗对吧

这种人你说被爆出来之后那谁还敢和他做邻居呢直到你是他这个人是自己的邻居肯定避之不及嘛哪天说不定就被投毒了其实注入病毒它这个算是恶意代码就这种事以前有一个特别有名的

病毒的例子就是熊猫烧香嘛对吧大家应该都知道做熊猫烧香那哥们叫李俊啊当时好像是被判了四年后来顿了三年因为表现良好就提前出来了出来之后呢他就是要找工作嘛就给金山投了简历

青山当时也确实给了一个 offer 但你从他这个给他的这个职位的名字看还是看中他的话题嘛不是看他的技能给的是一个叫网络安全观察员这样的虚职据说其实就是客服月薪 3000 那他肯定肯定就不干嘛但是别的一些像安全厂商像那个瑞鑫骑虎之类的其实都不愿意见他就觉得这哥们虽然很有噱头但是不能这个样子因为他其实

他这个熊猫烧香他不光是说他做来玩的他还拿去卖钱了卖了好像十几万还是几十万他后来确实是被一个叫做熊猫安全的公司给要走了而且给的 title 好像还很高那你听这个公司的名字感觉就又是玩噱头的对吧熊猫安全把这个熊猫烧香的作者给要走了

然后果然很快他就又被抓了他是因为开设网络赌场被判了三年而且他这个开设网络赌场他也充分利用了自己做病毒的经验是吧做网络赌场大家都知道其实你去赌什么概率都是被控制的所以据说他做的网络赌场反正对方赌的那个人能出什么牌对吧能不能赢反正都是被他控制的好像说是赚了 7000 多万然后又被抓了判了三年

现在肯定就早就出狱了嘛但就完全没有新消息了就已经销声匿迹了我觉得他这次恐怕是没啥翻身机会了正经的翻身机会啊说不准是人家也可能在哪个鸡角嘎啦里面赚你不知道的钱也不一定

对 但说实话李进这个事呢就是出发点你起码还可以说是说是牟利 对吧属于是损人利己那字节这位同学做出的事情真的就是让人不能理解对 因为这个同学的名字叫田某嘛现在广大网友已经有一句评论了说清华妥解 北大田哥

就是这俩都对等起来了是吧对已经对等起来了网友把这件事的评论已经升为到整个教育体系了就说高考只过滤学渣不过滤人渣啊当然对于这个说法我个人不发表意见啊但是如果说学校在这件事上没有责任我肯定是不同意的况且学校现在啊就说对田某还没有任何处理啊

那到最后假如真的法院判输的话你们觉得学校应该怎么处理还有就是说我一直觉得说我们学校到职场这个中间缺少一些所谓的职场道德教育这一环因为我们一路其实都是应试教育过来的嘛我们在小学中学的时候我们一直都在强调说你能不能考上学然后你得分够不够高对吧从大学到职场的时候其实没有人教过你职场道德应该是什么样子

你应该做什么事不应该做什么事全靠自觉或者说你从你身边的人学到的其实没有人教过你说你应该怎么做我不知道你们怎么看这个事其实确实是听说一开始自解职是把这个哥们的这个实习取消了然后说让学校处理他但学校没处理他这个哥们就开始在网上给自己洗白说别人趁他离职是吧别人干的然后栽赃给他

然后自己才告了他其实国内道德有关的教育我感觉好像确实是缺失的反正从我自己的被教育经历来看唯一有关联的课程

可能就是私修对吧思想品德修养那这个课程好像我记得小时候还叫私修后来就变成私政了对吧思想政治教育思想政治修养反正大学的时候好像就变成私政了那这个课程呢反正一来我觉得它是更偏政治的二来呢就是大家其实也都不在乎教的人也不在乎学的人也都不在乎反正就是纯粹属于完成任务我大学的时候去上这个课都是睡觉的但是学校是不是应该负责学生的这个道德教育我觉得

确实是应该的因为学校是为了社会输送人才的嘛对那道德品质显然也是人才的一个重要的要求对吧你不能说我凡事都是靠法律和监狱来事后补救吧对吧监狱帮社会改造人才你这个帮社会输送人才的在前面做一些预防不是更好吗

但是到大学再进行道德教育我觉得恐怕是太晚了一点因为人的人格一般从 16 岁开始就开始取消稳定了那读大学都 18 岁了这个问题其实我还去查了一查说不同国家的教育系统是怎么做的查到一个比较极端一点的是日本日本它是从 18 年开始立法把道德这门课变成了一个正式科目从小学到初中都有

是正式的有教材的然后要考试的其实日本的犯罪率确实还是挺低的但是呢我们印象中好像日本的这种变态的案件特别多那当然这个变态的案件对变态的案件你肯定也是因为它够变态才会报道出来嘛相对来说也都比较早了就是可能比如说 2000 年前这样的这种变态案件比较多另外还有一个原因其实是在日本可能你犯罪之后啊承担的这个社会压力也很大当然其实国内也很大因为犯罪之后都就会被打上标签嘛对

大家都不会压你

但是别的国家就似乎都没这么正式的这个道德教育所以我觉得如果真的要去做这个道德教育肯定还是从小学初中这样的阶段去在人格的可塑期去做更有用当然还要配套这个普法教育对吧说句实话我们其实我感觉国内大部分人对什么事犯法什么事不犯法也没什么概念可能我们相对来说还好一点大概有一个感觉说这个事可能犯法但也就是仅限于可能犯法更多人可能都完全没概念说这事犯法不犯法

我倒有一点不同的观点我觉得我们单纯提道德教育这一个点的话其实我觉得可能我们从小去上学可能从小学初中到高中甚至到大学我们确实可能没有这样的一门课程去专门告诉大家什么是符合

道德的或者怎么样但是我们伴随的整个学习的过程当中我们所有的老师他们应该都在言传身教告诉我们我们要做一个有道德的人之类的但是呢这里确实我想了一下我们会存在着一个问题就是我们所有的这种不管是来自于你的父母也好还是来自你身边的人还是老师也好

所有在对你进行这种道德教育的时候我们接触到的道德教育都是一些类似于比如说尊老爱幼尊师忠道还有一些对别人要友善或者说你要做一个好人你不能去犯法很多时候我们接触到的整个道德教育可能都是来自于这样的一个层面但是如果我们进入到大学了过后我确实觉得说大学应该有一门课程是叫职业的道德教育

就是说我觉得职业的道德教育他讲的是个什么东西就是让你当你真正走入职场过后你应该如何去工作就应该如何去工作这件事我觉得是我们所有其实今天的大学的毕业生包括我们自己当初毕业的时候我们其实根本不知道应该如何去工作的那如何去工作这里面就涉及到很多比如说

团队的协同 团队的合作你在团队里面应该怎么怎么样就像刚才我们讲的这个天某它其实本身是一个团队合作的问题导致的一个问题 对那你在职场里面可能会遇到一些什么什么样的事情那应该具备良好的职业素养我觉得这些都是与如何工作相关的一个事情但这一块确实是我们整个教育系统里面我觉得

非常缺乏的一个点吧因为我们的道德教育往往都是在那种还是我们曾经已经提过的那种有点儒家思想的那样的一个层面的一个道德教育但我们所有的人都不知道如何去工作其实大家有没有发现现在其实有很多很多的人把工作这件事总是当成是资本家对我的一种

当你从第一天你就抱着这个思想的话你从根上都已经偏了就是当你踏出社会的第一步你的脑子里都是觉得说我现在要去被资本家剥削了对当然可能这里面是有很多的剥削问题比如在社会里面对吧但是你从根上从你的思想层面从你踏出大学校门的第一步你如果都是怀着这样的想法的话那我觉得可能在后面的职场里面你确实可能会遇到多的

困难或者说你个人的成长也会遇到很多的障碍我觉得是这样的一个点对所以我讲的是大学确实应该有一门关于如何工作这样的一个职场的道德教育我觉得这个是比较好的相反和职业的道德相比的话

我也更倾向于填补这件事情其实是我们在法律的教育上面的一个淡薄的问题就相比职业导导我更倾向于说我们今天的全民的法律素质真的是太低太低了就像刚才贵贵提到我们对一个事情我们可能只是知道这个事情看上去好像犯不犯法违不违法你只是有一个感觉其实你自己并说不出来背后的一二三

法律的一而三是怎么怎么样的这个东西其实它不叫懂法真的包括我们自己在内我们自己其实有时候什么民法呀那些因为和我们最相关的其实是民法嘛我相信涉及到刑法呀这些的时候我们还是虽然我们不知道刑法的内容是吗但是我们知道可能你这个东西就是犯罪了触犯了刑法我相信大多数人可能不会去干比如说你

一些杀人放火之类的可能你不会去看但是在民法里面的很多东西是和我们的生活息息相关的这里面其实我们经常在生活当中其实你自己根本都不知道的你根本都不知道你在这儿是别人侵犯了你的利益还是你侵犯了别人的利益其实我们都不知道 对不对

所以说很多时候我们把生活当中的一些利益的相互的侵害这件事只是把它归结到了一个公序良俗上面道德层面觉得说你这样做好像是不太符合公序良俗的不符合道德的但其实你是犯法了你知道吗对我觉得这个点是一个最大的问题所以我们所有的人真的都好好思考一下我们是不是真的懂法对

对你提的这个法律意识淡薄我自己其实也有一个很明显的体感就比如说你看我们现在大城市可能比较少啊就是大家都有红绿灯嘛对吧那比如说你在中小城市大家是不是逛马路的时候都是凑一波凑一波就过了对吧那其实这个里面就隐含着背后其实大家背后其实有一个意识就是大家总觉得说法不责众对吧甚至我们之前出现过一个村里面全是贩毒的

对类似这种的对我觉得确实我们整体的法律意识确实是有些淡薄的对那我觉得田某这个事我觉得就是对整个行业其实也造成了一个蛮大的影响然后有点说一个老鼠屎坏了一锅汤的这种感觉我其实还有想到另外一个事就是跟我们这个行业没关系的在外卖行业大家在城市里面的上班族那基本上都离不开外卖嘛

那我不知道大家有没有发现外卖也有经历过一个过程以前的外卖的时候其实大家都是提个袋子就送到你这了但现在的外卖你收到的时候它一般都是纸袋上面会给你来两发定数针或者说给你在上面粘三个胶带它为什么会发展成这样也是因为有极个别的客户发现了自己的外卖要不然就缺钱少两要不然就出现了一些不明物质

对吗然后在媒体曝光了之后然后商家就采取了这种保护性措施嘛就说那我要不然我把带口封住对吧反正你收到那个外卖之后那个带口是有问题的那你就别收但其实啊就最终因为这些东西都是要成本的嘛以前大家拿个塑料袋可能就给你送过来的对吧那现在拿个纸袋子上面还给你来两发定数针

这个时候其实最终还是消费者承担了这个打包费用嘛那以前打包费其实大家都不算的现在你送外卖过后人家还给你算一下说你这个打包的钱到底多少钱但我举的这个例子不能跟今天这个田某这个事一比一类比啊因为毕竟外卖员跟商家这个关系还不是像我们内部嘛因为外卖员毕竟不由商家控制

那就类似于说商家因为他出现了这种这样的事然后客户他反过来怪商家了对吧那商家类似于做了一个防御式编程往上面来两发定数针那你们说企业内部的话他有必要来这么一下吗如果企业内部去做了这种类似于防御啊等等这种机制的话他

本质上最终会提升整个企业的成本嘛那当然字节因为他这个损失我估计几千万应该是有的整个这个损失他其实代价比较大嘛我不确定说字节啊或者未来这种大厂他会不会为了去预防这样的事情最终去把整个的这个企业的管理啊整个安全啊这部分把它给提上来我们讲说田某这个事会不会对我们这个行业带来这样的一个安全性的一个改进也好影响也好嗯

其实这就是个风控的问题对吧风控就一定会涉及到成本和收益的这个比重的问题一般就是我们会关注两类事情去做这个风控一般就是一类是发生频率高但损失小的还有一个是发生频率低但损失大的其实像讲到了这个外卖的这个就属于发生频率高但损失小因为你看好像是偶发事件但其实在这么大的这个群体面前它几乎是必然发生的

然后像田某这个呢就是属于发生概率低但损失大的另外还有那种什么发生概率高损失大或者说发生概率低损失低的这种我们就不用关注了对吧前面这种就你这个事就不用干了因为它必定失败后面这种呢反正也没必要去关注发生了就发生了那一般对频率高损失小的那我们比较习惯的就可能去采取预防措施啊

或者说做一些基础的防护机制就像你说的这个订订书钉算就是基础的一个防护机制因为它可预见的就是会一直发生所以与其比如说我发现了之后我去怎么严厉的处罚这个外卖员不如就简单去预防一下就好了它一定是会发生的所以从日常里面去投入成本去覆盖就是比较合理的

而且像你说提高成本消费者买单我觉得也没办法它真的是一定会发生的因为群体就那么大那么多人

你不管说道德感确实要还是怎么样也好反正总会有这样的人出现另一类频率低淡损失大的比较常见的方式其实是通过保险来分散风险分摊风险给整个社会典型的像重疾险就是这一类然后各类财产险我觉得应该也算是吧比如说车险对吧比如说火灾之后那种财产赔偿都算那你说这些风控措施是增加了社会的运作成本吗我觉得可能是相反的因为我觉得平稳有序才能带来效率

如果你总是发生一些事件导致你要去补救的话对吧你要去做一些补救的措施其实整个社会的运作效率可能反而是更低的虽然说你可能好像是因为一些个例事件导致了整体的信任危机带来了这些额外的成本但这些个例事件本来就不可能被杜绝那就是一定会发生的在我看来这些成本本来也是必不可少的

说到风控这个事情我觉得我们作为独立开发者或者创业者确实也是需要有这种风险意识像自己财大气粗被这么整了一把也不会咋地但是换创业公司你就可能直接就记了对吧

但是呢分空这种事其实就是怎么说呢属于经验你如果没有遇到过对吧整个行业都没有遇到过你是不会说想着说我会吃这么一个亏的往往都是会一定要先吃过一次亏才会想着下次要控制要预防

那字节这回吃一欠长一智你看到他说决定起诉我理解其实也是一种预防措施也是一种服务措施对吧而且相对成本比较低的一种服务措施就是你看我把这个诉求提得这么高然后如果最后真的判下来比较严重就是一个很好的警告对吧下次你们再干这种事你就自己好好想想你能不能吃得住

这个事让我想起以前我们的一个嘉宾 Victor 我不知道听众朋友们还记不记得他就是遇到了一个发生频率低但损失很大的事情就是他公司存钱的那个银行倒闭了对吧他容赖那个钱存的那个银行倒闭了这你说一般谁能想到呢但是我相信下一次 Victor 应该不会把公司所有的钱都放在一个银行里了

对 我觉得那儿归为提到字节起诉其实我现在针对这个事件的话其实我更倾向于说这次法院能真的依法把这个事情给判决下来不管最终是不是赔不到 800 万那也无所谓该赔多少钱赔多少钱能够依法把它判决掉然后让职场的所有的人都知道这样做是违法的我觉得这件事情

是更重要的一件事回到风控的话其实现在我们都在大公司待过我们都知道其实现在的大公司里面其实他们本身都有很多的风控的管理或者说我们认为说权限管理其实这些都有的但是我们都明白这些很多的权限的风控的管理他们更多的其实是在防范一些事务性的操作对吧但如果你是真正的一些内鬼是有事儿

也没有那么容易还是能搞的东西他可能还是继续能搞对你说你掌控一个关键的数据库的一个 DBA 的运维人员你说你要是不想干点好事想把数据库都给清空给删掉也不是不可能是吧也完全能做得到只是说你做到了过后肯定你自己也搭进去了这个是肯定的对所以说现在很多时候风控可能真的还是一个防君子防不了小人这样的一个状态对吧嗯

回到企业和人的这样的一个问题上的话我自己还是坚持觉得说新认真的是合作的基础百度内有一句价值观我觉得讲得很好简单可依赖当然我们三个都没在百度待过

百度的听众同学如果有的话可以出来说一说百度是不是真的是简单可依赖的但如果真的对我觉得简单可依赖这个价值观它真的对于企业的文化来说我觉得是很好的一条对我觉得还是那句话直接回答这个问题我的观点就是它不需要处处去设防我觉得这个

成本真的是太高了但是真的需要普法教育这种普法教育除了在学校教育以外还包括现在企业实实在在的遇到了这样的一个案件那咱们的执法机构是真的能够依法把这个事情给它判决掉对吧然后给社会给职场所有的人一个回应我觉得这样是最好的结果

嗯对你讲的那个 DBA 的 leader 对吧他山库跑路这种事其实也屡见不鲜了一般都是因为欠薪嘛对吧欠薪过后然后 DBA 就直接山库跑路了然后甚至有些 web 程序员然后欠薪过后直接把人家公司首页改了这种事情也是经常出现的对因为我们也工作时间很长了嘛不知道你们有没有在职业生涯里面遇到过这种有违职业道德的甚至啊最终被公司追究法律甚至刑事责任的然后可以给大家分享一下嗯

我一直记得当时刚去淘宝工作的时候就刚毕业的时候同部门同届的一个人做过这种事情因为是同届一起实习一起培训的嘛所以还是比较熟悉的知道的时候还挺惊讶的因为他是开发嘛他就借植物之变私自开发了一个接口发布到了那个线上然后因为是撕开的嘛这个接口的权限就很大

虽然具体是做什么的我不记得了但是反正肯定能做一些官方公开渠道做不到的事情它是营销相关业务的嘛那这个接口就是可以帮商家去做一些可能是权限很大的营销的动作然后他就自己做了一个软件在外面做了一个软件来调这个接口然后把这个软件卖给商家来获利后来被发现后就被开除了吧应该也是被告了罪名上不知道是怎么定性的植物侵占罪还是怎么样反正就是违法所得也都后来都追缴了

再后来就没有听到后续消息了不知道怎么样那个时候其实阿里的内网论坛啊是有一个叫廉政的板块的经常会发各种就是集团那种职务犯罪的案例可以说这也算是一种分控行为嘛起到警示预防的作用每个月都有案例但一般都是像什么内外勾结啊然后关联交易啊侵占公司财产的是最多的反正都是为了自己的利益嘛

对你提到这个阿里内网其实阿里内网里面爆出来的之前阿里内部判定他是有违职业道德但其实大家在外部看来大家觉得说这个事挺正常或者说没有那么高高度的就是那个月饼事件嘛

对吧就阿里内部觉得说这个月饼事件是有违职业道德的对但是大家把这个事放出来之后大家觉得说就抢个月饼嘛至于这么这么严重吗对吧其实月饼根本也不值多少钱嘛对反正这个事其实也是在外部掀起了很大的风波对但我觉得你讲的这个内部撕开接口这个事我觉得他不被发现也是真的是不太可能

反正在对吧大家从 Nginx 里边各种调用对吧 log 一看你就知道说这怎么多了一个这个接口对吧我觉得这个事他自己就是这种知法犯法对吧他知道这个事肯定不行对他要做

对那有没有什么事是大家觉得说哎没啥问题就跟我们刚才讲的说大家都是凑一波嘛对吧红绿灯的时候凑一波管他红绿灯的反正我就走了对吧有没有类似这种事我就想到说之前有一些案子就是比较大家觉得好像没那么大条但实际上很大条的就掏鸟蛋嘛

大家觉得说掏个鸟蛋嘛对吧有啥对吧谁知道就是你一掏其实就是一个国家一级二级保护动物你掏完之后肯定就进去了现在动物比人贵对吧然后麻雀现在也是不能乱打的所以说这种事就跟刚才一笑讲的说这个事是触犯法律的但很多人不知道那我们确定说在公司层面上面有没有类似这种事嗯

其实你说像掏鸟蛋这种事让所有人都知道说这个东西是一个二级保护动物对吧然后你不能掏我觉得也不现实肯定是这个你就算普法普得再厉害你也不可能普到这个程度说我还认识这个鸟蛋

然后对吧我觉得这个在欧美法系里面因为它是那种判例加上陪审团的制度这个我觉得相对来说会在这种情况下会好一点因为大家都会知道说你这个其实比较情有可原对吧那就稍微轻判一下或者说就算了也都是有可能的

但在大陆法系里面反正就是法条是怎么样就怎么样就严格按照法条来就会导致这个事就真的会变成大事但是我觉得这个怎么说呢现在其实也是有倾向说再更加的灵活一点就像你说的这个二级保护动物就之前有两个卖鹦鹉的案子挺有名的反正有一个哥们是拿了一批鹦鹉来卖然后这批鹦鹉其实是养殖的它不是野生的

但这瓶荧物里面有几只好像有 40 多只还是怎么着是国家二级保护动物然后就一开始被判了 12 年他其实完全不知道而且也不是野生的因为这个所谓的国家保护动物它是野生动物你这个养殖的算不算其实说不好所以后来就二审改判了一个三年然后缓期两年那缓期两年的话就你表现好一点其实就基本上不用进去了嘛

他这个一二审这个结果差异就比较大主要原因一个就是被告人不知道然后另外一个是他贩卖的是鹦鹉是养殖的不是野生的所以从过程上他也没有造成太大的这个社会危害因为他也没有去抓这些野生的嘛所以就是从这个危害程度上考虑也相对比较轻最后就给轻判了这个可以说就是有点那个不知者不罪的这个酌情处理在里面

但是你说人多了就不醉这个事我觉得还是不成立的就是不知者不醉如果实际危害不是很大那实际危害很大肯定还是要处罚的那实际危害不是很大我觉得给个警示教育确实是一个比较合理的处理方式对吧但如果你明知道是二级保护动物还是野生的那你这 12 年肯定就是跑不掉的然后放到我们曾经工作的这个公司的场景下我觉得比较典型的可能就是

比如说把组织架构或者某些人的联系方式给到外部这种事我们应该都遇到过就是有人跑来问你说你们公司那个什么什么什么人能不能帮我联系一下对吧这种其实很多的虽然这种一般在公司培训的时候也都会讲但有的人确实真的也不觉得说是多大的事情而且从实际来看也确实经常有这么干的对吧我觉得这种事特别多一般没有造成什么后果也确实不会有人追究

但如果真的造成了什么后果像严重一点的比如说把整个组织架构数泄露出去之后然后被猎头挖了一堆人那这种肯定还是会被处罚的也包括说把公司内部资料或者机密信息泄露出去的当然这里面大多是故意的但也有因为无知而无意的典型的在程序员这个群体里面就比如说把内部的密钥服务器密码什么的对吧放在这个 Git 仓库里面就提交到 GitHub 上了

这种我们其实都遇到过但对于无意导致的其实一般我们也就是告诫一下就算了也不会真的说要把它怎么样之类的

嗯说到这个问题我现在经常能够在网上看到一些那种就是缺乏这种法律常识的言论我不知道你们有没有关注过你们可以在那种抖音平台的评论区里面其实经常都能够看到有一个抖音的视频就可能那种引导性的视频就是说我在离职的时候或者说特别是在被裁员的时候因为现在裁员有蛮多的嘛他在裁员的时候被裁那个后都说我要把我电脑中的

我自己写的这些 PPT 啊写的这些 word 文啊这些资料给它全部清空都不交给公司了反正觉得说这是一种好像我最后的挣扎的报复的行为嘛嗯我现在面对这种裁员觉得就想通过这种方式去报复公司啊或者报复老板啊

这样的一个情况其实这种就你去看那个评论区你就会发现很多很多人居然都有这样的想法并且你看他们的对话能够看得出来很多人都会觉得这是一件非常正常的事情觉得这些东西都是我写的我这个时候走了难道把它删了不是一个很正常的事情吗对吧把电脑给清空了把电脑还给公司在国内还是有很大一部分的人有这样的一个思想我觉得这个是非常危险的其实这肯定是违法的嘛

然后重点我想提一下像这种工作上的资料其实理论上你用公司的电脑去做副业做兼职做的成果其实它可能都不属于你自己的这件事是很容易被我们自己所忽略的我们往往有时候觉得说你拿公司的电脑拿去干另外的一个事情但如果被公司发现了其实那件事情的成果就是你去打官司的话你自己不一定能赢的

因为用公司的生产资源生产的东西其实理论上它应该是属于企业的对我们来说就是程序员大多数时候在职场的时候就是用了公司的电脑你自己去做一个业余项目的话其实很容易遇到这样的一个纠纷上的一个问题对

很难和公司去脱离这样的一个关系但只是因为大多数时候你自己去做的一个业余项目可能你的项目也没有货也没有和公司产生什么利益上的冲突公司如果真的要来追这种责任然后成本又挺高的所以说就没有发现太多这样的一个案例但实际上比如说像著名的 NJX 其实就扯上过类似的这样一个麻烦

因为大家看一下 NGX 的开发者 Eagle 的历史的话就知道他其实当时是在俄罗斯的一家公司做运维管理是一个运维工程师他其实就是在运维管理的过程当中写了 NGX 因为他觉得说以前的那些 web server 都不够好然后他利用他自己的运维经验

觉得说应该做一个更好的所以说就做了这样的一个那最后在 NGX 就像我说的它这个项目变得越来越有名并且产生了很大的利益过后

那原公司其实是提起过输送这件事当然最终没有成功所以我觉得这是我们所有的程序员应该注意的一个很容易被大家忽略的点对上大学的时候我还考过软考软考里面他讲的一个内容我觉得我现在还记忆犹新就是只要你在工作期间做的所有事情最终都是属于公司的这是软考里面的一个考题对

这个我还记得如果你知道这件事的话你就不会去做你不会去干类似这样的事情对还有一个就是刚才鬼鬼讲的猎头去抓组织树的这个事这个事其实前两天也有一个很重的事件就是奇安信奇安信其实是用 360 分出来的一个专门做企业安全的嘛

然后前线的齐向东然后告了一个猎头就是那个猎头因为他透过内部人员拍照呀各种方式抓组织树现在说是上海闽杭公安对那个猎头进行犯罪抓捕透过抓捕的手段包括还已经没收了他的犯罪材料比如说他的手机呀他的笔记本啊等等之类的现在已经移交检察院了

对就大家觉得说好像把一个公司里面的组织数扒下来好像没什么但其实这个东西也是我们讲奇安信的一个核心资产之一了对吧因为这里面都是他的人员嘛现在整个这个案件移交到检察院之后那个猎头就是在自己的朋友圈里面发言说齐总你能不能饶了我我不知道他到底知不知道这个事是犯法的那假如他知道这个事是犯法的其实这样子

去求情对于齐向东来讲他这个事是一定要办的因为就刚才像鬼鬼讲的说他一定要让这个事形成一个判例然后大家以后就不敢做类似相关的事嘛我觉得齐向东应该是不会服软的对但我觉得这个事也是一个挺典型的案例我估计可能啊他十有八九不知道说这个事会这么严重对吧甚至会跨省抓捕

对我觉得这个事也是一个我们讲法律意识淡泊的一个很明显的一个点对那我是觉得说我们现在从学生时代走到上班之后因为我们今天讲的田某他本身其实还没有正式工作嘛他其实属于是实习嘛对吧我觉得从开始上班的第一件事就是得知道要公私分明我们以前在学校的时候其实是没人给你强调这种意识的啊

你真到企业去之后如果你不转变的话是真的挺容易犯错误的我们一直都在讲说自己在上学的时候有学生思维嘛那你这种学生思维如果不转变的话你轻一点的话比如说没有像田某这么严重你可能转中不通过你可能第一年年度绩效 3.25 重一点的话你真的就触犯法律了对而且我觉得像我们科技行业就真的是反走过必留下痕迹的

你千万别心存侥幸觉得说我自己偷偷摸摸干了一个这个事然后没有被别人发现那 Linux 全线系统设计的我觉得天衣无缝就想找到你还是挺容易的对然后你别总觉得说自己心存侥幸到时候真的每天把自己搞得提心吊胆就真的我觉得没必要

对字节这个事就 800 万这个故事我觉得对当事人跟学校其实都有非常坏的影响对于字节也造成了很大的损失我其实在这里也是衷心希望说未来真的不要再出现类似的事件了也希望大家都能把心思用在创新上不要用在内部的防控上对吧内部防小人其实成本是很高的对大家都能做到说简单可依赖每个人都纯粹一点行业也会更好好的

我们本期节目就先到这里如果你对本期节目有什么想法欢迎在小宇宙评论区给我们留言讨论我们下期再见 拜拜

以上就是我们本期播客的全部内容感谢大家收听也欢迎大家踊跃留言如果你喜欢我们欢迎点赞并分享给感兴趣的朋友如果你在用苹果播客收听也希望你花几秒钟给我们一个好评这会让更多的人了解到我们要是能再点击一下订阅那就再好不过了我们下周见