1800 年代全球人均寿命不超过 40 岁而 200 年过去了 2023 年统计目前中国的人均寿命已经达到了 78.6 岁而且发达国家还会更高一些而最新的人类寿命目标已经提高到了 150 岁科技曼曼拍的听众们大家好啊
之前我们聊过人工智能在各个领域的应用例如影视交通数学教育编程等等今天我们需要来补上我们的另外一个短板也就是人工智能在医疗健康生物制药等等领域的目前的主要进展如果说其他领域我们可能还存在一些争议或者不同意见的话那么对于这个领域来讲
现在几乎是目前所有人都达到了一个共识而且很多业内的专家不管是医学领域的专家生物制药领域的专家还是人工智能的领域专家大家都是对这个领域是形成了一定的共识
目前还有种说法是人类的寿命是未来可以很快的延长到 150 岁而这个说法主要来自于两名业内的专家的重要表述其中一个是顶级 AI 公司 Anthropic CEODaryl Armaday 因为 Armaday 在创建 Anthropic 之前他本身就是一个生物领域的科学家
他在 2024 年 10 月份的一篇文章中也谈到过说未来人类 10 年内有望治愈癌症等各种疾病到时候人类的寿命可能翻翻达到 150 岁而另一位是更具影响力的也就是刚刚获得了诺贝尔化学奖 Google DeepMind 的 CEODemis Hassabis 他其实主导的是 AlphaFold 的开发 AlphaFold 其实是一个预测蛋白质三维结构的 AI 系统
那他在今年的 4 月 23 号接受时间 60 分杂志的时候的一个专访的时候也谈到一个类似的观点也就是说人工智能在未来 10 年可能治愈所有的疾病那人类的寿命将大大延长可能达到 150 岁
可能正是因为这样的原因市场上现在大家对于人工智能在生物医疗健康领域的突破大家就觉得非常的有可能而且这个很可能就形成一个是 AGI 未来形成的一个最重要的突破口
当然这个领域也不只是人工智能的贡献了还包含我们之前研究的各种科技成果的一个综合发生效果的这样一个情况这个领域而且又比较特殊因为人命关天不管是药品还是治疗手段所以我们不管是病人医院还有政府大家对这个领域的一些行业应用还是比较谨慎的
而对于这个领域来讲我个人来讲真的是一个门外汉所以今天我就邀请到了一位业内的嘉宾这位嘉宾是目前在美国医疗 AI 领域初创公司的陈章博士他本科是毕业于中科大生物系后来又转到了中科院
一个生物和计算机交叉科学的这样一个生物信息学的领域后来又转达到了香港的研究所从事这种肿瘤的早期筛查的 AI 的研究之后又转到宾夕法尼亚大学攻读博士学位专业是基因组以计算生物学毕业后在费城和波士顿的两家医院的数据科学研究团队工作现在是一家 AI 创业公司的技术的负责人
那他也是非常早的接触到人工智能在医疗领域的各式各样的应用而且也几乎经历了近十年来 AI 整个演进的一个历史的过程
最近他建立了自己的 YouTube 的频道而且非常深入的帮助听众去深入解读一些深奥的论文同时他也将自己的求学经历和工作的经历撰写成了播客文章我们这次的对话正是先从他的求学经历开始我可能要先介绍一下我自己的背景我本科其实是生物专业的
但是我发现这里面也有一些比较好玩的事情就是我当时高中毕业的时候选专业其实我就是在生物和计算机当中两个中间选择然后我当时就去问了一下我们高中的一个副校长
问他我应该选生物还是选计算机然后副校长就问了我一个问题说你是喜欢学理科还是想学工科然后我当时其实高中也不是很清楚以后想来干什么然后对什么计算机生物其实我也不是很了解然后我就说我想学理科
然后当时副校长就说生物是理科 计算机是功课那你就去学生物吧就他因为这一句话我就去学了生物对
然后入了校之后发现真正的生物跟我想的不是特别一样跟高中的也不太一样那大学里面的生物很多东西都是那种要记忆要背的我不是很擅长然后还有一个就是我很早就进实验室开始做实验了我周围的同学基本上大概按部就班的话应该可能大四末左右吧去做实验做一些毕社啊什么的
我基本上大二下学期大三上学期左右我就开始找实验室进实验室做实验因为我想知道我到底因为我前面上一些专业课什么的其实已经有点感觉觉得我生物好像很枯燥然后所以我就想尽早的去做进实验室开始生物研究然后了解一下生物我到底喜不喜欢所以我很早我就开始
联系实验室我应该是我们周围同学当中最早的一批进实验室了对我就当时找了一个实验室然后就开始做实验然后我就发现我真的是不太适合做那种基础的生物学研究就是当时实验师姐都挺好的带着我做实验什么但是我就发现我有一些实验就是做不出来
就是按照那种 protocol 就是那种流程啊就做就做不出来对然后后来我觉得确实可能自己不太不太适合学生物就做这种基础的我们叫 benchwork 就是在实验台上做生物实验的这种所以我就最后就想去转去做肝实验所谓肝实验就是边写程序处理数据实实验就是坐在实验台上面做实验那种所以我最后想转去做肝实验所以我就
很快的就把所有的课就选完了也是这也是我主动的一个一个计划吧然后我就大三三年就把大四大四所有的就四年所有的课程全部都选完了所以我大三基本上就就就就自由了所以我就大三下学期的时候我就开始联系那个中科院的实验室然后我就去中科院的一个生物心理学实验室然后就开始
转机做肝实验所以我大三最后一门课一考完我第二天我就去北京了然后就在中科院的实验室就开始做生物信息的一些研究然后那会儿就开始接触编程然后开始自学编程什么的在中科院待了两年左右我就去香港读硕士然后也还是做
的试用信息然后那会在香港就跟了一个教授的一个教授那个教授你在领域里还是挺有名的他是做那个产前诊断的啊 prenatal diagnosis 嗯产前诊断简单的说就是比如说妈妈怀孕了的话他要去啊就是做一些检查吧看一下这个胎儿有没有一些
遗传疾病啊什么的然后产前诊断就是就是按照这个字面理解就是说检查做抽血做一些检查然后他的那个一个基本的技术就是说产前诊断有很重要的一项就是检查那个三体综合症就正常的人类精组是两套人色体然后三体综合症就是说他会出现三套
这种的话传统的方法就是做那个穿刺羊水穿刺这个会有一定的风险然后这个教授就发现抽这个外周血就从妈妈的胳膊里面抽血就检查这种外周血就可以检查到这个胎儿的 DNA 胎儿的基因所以他当时就发明了这样一个技术这个技术有一个难点就是说胎儿的基因混在妈妈的血液里面的 DNA 里面所以这个就像一个
大海捞针一样或者是就在一个稻草里面找针一样就很难所以这就需要一些生物信息学的技术所以我们当时就做这一类的东西比如说我们本科毕业之后其实很多人已经面临着第一次选择了就是说我是继续学习还是我去就业就业能够提早的进入社会挣钱这也是很多人的选择但是在这个过程中好像你基本是没有犹豫的是选择了继续做研究
这可能跟这个生物专业有一定的关系因为生物专业的话基本上本科毕业是找不到工作的基本就是这样基本上我想一下我们那一届的同学生物专业的基本上都是毕业了之后要么出国要么留在本校或者中科院去读研好像很少有我印象中是没有
本科毕业就找工作的有那么几个同学本科毕业可能考其他的研究生转专业了这个也是有的当初上本科选择这个专业你就已经知道你会去读研究生了基本上可以这么确定但是我也没那么我想想也没有可能就是走一步看一步当时进了学校之后
可能也会接触一些实用师姐然后也知道每一年是这种实用师姐他们毕业了之后都去哪里大部分可能三分之一吧三分之一可能出国然后剩下的就摸保研啊考研啊所以潜移默化的自己的选择也就是可能是本科毕业肯定是会继续再读研究生的
你在研究生关于学生物这件事情你可能在一个内部细分领域你会去想到底是实实验或者干实验是但还那个时候也没有意识到要去转专业或者还没有意识到这个问题这个就可以聊很多了我当时其实想转专业大二左右我其实就觉得生物学的时代是太苦大了就背很多东西我不是很擅长背这些东西想转专业然后大三左右我其实
尝试跟学校计算机系的一些教授我发了邮件基本全发了然后就介绍了一下我的背景什么的就是说想去做毕社然后准专业那计算机系的教授没有一个教授回我然后我当时其实也跟化学系的一些教授发了很多的邮件化学系的教授也基本上都没有教授回我然后我就开始看外校的看中学院的一些教授然后就开始看生物信息然后跟中学院的两个教授
做生物信息的发了其中这两个教授都回了回了之后但是其中有一个回的比较早有一个刚好是我记得他刚好好像是一个什么假期然后其中一个教授是在一个假期之前就回我了假期中间头几天回我了然后另外一个教授就可能度假去了没有回我所以我就去这个阴错阳差就去这个回我比较早的这个教授实验室里面对然后在香港完了之后香港的话其实也是蛮有意思的一段经历就香港
他这个至少在我当时看来我觉得整个香港做科研的这个氛围不是特别的浓厚香港毕竟还是一个金融中心然后他也不是这种像美国呀这种他是一个学术的一个中心所以这是第一点第二点就是我当时对数学对统计特别感兴趣因为生物信息的话大部分的时间
都是在使用工具解决问题所以我们当时有一个词叫调包侠调包侠的意思就是说使用别人的已经写好的一些工具处理数据啊什么的
可能我又开始又觉得有一点无聊所以我就想去学一些数学和统计的东西然后我自己也开始看一些统计的书但是觉得就自学的话还是差那么一点所以这两个因素加在一起吧所以我在香港当时就只读了一个硕士然后其实可以在香港读完成博士但我想了一下我就去申请去美国了然后来美国之后就来到 U-Pen 了
Upen 的话我当时选了一个因为我们那个系叫那个计算生物学就 computational biology 它那个系其实是一个交叉的学科的一个系所以它那个系里面有很多的教授基本就是来自于学校里面其他的一些系这样的话我就可以选了一些不同虽然我在这个 computational biology 系里面但是我可以选其他的系的教授作为我的导师所以我当时就选了一个生酮系的教授
主要原因就是我想做一些统计相关的东西然后所以我就去生动系去做我的毕业设计了然后我生动系的话我在生动系做的博士的论文主要就跟统计相关但是我们研究的问题研究的是肠道微生物肠道微生物就是又是最近这几年比较
新奇的一个研究方向就是肠道微生物有一种说法就是可能是人体类最大的一个器官这个器官可能要打引号就是它不是真正的我们理解上的这种器官它就是一种可能是一种比喻性的这种器官因为人的肠道微生物肠道里面有很多很多种微生物
然后这个微生物跟人的这个生理的一些包括疾病啊是息息相关的最相关的可能就是一些肠道疾病那我当时研究的是那个小孩的慢性眼肠道慢性眼症叫 ABD 因为在费城的话那边有一个非常著名的儿童医院叫那个 CHOP 简简简也成叫 CHOPChildren Hospital of Philadelphia 这是在全美非常有名的一个医院当时我们就跟
CHOP 的医生合作然后他们就收集这个小孩的这个分辨样本然后是这种追踪式的所谓追踪式就是说我们会隔一段时间就是收集一下这小孩的一些分辨样本然后这小孩有一些是有这种疾病的有些是没有的然后还有一些是
就是给一些不同的治疗方案然后我们就用统计的方法首先是测序对分辨进行测序就是知道它这个分辨里面的这微生物的构成是什么然后我们就用一些统计的方法去分析哪些肠道微生物跟相关的疾病有关系然后哪些肠道微生物跟具体的治疗方案是相关的比如说有反应什么的
然后对然后博士基本上就是围绕着这一块再做一些主要是统计方法好像你没有说表达出这个自己特别热爱这个专业好像就是在选不断的在选择在决策在跟着这个情形在走我不知道就到这个时候其实对自己的这些专业或者未来所从事的领域或者工作你有一个判断吗
我有一个很模糊的一个大致的判断我整体来说我觉得我的成长过程尤其是早期本科研究生博士的整体来说还是比较的迷茫所谓的比较迷茫就是说我大部分时间都是在读书我也知道把自己该做的事情做好但是有的时候也不是百分之百的清楚将来想干什么读博士的时候这博士也是蛮辛苦的有时候一些科研做不出来
压力也挺大的然后我读博士期间我的那两边头发都白了白得还挺多的对也是相当于这个人生的过程吧然后也是走一步想一步其实也没有想得特别的清楚然后博士的时候也想过转金融啊什么的去考 CFA 啊之类的因为我有一些高中的同学他们也来美国了然后他们学化学的然后后来就觉得做科研很累啊或者是
没有意思之类的然后他们就去考 CFA 然后就转金融了可能对我有一些影响然后我当时也去考 CFA 对但是后来还是还是没有往这条路走下去因为我觉得我本身对我可能对这种生物的基础的研究不是特别感兴趣但我本身对对医疗
对这些我是非常感兴趣的因为我觉得这可能跟人的这种生命啊这种是息息相关的但是那种生物的基础研究比如说研究一个分子通路啊什么的这种可能有用但是我觉得太基础了所以我对这种基础的研究不是那么的感兴趣
所以这里有没有你考虑到一些所谓沉默成本的问题就是说可能很多人觉得在这个时间点已经上学学了这么多年这个领域然后再去转专业其实会有沉默成本的问题对吧好像很多人是不得不在这条路径上继续来全进对这是一个很好的问题沉默成本其实也是当时我考虑的一个很重要的因素因为花了这么多年的时间读书然后一直都是在
生物学或者至少是相关的领域在耕耘然后突然一下子比如说转去做金融这就是一个很大的沉默成本对当时也思考了很久然后最后还是决定
还是留在至少留在医疗这一块因为我本身对医疗还是非常感兴趣对在这个过程中其实我感觉到细微的差别就是从过去的这种纯生物可能逐步的再往医疗的方向再走对吧已经接触了更多跟医疗相关的那种是的所以对所以确实是这样所以我在做这些研究的过程当中我就慢慢的发现我对基础的
这些生物的研究不是很感兴趣但我对医疗很感兴趣所以我毕业了之后博士毕业了之后我当时找工作其实就有一定的明确性我当时其实我们专业最好的最对口的工作的地方应该是去药厂我在周围的博士同学基本都去药厂了
然后在费城周边其实有一些还很不错的一些大药厂就美国的一些大药厂对然后我当时找工作的时候其实我也有大药厂的 offer 但是我最后没去
对然后我的我的博士老板当时还还有一点就是不太理解觉得我怎么就是大药厂放了大药厂的 offer 不去啊什么的对那我当时后来就去了我们当时费城的一个一家医院另外一家医院叫那个 Thomas Jefferson Hospital 这个在全美也算是比较大的医院吧然后我当时选这个医院的
一个原因我也想的比较简单因为我觉得如果要做医疗的话就应该去第一线去前线去那个问题来源的地方当时就觉得医院里面肯定是医疗发生的地方它里面肯定有很多很多的问题然后有很多很多的数据
然后可能就是缺一些解决方案缺一些技术所以我当时就基本上也是毫不犹豫的吧我就去就选择了这个这个医院的这个 offer 那医院的话薪水肯定跟药厂是不能比的那薪水要低要低挺多的对然后一些其他的一些什么股票啊什么的都没有但是我觉得我觉得在那段那段时间我还是挺开心的那医院里面这个
职位有一点像现在的这种 consulting 一样就内部的 consulting 就内部的咨询他的话这个职位是在他不是在一个实验室里面这个职位不是在一个实验室他是属于这个医院的 IT department 属于就是信息技术那个部门里面
然后医院里面就会有很多的医生或者是一些 department head 就是部门的一些头他们会有一些医疗的一些问题有一些是跟医疗研究相关的就比如说有一个医生他是在全美做这个肾脏移植非常有名的一个医生
他就来找我们他说他有全美国近 30 几年肾脏移植的数据他就想做一个模型来预测肾脏移植的成功率这个东西很重要就是因为如果能够预测肾脏移植的成功率的话他们就可以把这个模型拿去做肾脏配型
因为传统的肾脏配型它就是一些一些规则的方法来配型但是这个配出来的这个肾脏跟这个病人它不一定是最好的匹配因为它只是一些规则性的所以他就想做一个做一个模型来预测肾脏移植成功率从而去做这个肾脏配型对就很多类似这样的一些课题然后还有一些就是跟这个医院运营相关的就比如说当时那个
neuroscience 就是神经科学他们的部门就有有他们的部门领导就来在找我们他们有这种这个医生做这个手术的时候用的这个手术器械消耗的这个数据他们想看一下这个医生做手术的时候因为他这些手术器械是非常贵的想看一下这些手术器械用的跟他的这个最后的 outcome 也就是这个手术的结果有什么关系就比如说有一个医生他可能用了很多非常贵的手术器械
但是他最后这个病人的这个结果也不太好所以他就让我们做一些分析去看一下每个医生的这个 performance 大家就该做这种事情那你就是到医院其实相当于就是已经进入到职场或者工作环境中了对吧对后来在费城待了很多年然后就想换一个环境然后费城基本上在美国
我的感觉是就比较衰败的那种城市跟国内的那个城市完全是没法比的跟现在这种费城在美国的地位当中有一点类似于说北京可能有一点有点夸张它就因为费城是当年一个独立权盐的一个地方所以还是很有名的很有一些历史的这个痕迹的一个城市但是费城就是美国很多大城市都是这样它会有一种这种
就空心化的这种进程就是他那种富人什么慢慢的都从市中心就慢慢搬到郊区去了所以这种大的城市市中心就会非常乱糟糟的所以我在费城生活了大不多 7 年左右然后我生活的地方因为 Thomas Jefferson Hospital 就是在费城的最中心的一块地方然后旁边就是中国城就是那个环境非常乱
然后我就我就不太喜欢然后每天相当于走在大街上就有一种呃很不安全的感觉觉得非常的危险然后那个中国城附近经常就是一些可能是吸过毒的人吧然后就就在那个街边上游荡然后神志不清的那种感觉反正我觉得还是挺危险的所以我当时就想想换一个城市我不想再非能待了我觉得呃
觉得一个生活环境很重要每天走在大街上没有安全感的话这个还是挺危险的所以我当时就想了一下能去哪里然后当时我因为我在美国还是算比较宅的我没有去过太多的美国的其他的城市但是我去过波士顿然后我觉得波士顿的人的整体素质挺高的
然后整个环境啊城市虽然市中心也有点乱七糟的但整体上还是还是很不错的然后走在大街上也没有觉得很危险啊这种感觉对然后我就当时就决定来波士顿然后然后我就就投简历啊然后投了好多简历然后波士顿这边有一家医院叫那个丹丹发布尔 Cancer Institute 它是哈佛的一家附属医院
就是哈佛的医学院他有一些教授也在丹拉法贝尔做就是他肯定也是医生之类的就是这种然后我当时就来丹拉法贝尔那你一直其实在选择就是东部波尔顿也是在东部没有想到去像跟科技比较接近的像西部硅谷那边去找工作吗想过当时想过当时也尊重我太太的建议我太太觉得西部太过于利布尔了觉得太过于自由了
对我就尊重他一点他不想去西部然后然后所以我就选择东部的城市然后东部的话想了一想也只有波士顿了所以就选了波士顿对对我想起来当时这个选波士顿还有另外一个中心还有另外一个原因因为我想做医疗然后我大概知道就是说如果要做医疗的话其实波士顿相比较硅谷来说其实波士顿更怎么说呢就是波士顿他有很多的医院
就医疗这一块它有很多的医院然后有很多很多大药厂的总部都是在波士顿就美国有两大这个医疗的中心一个是新泽西 New Jersey 一个是这个波士顿
然后硅谷那边他也有很多做医疗的但他们那种就是偏科技偏 tech 一些但真正医疗的中心 hub 应该是在波士顿所以当时这也是为什么选波士顿的另外一个原因所以这个过程中就是现在美国的东部和西部就是东部我理解是更传统一些对吧他们在结合新科技或者新技术和西部的这种科技
可能以 tech 为主还是你认为还是有一点挺大的区别的是吧我觉得有区别我觉得整体先说整体这个行业类的话这个医疗这一块整体来说就会比较慢一些慢一些我觉得也是可以理解的因为毕竟一些新的技术如果要真正的用到这种医疗场景的话它不可能就是不经过任何的测试就直接用到比如人身上或者制药上面这都会有一些严重的后果
所以一些这些新的技术出来首先这些做决策的这些人包括医生他们接受就需要一定的时间因为他们相对来说是比较保守的等他们意识到这个很重要开始就是尝试了之后哪怕有一个新的机制出来之后要做很长时间的临床实验这临床实验有可能一年两年都是有可能的甚至更长都是有可能的所以等真正这个新的技术
被人所接受然后开始临床实验真正被人产品真正开始用到这种临床医疗场景的话时间是非常长的
但是西海岸就不一样了西海岸他们从 tech 的角度助手他们有的时候就是飞快的那种迭代所以他们的整个西海岸的技术的发展是非常快的像马斯克那种 neuralink 这个可能只是在西部会有可能东部都不会去做对东部可能会比较比较我觉得东部可能会比较的这种慢一点我也不能说不会有也会有但可能会比较慢一些
有一个滞后这个是本身是说比如州的法律政策就不允许还是说这个就完全是一种内生性的就是这些医院的负责人或者药厂的负责人他们自身的出发我觉得是跟行业整体有关系的可能州的一些政策具体我不是很清楚但我觉得没有州的政策可能会限制什么的限制应该是没有的但我觉得跟行业本身是
是有一些关系的所以就是说在整个的你到了波士顿之后波士顿的整个城市应该是比宾州应该更新一点对吧人们环境也会好一点大学更多一些对波士顿整体我非常的喜欢首先它遍地都是大学基本上你走可能我不知道就是这种每个小的这种
小的一块区域里面都可能会有一个一个 college 一些大学这边大学非常的多然后医院非常的多药厂非常的多然后波士顿也有一个外号叫那个博士团就是他这个
博士的比例非常高就是网上有一个流传的笑话就是你扔一块砖下来天上掉一块砖下来在博士证有可能你砸中的就是一个博士所以这边就是受教育的这种高等教育的比例是非常的高然后整体上我觉得人的素质也比费城要高很多
然后波士顿也是一个美国非常有历史文化的一个城市当年英国人跟应该叫美国人当时其实也是英国人打仗的时候就是在这附近独立战争第一枪就是在波士顿开枪你到那然后就在波士顿买房子了对然后那会儿还没有那会儿
在 Dana Farber 的时候还没有买房子然后后来又换了一个工作到后来那个工作我才开始买房子因为毕竟在两个医院里面工作就收入不是那么的高也不算低但也不是那么的高波士顿的房价真是贵的离谱所以当时其实是没有钱买不起房子当时是没有卖的
对我觉得反正买房子这件事情就是跟男女朋友谈恋爱说买房子其实它代表两个特点一个是说第一你打算在这长期安家了这是一个第二个是说你的经济基础已经达到了一定实力
所以有时候问买房子其实是隐含那两个两个隐藏问题 OK 明白了我当时经济技术还不够当时对当时首付什么的都不够到后来第三个工作的时候当时存了一些钱然后才买了一个相对来说在波士顿比较便宜的相对来说比较便宜的
买了一个房子然后住了几年就是你也读了这么多年书对吧也其实相当于在一个比较好的一些医院这算一个比较标准的或者中产或中产以上那对于就是说你的这种薪酬和你在波尔顿这种城市的生活这种
供房普通的日常生活你觉得压力大吗现在就具体看自己的心态我当时在医院里面工作的时候因为没有买房子基本上就租房子基本上薪酬什么基本能覆盖我平时的一些开销什么的所以压力也不是特别大但真的说如果往上走就比如说存点钱买房子的话那是基本是没有可能的就在医院里面这种情况没有太大的可能
当然这跟我自己的也有一定关系了我当时就是投资的意识也比较少比较小也没有就是说积极的去比较存钱然后投资什么的这做的也不是特别好所以跟我这个也有一定的关系就直到后来跳槽了之后这个薪水
涨了很多之后然后再开始存钱然后买一些这种大盘开始投资然后慢慢的才开始把首付给存下来了然后就赶上了当时疫情的时候就美国大放水利率特别的低所以当时就赶上付了一个首付然后赶上利率低的时候贷款所以买了一个我们这边叫 townhouse 买了一个 townhouse
我觉得挺小的可能每个人标准不一样就买了一个比较小的一个 townhouse 住了几年我不知道在这个点上其实买房子可能都是所有年轻人的比较痛苦的点我不知道你有没有跟国内的一些朋友或者你的同龄人你们你感受出来的因为国内大家买房子付首付还房贷尤其在 2122 年以前大家压力也都很大我不知道你有没有横向对比
谁可能会压力更大一点呢是美国压力大还是中国压力大是我这个人整体的性格可能就不太愿意跟不太跟别人比对我不太跟别人去比生活的好坏比较比较注重于自己但我知道我周围的很多同学包括我家里一些亲戚他们这种房贷的国内的房贷压力还是很大的对
对然后国内本身的工作压力 996 就大很多所以他们相对来说就挣点钱其实比我更辛苦一些所以然后又要还房贷所以他们压力会更大这个我是知道的所以这也是导致我不敢回国的一个很重要的原因就是总体你还是大致虽然你口头讲没有太对比但是其实心里还是默默的比了一下对我大概知道人之常情我觉得这也很正常嗯
那你这样的话就基本上在波士顿安定下来然后你怎么又从你的医院又出来呢这个就是可能一个机缘巧合就当时我的一个博士师兄在新泽西做教授然后他有一个邻居他的邻居就是我现在的老板他的邻居当时来波士顿相当于是做了一个 Star2
做了一个创业公司然后我其实跟我现在老板其实有过一些交集交集就是我当时第一份工作就是 Thomas Jefferson Hospital 换工作的时候我当时其实有一个面试然后只不过老板当时是远程面试我的然后他说对我的印象非常好
但是当时那个公司没有给我 offer 但是我就是这个老板就是我现在这个老板当时给了我很高的评价对但是这个公司没有给我 offer 所以他对我有一个很深的印象然后他来了波士顿之后就我的这个博士师兄就他邻居就把他的微信给我了然后我们就互相加了一个微信加了微信之后刚好在波士顿
有一个有一个有一个 AI 医疗的一个什么会议具体的会议我已经记不清楚了然后我就去参加那个会议然后在那个会议上面就跟我现在这个老板就相当于就终于接上头了他也是中国人吗中国人对然后接上头了之后他就邀请我去面试当时这个公司特别小只有两个人就是他跟算是 CEO 吧只有他们两个人对然后我就去面试了然后去面试的话嗯
就 startup 的那种风格在一个一个共享的一个办公空间里面然后一个非常小的一个办公室然后会议室也是跟别人分享的去面了之后总的来说我觉得我能感受到最比较吸引我的就是他们两个人这种这种 passion 这种激情就是最用 AI 来改变医疗的一些激情然后他们当时做的是医疗图像当时还是挺算是比较有
怎么说相对来说比较成熟能做一些产品能做一些应用的地方那是哪一年 2019 年吧大概是 2019 年对那几年有很多关于医疗图像的一些创业公司出来然后医疗图像我算是做了一些但做的比较少然后我也觉得对这一块我自己也比较感兴趣但主要是觉得他们两个人跟我聊天的过程当中我觉得这种 passion 特别吸引我然后我也想就是一起做一点事情所以当时
然后他们他们觉得我背景也挺好的也也觉得我很有 passion 基本上就是呃两方都嗯觉得对方都比较好对所以我当时也没有太犹豫吧然后他们给了个 offer 我然后我就接受了所以我就去那个去去去就来现在这个公司了对你们现在主要是做的是 2b 的生意是吧是给医院还是对呃
我虽然加入比较早但我不是创始人所以这种 business 这一块因为我也比较做技术 business 这一块我大概知道但我不是百分之百的特别的清楚然后基本上就是我们其实我们上面有一个母公司母公司它是做医疗器械的医疗器械的话就我们这个业务分两半一部分就是为我们母公司的这些医疗器械开发一些 AI 的软件然后跟医疗器械相当于绑定的一起卖
然后另外一块就是我们做一些独立的产品也是一些 AI 医疗的软件然后这个就是卖给医院其实你说的可能是 2B 的你觉得在这么多的人生转换或者切换的过程中其实我看你的博客上的标题也是从双螺旋到 AI 大模型的整个的跨界旅程那这个旅程中你认为最成功或者是最关键的几次转换到底是哪几次呢
然后最成功的就有时候我也会反思我自己就是我我我倒不是想用成功来定义我自己吧我觉得整个过程都是都是一个自我探索的过程我觉得这个过程很重要就是要弄明白自己说大一点自己的人生意义吧说小一点就是自己对什么东西感兴趣真的要是说比较成功的话我觉得我觉得我我当时
本科的时候决定从纯的这种基础的生物学研究转去做生物信息我觉得这是一个非常非常关键的一个决策因为我能看到我周围那些可能跟我同龄或者是同届的差不多的那种年龄段的同学如果还在做生物的话他们现在是一种什么情况我大概能看到
可能很多人现在还在做博后做了可能有两三轮的博后了然后还在找教职因为做完博后的话再想去工业界找工作相对来说比较难一些基本上也只能找博后找教职了就去做大学里做教授生物的话相对来说也是竞争非常激烈的所以做完两三轮之后如果又找不到教职然后也不太容易去工业界的话基本上就一种很尴尬的一种状态对
所以我觉得我当时转去做生物信息这个对我来说是非常重要的一个选择因为可能我个人的性格其实也不太适合做那种四级硬背的东西我对这种数学这种需要思考需要去创造的东西我可能比较更擅长一些所以当时这是一个很重要的决定然后也基本上对我后来就是做一些 AI 相关的东西也是有帮助的因为
当时转送信息也没有送过什么系统像那种学 CS 的那种系统的教育我也没有基本上都很多东西都是自学的所以也帮助我到后来就是 AI 这一块发展起来之后我自学什么的我觉得也是有一定的帮助的所以我觉得那个选择是非常重要的而第二个我觉得非常重要的选择我觉得我出国也是很重要的一个选择我并没有说留在国内不好我只是觉得相对我个人来说的话
出国的话这整个人的这个想问题的这种思考问题的方式都不一样了呃外面出来之后见了很多很多的东西呃我觉得更多的是对我这种思考方式这么眼界的这种塑造我觉得这一点呃对我个人成长来说非常的有帮助当然不好的地方也有了就是离家比较远了然后父母啊这些可能就不是那么好啊对就是这是我觉得呃
可能是第二个比较重要的一个选择第三个我觉得可能比较相关的就是 AI 发展的每一个小的浪潮我基本上都努力的去参与当时我记得 deep learning 开始兴起的时候我当时正好是在 Thomas Jefferson Hospital 那会 deep learning 刚刚开始兴起还没有现在的什么 PyTorch 就是那种 deep learning 的框架都没有
我当时在医院里面条件也比较艰苦这条件打一个引号但是我们有自己的那种处理数据的服务器但是那种都是 CPU 的没有那种 GPU 的所以我当时为了抓住这些机遇首先我自己就自学然后买一些网上的课自己学然后我自己组装了一台 GPU 的服务器其实就是那种类似于打游戏的那种但是我自己组装的
然后这个非常费劲因为在医院里面这个电脑是要层层审批的他不能随便随便的把这个病人的医疗数据放到这个电脑上面
对然后我就去找找我的领导然后再找他的领导就跟他们说我就说这个地方你怎么兴起能处理很多东西怎么都反正就跟他们讲这些事情反正最后同意了同意了之后就但是 IT 里边就特别慢反正一言以蔽之就花了很多很大的劲才最后终于同意我把服务器放到我的办公室里面可以处理医疗数据对反正挺费劲的但我想表达的意思就是说
创造了自己创造了一些条件去抓住这些这些机遇对然后然后最近这几年这技术一直不断的在往前发展包括现在这种大模型啊大圆模型啊然后 AI agent 啊我基本上都在都在追踪所以所以我觉得这个可能是我第三个我觉得算是一个正确的决定吧就是这种技术的发展我一直基本都在都在 follow
其实像最近的相当于 AI 的这几波你相当于都在从这个就努力尝试比如说你最早的我理解可能是基于数据的一些分类的对 Machine Learning 的一些东西后面到图像识别 Deep Learning 的东西这种是可能是上一波的
最近的到 2223 年开始大模型对吧其实现在你也在从事里面的一些工作我不知道这几波的 AI 的技术的浪潮从你的个人体会来讲你觉得差别是什么或者是对你的触动是什么我相信很多人一开始他觉得能帮助但是可能只是当他一个工具但是可能到现在来讲你可能认为他
是不是在给我们带来的影响会更大我不知道你的这个中间的感受有没有在变化嗯嗯呃我我我可能下面说的这个可能没有直接回答你的这个问题但我觉得我想表达一下就是呃我的一个很大的一个感受就是我其实觉得技术是在循序渐进的在发展的就是因为像我每天都看很多的 paper 啊什么的我我发现就我的感受就是嗯
就很多人可能从外面看过来觉得技术好像突然就冒出来一个比如说 GPT 啊什么的但是如果我像我这种每天都在看 paper 的话其实我觉得这种包括像 GPT 的发展它其实这种技术都是一点一点一点的而且都是基于前任的工作一点一点的发展出来的所以没有这种所谓的这种跳变其实都是一种循序循序渐进的一些工作那我觉得可能对我最大的一个触动就是
从技术角度来讲的话就是这个技术的发展我觉得虽然是循序渐进的但我觉得还是发展的非常的快尤其是像我们早年的时候觉得在强调的一个问题一直在强调的一个问题就是 overfitting 就是当数据少了之后这个模型太复杂了之后有可能会出现 overfittingoverfitting 就会导致的一个结果就是它在实际用的时候它那个性能会不好
但是虽然我们现在也说偶尔肥挺但是我们当年就主要就是强调的这个模型不能太复杂就是模型要稍微的就是简单一点不能太复杂不能太大但现在这几年就是整个就反过来了就是模型越大越好但这里面有可能有各种各样的原因或者是因素在里面那一方面也是因为数据现在越来越多
每天看 paper 就有各种各样的人会整理一些数据然后出一些 benchmark 这样的一些数据集什么的一个是数据越来越多第二个就是算力能跟上来像 Vidya 的 GPU 因为以前如果我们想穿一个很大的很复杂的模型就没有硬件设施能够做现在这种 Vidya 的 GPU 出来之后还有各种各样的第三方厂商把它做成各种 cluster 直接买
还有这种 cloud 就让酸力能够提供所以能够做了第三个就是我可能觉得模型这一块以前想把这个模型做得很复杂比如说如果我们搞一个 CNN 模型把它做得很复杂它的模型的性能提高可能不会很明显但现在像这种 transformer 这样的模型出来之后它的这种 inductive bias 小了之后它能够 scale up
所以我觉得这也是一个很重要的一个原因对我觉得你可能更多从技术发展的角度但是我的感觉就是说虽然技术它是有脉络可循的而且从你从业这过程中你也能看到它的发展过程但是其实这次的爆发它会引起一个我们通常讲它已经跨了圈子了就是说更多的人的关注这样的话整个从社会的资源然后参与的人数
然后就会更多对吧大家看到其实现在的爆发是由于我认为是从业者越来越多然后资金投入越来越大所以他能衍生出来的东西就会越来越大他需要有一个这种一个爆发期的一个成长那从你们的角度讲就是我不知道你们有没有吃到这波红利啊这个简单讲
肯定是迟到了就比如说我只说我们具体的这个领域我不知道别的领域像我们做医疗图像的现在基本上已经没有用那种传统的模型了所谓的传统模型就是早期的时候比如说什么 SVMRandom Forest 像这种非常早期的模型现在完全是看不到了现在就是我们产品里面部署的基本都是 Deep Learning
CNN 或者是 Transformer 这一类的模型基本都不出在产品里面那也是有原因的并不是因为这个技术吸引我们才用确实因为就是因为效果好确实就是效果好就是做出来之后它在各种场景下它的性能就是要确实要好所以我们就把它用在产品里面所以我觉得这确实是一波红利这种技术带来的红利
在产品里面反映出来的就是可能医生在用这些基于 AI 的产品它的这种准确度不管是做什么样的类型的这种任务它的准确度都会高很多所以我觉得不光是我们吃到红利我觉得医疗的这种一线的从业者比如医生他们其实也活得过少的或者间接的他们也吃到这波红利然后再具体往下说病人就不用说了我们有一些做这种癌症的早期筛查的
比如说乳腺癌可能如果用一些传统的方法或者不用积育癌的方法可能就是人看就是那种 radiologist 就放上科的医生去读这些片子人看的话容易疲劳就容易出各种各样的问题现在积育癌的话
就是他性能会非常的稳定因为 AI 你不管怎么跑他也不会疲劳所以他性能特别稳定第二就是他的这种准确率可能都比人要稍微的高一些或者是人加上 AI 辅助之后比单独的人他的这种性能是要高一些的所以从病人的角度来讲的话他
他们也能享受到很多的这种福利比如说如果有人去做这种早期筛查的话可能一些不是很明显的呃肿瘤啊什么的现在基于这些 AI 的技术都能够把它早期能够筛查出来所以我觉得也是确实是有弘历的呃那正好就是谈到这个 AI 医疗的这个问题啊就是说最近就是我感觉大家不管谈 AGI 也好不管业内的很多的这个人类啊大家其实对于 AI 在呃
医疗或者生物领域都是非常乐观的比如说 60 分钟采访哈萨比斯他就谈到说 AI 在未来 10 年或更长的时间能够去治愈所有的疾病这是谈到的一种讲法但也有人说他这种讲法也比较夸张我不知道从你的角度讲你是不是认同他的这种看法或者说他讲的是某个领域还是整个是全面的对疾病的影响
我是有保留的认同吧就是怎么说认同原因是因为确实现在这种 AI 的技术发展对医疗包括我刚才说的那些还有制药确实有很大的推动作用的但是它里面说就是能够消灭所有的疾病说的我觉得是有一些
所以这一部分我不是特别的认同当然因为可能有一些他看得到我看不到的东西所以我也不知道他这个是不是有一些他里面比如说 DeepMind 有一些还没有发表的一些特别厉害的技术也说不定但是总体从我个人角度说我觉得这个说五年到十年消灭所有疾病这个是有一点点的这个夸张的我觉得对
这个问题我想再拆解一下我不知道就是说我们就是如果他说治愈到底是说我们对于疾病的尽早识别防范而带来的结果还是说我们即使得了疾病我们现在有药品这个能力治疗能力更强了或者我们的诊疗手段更强所以我们能够治愈所有疾病我不知道就是说
你个人在你从业你觉得他是从哪个方面得到了一个本质性的提升或者说都是这两方面都有提升他才能说出这样的话或者你看到的你觉得哪方面更有潜力在发展我觉得两方面都有就是从疾病的诊断到疾病的治疗当然这里面我想补充一点就是说 AI 在医疗这一块不光是大家能这种简单的能想到的诊断治疗其实还有其实还有方方面面
比如说最简单的我在医院里面做的那些课题它跟医院的整体运营为也是有关系的提高医院的服务的质量其实跟医疗也是有相相息息相关的 AI 的应用不光是在简单的大家看得见摸得着的这些方面我在这里插一个例子比如说我们当时做了一个课题
就是在医院里面他有一个词叫 passway 所谓的 passway 就是说医生他在尤其是急诊科的医生他在做一些就是一些一些病人来的时候尤其是这个病人他的诊断不是特别明确的时候医生有一个非常明确的一个
可能照诊断指南吧就比如说这个 passway 上面画的就是说如果这个病人有 X 的话你就做什么病人有 Y 的话你就做什么大概就是这样的一个非常明确的一个像树状那样的一个分叉他们叫 passway 这样的一个好处就是说比如说你突然急诊科有一个病人来了
他发烧那这种发烧它有非常非常多的可能那你怎么具体给一个诊断并且相对应的治疗方案的话这就非常的关键了因为有可能发烧是一个比如说是败血症败血症的话就 sepsis 他这个败血症的这个如果是急性的话是死亡率是非常高的
所以所以这个医生就就就是他必须要根据这个 passway 来做一些这个判断那这样有一个也有另外一个好处就是到时候出了责任只要医生 follow 这个 passway 那医生大概率是就是说嗯不会有太多的问题但是如果比如说这个医生没有 follow 这个 passway 到时候出了问题那有可能这个嗯
这个医生就可能要担一些责任了所以我们当时做的一个课题就是说我们来分析一下这些医生有没有完全的 follow 这个 passway
对然后比较搞笑的是那个当时部门领导就说还要把这个最后的结果跟这个医生的这个奖金是挂钩的如果 follow 的话就就奖金就可能会会高一些对然后举这个例子主要是想说明就在医院里面有很多这种背后的这种这种比如说服务的这种质量因为这个也是跟这个病人的这种啊
治疗是息息相关的如果医院里面每个医生都有严格的遵守一套的这种诊疗的标准的话其实对这个医院整体的
服务质量是有好处的对所以说我们在谈 AI 对医疗行业的影响就不光是我们能看到的做一些癌症的早期筛查做一些治疗还有一些药物的研发还有这些背后的可能大家都没有感觉到的一些很多的一种应用场景
关于回到哈萨比斯的论点我觉得我可能我不知道这个算不算过于的保守因为我觉得很多的疾病
其实可能都没有办法完全的治愈或者是就是这种疾病治好了之后可能会有一些新的疾病出来就是没有办法完全把所有的疾病都给消除掉这里我可以举一些例子吧就比如说我觉得有很多目前的技术来说现在有很多的这种遗传疾病就比如说我当时硕士做的那个揣索命
就是三体综合症我当时主要做的是 13 18 和 21 三体综合症这种话是整个基因组的改变就每个可能是每个细胞里面正常的人是两套他就是三套这种这种 DNA 所以这种哪怕能早期诊断的出来但是要完全把它治愈我觉得从目前的这种
手段来看还是非常难的因为这种它都是非常底层的人类的这种 DNA 底层的改变而且是整个基因组的这种层面的改变所以我觉得至少从我的想象力来说 5 到 10 年把这样的疾病给治愈我觉得这个是有一定难的对
第二类的话可能就是传染病比如说像 covid 我又记得我们当时本科的时候老师讲生态学生态学他就举了一个例子但他不是举的人类社会他就举了这种动物界的这种群体他就说这种自然界它其实是有调节群体密度的一种内在的一种机制就比如说自然界里面如果一个动物的群体它的密度慢慢慢慢变高
它这个群体之间就是动物这个群体之间它会接触更加密切到了一定的预知之后它就会爆发传染病就自然界就是这样然后这个传染病就会把这个群体的密度给降低降低了之后就传染病自然就消失了消失了之后然后又会进入下一个循环就是当这个群体密度万一又开始高的时候传染病又开始爆发对所以我们老师当时就像举这样的一个例子就是说自然界其实有内在的这种调控群体密度的这种一个内在的机制
所以我从纯生物角度来说的话就是这种人类社会它其人类也是可以看成一个动物的群体所以当人类这个人接触得越来越密集之后它这种传染病就会越来越多
当然人类应该有很多的这种一种机制去去防范这种传染病的爆发但我觉得随着除非像伊隆马斯克一样移民火星但是我觉得越往后就人群密度越来越高的话这种传染病就会越来越多我觉得对因为我觉得这是大自然的一种规律那你谈到的是这种就不太能治愈的那你觉得比较乐观的看那哪些类的比如说疾病可能会能够治愈
OK 比较能治愈的你比如说像现在 COVID 之前没有疫苗现在疫苗很快就出来了这是一个然后比如说现在我脑海中浮现的就是那个饼干 HCV 以前也是认为不能治愈的现在也是能治愈的然后可能放在我们现在讨论的这个语境下我觉得很可能下一个就是 HIV 吧因为现在大家都在研究 HIV
HIV 目前是没法治愈的但是它有一些的那种突破我觉得有可能 5 到 10 年 HIV 治愈倒是真有可能那对于像癌症这种呢癌症就要看具体的癌症我相信就是很多的癌症很多的癌症确实是可以治愈的但是我也想强调一点就是说我不想大家误解就是觉得我好像说的很恐怖一样但我觉得癌症其实也是
就是自然界的一种怎么说呢在我看来可能也是一种自然规律就是我们当时做实验的时候我接触了一个词因为我当时本科进的就是一个分子肿瘤生物实验室然后我当时进实验室之后学的第一个词就叫凋亡我当时就不太明白什么叫凋亡所以凋亡就是正常的细胞它就是会死亡的
就正常的细胞它就是会死亡然后它那个细胞里面有一些机制比如说那个端粒端粒就是这个 DNA 的一个末端嘛它在这个细胞不断的复制过程当中它这个端粒会越来越短当短到一定程度的时候这个细胞就要启动它的这个凋亡机制细胞就要自然死亡然后它这个自然死亡就会
就是正常的但是如果这个细胞没有正常死亡的话它会开始恶性复制然后它就发展成了肿瘤现在的很多肿瘤我觉得它的研究机制已经研究得很清楚了但是我想说就是说肿瘤也许可以看成是人生物体的一种
一种我想用个什么词也是一种机制就是它也可以有一些它自己的逃逸机制比如说我当时本科参与了一个课题我们就是研究乳腺癌的抗药性乳腺癌的治疗有一个非常好的药叫慈山醇那慈山醇有一个问题就是乳腺癌它自己使用了慈山醇之后有一些这种乳腺癌的癌症细胞它会产生抗药性
这其实就是这个癌症细胞它自己发展出来的一种防御机制包括现在为什么艾滋病这么难治其实也是因为艾滋病它有很多的突变这种突变其实也是某种可以理解为一种逃逸机制所以我想整体上表达的一个意思就是说我觉得某些癌症是可以治愈的但是癌症它也不断的在
它自己也会在发展它会有些新的套医剂出来所以我就想说有些药发展出来之后有可能慢慢的它又会产生一些抗药性所以我总体来觉得我觉得 5 到 10 年把所有癌症都治愈这个是比较难的但我听到整个就是你这个表述来讲我感觉还是我们在一类疾病或者一类方法的谈这个很像就是
就是我们之前的类似这种小模型就是我针对一类问题我要提出我的解决方案我要制定我的算法或者逻辑我的方式呃但是我我觉得今天倒好像我们在谈大模型大家容易说我们要找到一种泛化的方法我们一种通用的方法找到比如底层基因的这些问题那这些疾病无非都是这些基因或者什么来导致的那我们从根本上解决问题所以呃
从你的观察来看还是要一类一类去解决还是我们哈萨比斯他谈到的可能是我们会找到一些底层的人的一些生物密码来去解决这个问题我
我觉得我也可能也没有到哈萨比斯的那种高度但我相信很多人包括我自己想解决的问题还是这种非常 fundamental 的非常从底层从根本上的去解决不管是什么疾病但是我觉得就是从研究角度来讲的话肯定是要从一个具体的问题去着手去解决当然是从 AI 的角度的话我们现在都在强调这种 AI 的这种方式
Foundation Model 也就是这种很基座模型基座模型确实是是很好但是我们发现当然要把基座模型用到一些具体的领域一些垂直领域去解决问题的时候其实基座基座模型它的这个性能其实没有这种 Funtune 过后的这种专业的模型它的性能好
所以回到具体的医疗问题上面我觉得 D-Mind 它现在做的很多东西确实是跟这种在解决一些 fundamental 的问题比如说它推出这种 AlphaFoldAlphaFold123 它就是在解决非常 fundamental 的这种蛋白的这种结构的问题 protein structure 的问题因为这个为什么这个是 fundamental 因为你只有知道了蛋白的这种结构你才能针对这种蛋白的结构去设计药物这确实是一些
很反的门头的问题但我同时也想说的就是说这些反的门头的问题想解决也不是那么容易的因为这个 protein 在真正的生物环境里面在这种细胞里面它这个结构是 dynamic 它是一直在变的它比如说它结合了一些小分子或者是结合了某个 DNA 片段或者是某些其他的东西之后它这个结构是有变化的结构一变化之后它的功能也会随之而变化
所以想解决这些非常 fundamental 的问题也不是那么容易的就是想在五到十年之内把这些 fundamental 问题解决了也不是那么特别容易的 OK 这个是我们谈的是关于疾病的这块您这个还有什么补充的吗我觉得可能就是要稍微谈一下这种伦理学的问题因为刚才不是讨论到艾滋病什么的我就想到最近一个新闻就是
贺建奎他不是被被被判刑了因为他就是用了那个 Christopher 技术做了两个经营边境应该是是一个还是两个小孩对然后最后就被判刑了我觉得这个从技术上来讲其实没有太大的问题可能最多的更多的是从这种伦理上的一些一些问题所以可能想提一下就是说这种技术发展包括现在我们做这种大圆模型大家也都在
很多人都在跳出来说一定要对现在 AI 的发展做一些的限制当然这两派现在真的非常的凶在美国这边已经上升到了这种就是科研界的大佬都在互相的这种吵我觉得确实要引起重视就是不光是 AI 包括医疗这些就这种新技术的使用要比较的慎重就是不能不加监管的就使用会造成还确实很多严重的后果
但从实际的角度讲现在有人去做这样的监管吗我感觉现在主流声音还是大家去发展为主或者是刚才你看我们谈到一些 AI 的使用其实现在从美国就是各个州的立法或者什么的话对这个也没有什么特别的约束是不是对现在可能就是说从多个方面一方面就从技术角度很多人已经开始研究这种
这种 AI 的安全性的问题就是它会在什么情况下出错 AI 是怎么在运作的这研究方面有很多在做然后很多已经就是美国我具体忘了拜登时期应该是有一些法案或者是一些规定之类的就是在对整个 AI 的发展是有一些政策方面是有一些限制的可能就是我能想到的两个方面确实是有的现在慢慢慢慢在推动
就有些有些东西是不能不能做的比如像像霍建奎做那个东西他最主要的一个问题就是他开了一个先例之后可以编辑人类的这个基因组然后这个基因组这个是可以代代往下遗传的所以所以如果这个技术能够开创这个先河能够允许编辑人类的基因的话这个
我觉得就是一个可能是一个潘多拉的魔盒就打开了你可以把这个技术去改变让人变得更聪明或者是
让人我不知道长一个什么翅膀脚谱塞什么的这种都可以开始慢慢都可以开始做了所以我觉得确实需要一定的监管我们谈完了关于疾病的那我可能接下来就是诊疗因为你可能原来也一直从事这方面的工作你比如说这种看诊疗的片子或者是一些诊断的方式我不知道在这个领域你们现在一些最新的进展或者有没有什么跟大家分享的
就也稍微回应一下前面的讨论的一个点就是说当时 GPT-4O
就是他可以读图的 gbtfo 出来之后我们当时是稍微有点紧张的就觉得现在这种 AI 这种比较 general 的就是比较泛化的这种 AI 模型出来之后会不会对这种垂直领域比如说像医疗里面看片子这种会有影响当时我们就做了一些简单的一些实验就发现 gbtfo 可以读但是具体到一些具体的场景就比如说乳腺癌什么的它的那种识别率什么的还是不如专业的模型要高
所以这也是回应一下就前面说的这种 general model 还是要差很多我们具体做的就是医疗图像这一块具体的其他的领域我不是特别清楚但我们医疗图像这一块的话基本上在很多的领域里面你只要是能收集到数据我们基本上就可以做一个还不错的模型出来然后现在的一个在医院里面的这种放射壳
传统的方法就是让人去读这些片子不光是做最多的就是肺结节还有就是乳腺的筛查这些加了 AI 之后我最近参与了一个临床实验确实是加了 AI 之后就人家 AI 的这个分析体力都比单独让人来看这个片子效果是要好的科技来看片子或用 AI 来看片子这件事情其实也很多年了
但是以前我感觉由于准确率比较低或者什么各种各样原因好像就是医院本身采纳的也不是太多我不知道现在的比如说整个在美国大概采用这种 AI 辅助看片子的这种比例大概是多少这个数字我不知道但是我只能感性的说一下现在大部分医院里面基本都在这也要看具体的疾病基本上都是都有
都是在用 AI 在进行辅助进行看片子所以他们现在的方式是说比如当我拍完片子之后自动的 AI 会有一个类似分类或者分诊的结果然后医生再到比如说门诊的时候他其实已经能拿到初步分析结果了还是说医生在这个过程中他要做我看片子的时候我再用通过放到系统里面再去扫描重新来辅助来看这件事情说白了是一个统一标准行为还是医生的自愿执行行为
这个就要看具体的每个医院有没有采用这个 AI 的系统然后这里我想要稍微的强调一下就是我们做这种 AI 我们从来都不是说去用这些 AI 系统去把这个医生整个给取代掉就之前的这些环节或者流程里面有医生有人的那些部分还是有只不过我们可能用 AI 辅助的手段让他这个流程能够加快就比如说我
就以前面说的那个乳腺癌的例子那现在医院里面现在美国这边有一个新的技术叫 DBTDBT 就是一个可以理解为一个伪 3D 的乳腺的拍片的技术之前的大家做的这种木板的筛查的都是 2D 的所谓的 2D 就是说
把一个乳房的组织从某一个角度拍一张片子那这张片子一个问题就是说因为人的组织它是一个 3D 的嘛它会有一些 3D 的空间上的一些结构当你把它压成一个 2D 的图像之后它会有一些组织的重叠这样如果这个乳腺的组织里面有一个肿瘤的话或者一个肿块的话可能就因为重叠的原因它就看不清楚了
看不到了也有可能就比如说它本来是没有种块的但是因为这种图像上面组织的这种重叠看起来像一个种块所以这都是有可能的所以比如说如果是一个 3D 的伪 3D 的这种 DBT 的片子的话一个片子可能会有 40 到 70 层甚至更多这是一个片子
然后一次 DBT 的筛查可能就有 4 张片子 4 张片子然后如果每一张就算就算 50 个那个 2D 图像的话就大概有 200 多张这个 2D 的图像所以医生如果要看 DBT 的片子的话他一次是要看将近 200 多张的这个 2D 的图像的所以这个是非常耗时间的然后人看这个片子他眼睛是会累的大脑也会累的所以这个是非常耗时间的所以我们现在就我参与这个工作就是我们来开发一个
AI 的系统然后我们自动的把这个 DBT 这个肿瘤上面的图像上面的这个肿块给标注出来标出来我们并没有说把医生整个都去掉我们只是说我们给医生一个提醒告诉医生这个 DBT 片子里面哪一层某一个地方可能会有肿块然后你来看一下这我们大概是做就是做一个辅助的一个工具并不是去取代医生
因为刚才你也谈到就是在医疗诊疗领域可能谁拿到更多的数据可能你们能做出相对准确的模型如果要用这种方式来推断的话这件事情不是由更大的公司或者是掌握数据更多的公司或者我们讲更好的这种国家的科研机构他们去来做那岂不是比一个创业公司可能会更便捷那小的创业公司它的生存价值又在哪了
我觉得小的创业就是我完全同意首先这个完全同意这也是我为什么我当时毕业之后第一个工作我是毫不有意的去医院因为我就是这么想的因为我觉得医院里面又有数据又有问题
就应该去去这样的地方然后如果你能做出一个解决方案的话你直接就部署在医院里就可以用了对我我当然想的比较的拿衣服对那我觉得创业公司的话有有自己的这个切入点就是首先创业公司可能会有一些独特的一些技术就是可能可能某一些技术比如说嗯
一些医院医院可能没有这些专业方面的一些技术技术人才或者技术大厂有可能他们就比如说像像 Google 啊 Meta 它的主营业务它也不是不是做医疗啊它主要是做广告啊做搜索做这些所以它可能有技术但它可能不是很 care 这些也有可能所以我觉得就创业公司如果有技术然后有这个具体的一些场景
我觉得是有机会的但是确实是就是说创业公司如果真的想做 2B 的这些医疗场景的话这个数据确实是一个很大的问题确实弄这个数据确实很难的所以为什么
早期的做医疗图像的很多公司都是去做肺结节为什么是因为当年在一个很重要的一个平台应该是叫 Kago 它是一个 motion learning 的一个比赛一个比赛平台然后 Kago 上面当时公开了一批这个肺结节的医疗图像的数据所以很多创业公司当时就是拿这个呃
这个这个公开的肺结节的这个数据做一些 demo 啊可能再拿去融资慢慢慢慢才做大的所以你看到很多早期的医疗图像公司都是做肺结节的就是这个原因嗯这也从侧面说明就是对于创业公司来说这种医疗数据啊确实是是很难的那可能就是比如创业公司可能会选择跟某一些医院或者是这种啊
这种在美国这边有一些这种类似于诊所一样的一些机构也可以合作然后可能拿到一些一些关于一些病人的一些数据啊然后在这基础之上再开发出一些 AI 的产品这些都是有可能的
那现在其实 AI 本身你看我们用大圆模型其实本身有幻觉的问题然后有不准确的问题其实现在我们看到其实还有很多数据污染的问题那这个我觉得这些问题如果放在医疗领域就是一个比较严重的问题因为这个不像我们写文章可能多点字少点字语气表达强一点弱一点可能差别不大但我不知道就是说大模型或者现在的这些呃
AI 的这些技术用在比如医疗这么对于精确度要求高数据度要求高的这样的一个领域那和我们普通或者我们传统现在理解这种代言模型的应用有什么区别呢
我觉得这个是非常危险的一个事情我们在医疗领域里面开发这种 AI 的产品我们强调的就是一定不能有这种幻觉那这个解决方案可能就是从两个角度去解决吧一个就从技术上面去解决一个就是从人或者是从这个流程上的角度去解决那我可以举一个
举一个医疗图像上的例子大鱼模型可能我现在没有一些具体的例子我就举一个我早期的医疗图像上的例子我们早期在做核磁共振成像核磁共振成像它有这样的一个问题核磁共振像它没有辐射就不像 CT 它其实是有那种放射性的其实是对人体是不太好的核磁共振它是没有辐射的所以它是非常好但它有一个问题就是它的采集
图像的速度比较慢这是因为它的这种成像的物理成像的原理所决定的所以这样的话我们就要做一个加速所谓的加速可以简单理解为就是说如果你把数据理解为 100%的话我们可以只采集 10%的数据然后用 AI 的方法去把 90%的数据给恢复出来
那这里就会涉及到一个问题就是说在这个恢复的过程当中有可能这个 AI 会在一些图像当中添加一些不该有的东西这个如果是用现在这种生成模型因为大圆模型它就是一个生成模型就类似的如果你在同向领域里面用生成模型去做的话它生成的图像会非常的逼真就它看起来真的就非常像一个核磁波阵的图像但是它跟这种
真正的百分之百采集的数据比起来的话它就会添加一些东西所以我们就会从技术上面去尽量的保证它恢复出来的图像跟原始的数据是百分之百一致的所以我们会加一些所谓的 data consistent 的方法就是数据一致性的方法从技术上去解决这些问题不能百分之百的解决因为如果是一个 generation model 的话它
或者或少会产生这样的一些幻觉所以我们尽大可能尽最大的可能把它这种幻觉给降到最低所以我所以这就到第二个解决方案就是说我我个人的观点是在医疗领域里面使用这种 AI 的 solutionAI 的解决方案的话一定是不能把人给排除掉的我觉得 AI
只是一个辅助他不能替代人所以很多的时候还是需要人类的医生或者人类的专家去做最后的把关去做最后的审查这个 AI 的结果到底是否靠谱对这就跟现在做自动驾驶一样人的手还是必须得放在方向盘上面所以我觉得这一点在医疗领域我觉得
是非常关键的还不能做到百分之百的完全让 AI 来进行一些诊断这些我觉得也是比较危险的
那在比如在诊断过程中你也谈到就是说 AI 要结合人的那这个人的专业性或者他的能力就变得很重要了因为你看我们其实各行领域都碰到这个问题就是说那很多的医生我们是从这个初级的医生然后经过多年的实习一点点拿自己的经验去摸索的然后最后变成一个比较有资历的或者比较有经验的这样的医生那我现在我 AI 帮你辅助做完了那我人可以判断那我对于一些你比如我新医生来
我刚刚上岗的医生可能他现在能力逐步的我不知道现在怎么样也许他可能还不如一个 AI 初步判断的准确那这个过程中那人怎么能够去辅助 AI 去做判断呢这个也是我们其他很多领域会遇到的问题就是我们比如一个刚毕业的学生他刚进入工作岗位其实甚至 AI 现在产生的东西可能要比他还专业的多我不知道在医疗有没有这个问题啊
有的这个也是很常见的但我这里想指出来一个可能的点就是说很多时候医生就比如我还是拿我做的乳腺癌的例子来举例很多医生并不是说你给他一个肿块让他确定一下是不是这个事情他能做如果肿块拿出来之后让他看他是但难点就难点在如果这个图特别多的时候他有可能会找不到他有可能肿块就埋在一个什么很
很多图里面然后那个图又可能那个地方对比度不是特别强那有经验的医生他会有一套自己的方法怎么去看这个片子然后通过对比比如说左右乳房对比然后不同的视角进行对比他有可能就可以把这样不容易看到的一些种块特别小的种块给
给找出来但这种年轻的医生可能资历比较浅的医生他可能就找不出来但找不出来不代表他你把他给圈出来之后告诉他之后不代表他不能去确认就有些医生可能他比较年轻的医生你给告诉他之后他还是能确认的啊这可能是一个种化对然后在医院里面有一些医院至少我知道的就是说这种年轻的医生他其实是会有一些就是高年资医生会做最后的审查的所以所以
所以我觉得就是说 AI 能够加速然后他自己就年轻的医生应该也能从这种 AI 的技术当中应该他自己也能够学习到很多的东西然后我觉得都是一个相辅相成的一个过程
我不知道现在因为这两年或者今年 AI agent 的能力越来越强我不知道因为刚才我们就讲的是单一能力我不知道说有没有可能在诊断过程中比如说现在的 AI agent 我能够去辅助比如我去同时查一些医学材料然后我又去上网或者用其他辅助工具然后来共同加强我不知道在 AI agent 这块对于诊疗的现在有没有一些最新的进展
我觉得你这是一个非常好的一个想法然后我们现在也正在做但我整体的一个感受就是还是比较的初级比较初级的原因是因为我觉得现在 AI Agent 的最大的问题就是它不是特别的稳定
就是我可以做一个 agent 他可以在某些场景下比如说你刚才说的那些他能够能够解决一些问题但问题是我跑 100 遍跑 1000 遍甚至更多遍的时候他经常会出错就中间的某一个环节就出错了因为他这个 agent 他是一个 generative model 他有一定的这个随机性在里面
所以他每次回答的时候这个答案不一样,那不一样的话只要整体的答案是对的倒没问题但问题就是他会不太稳定就会莫名其妙的会在我看来就会莫名其妙的不该出错的地方会出一些错但是在医疗领域就是在其他的领域比如说我不知道什么其他领域就是客服啊什么的可能出一些小的纰漏没有太大的问题但是在医疗场景里面我们就要求的就是一个稳定
可能跑 100 次甚至都要求 100 次不能出任何的问题因为这只要出错一次问题可能就是会造成一些很严重的后果但这个核心问题还是在于说你的用的基座模型本身的推理能力或者在专业的医学推理能力它不能够很好的被执行是这个差距这个能力
一方面是他的这种专业能力不够一方面我觉得现在模型 follow instruction 就是遵从指令的能力还是有一点点的问题就不是那种百分之百的能够我给他一个指令他可能头一两次都遵从的很好但是真的就是你大规模的把它部署到产品里面开始每天都有人开始用的时候
就会就会就会偶尔的就会出那么一两次错对所以我们啊就就在想办法怎么让这个模型的这种啊稳定性能够更好然后你们现在可能这样看起来哪个会更好一点目前的效果啊我觉得就是啊我觉得就是现在是百花齐放就是嗯
都还都还不错但是真正用到医疗领域还是就是还是得自己自己去 fine tune 一些具体场景的稍微 fine tune 一下具体场景的一些一些呃大员某些比如说前面举举个一个例子我们当时 gpt4o 出来之后我们试了一下就发现嗯能解决一些问题但不是达不到我们真正在产品里面用的那种程度对嗯就是说现在的这种
比如说你像 Cloud, Gemini,GPT 现在都还都还可以你这些基本的生活常识类的一些医疗问题比如说发热或者哪里出了一些什么问题问他一下还可以但真正要是非常专业的一些问题他还是会出错对所以我们会现在用的比较多的就是千问就国内的千问模型因为它是开源的我们就会把千问模型
拿过来我们自己在自己的一些具体的数据或者问题上面我们会翻听一下嗯
所以现在你比如用于医疗来说你用这种所谓公有云的这种非开源的模型可能还是有一丁的困难所以现在这个领域大部分是利用这种开源模型自己翻特那就意味着说像国内像 DeepSeagate 或者前问这条路线或者这条技术发展路线因为大家经常在讲说大模型领域有开源必源之争的问题在这个领域来讲你目前看到的是
可能你们更适用于这种开源模型的不断的去使用是吧这个可能要看具体的这种使用场景对我们来说因为我们的模型都是要部署到医院去的然后如果是用这种掉 API 的这种云段的模型的话这种医院是不能接受的那相当于把医疗的数据就直接传给这种第三方了这种是不能接受的但是我知道就是 OpenAI 现在已经在跟很多
机构或者医院在合作将来有可能比如说有一些类似于监管一样的一些部组然后使得 open eye 的这些比如说 chat gpt 模型能够直接部署到医院里面这个是有可能的因为我看到好像有一些
有些新闻好像已经在报道就是欧盟也在努力的跟一些医疗机构在合作所以我觉得两方面都可能有但至少对于我们来说如果我们开发一个产品是用的比如说调的第三方的 API 的话然后再把它布置到医院去这个可能医院是不会同意的
但是从你的理解来讲它即使 OpenAI 去部署它也不是它的所谓现在我们所用的公用的这种机座模型应该也是对于行业领域翻通过的一些专用模型对或者是它对然后它部署的时候它存储什么的都是隔开的因为在美国这边对医疗数据监管的挺严的不可能这种第三方的数据直接传到数据就直接传到第三方 OpenAI 这种服务器上面
医疗诊断这块您看还有什么补充吗医疗诊断的话我觉得这一块其实很多我们我因为我主要是做医疗图像的我只解释了医疗图像的这一块东西其实还有很多比如说现在像我之前做的那种金组的那些现在有很多医疗诊断很大一块就是对用 AI 用的这种
genomic 这一块 genomic 因为我现在没有太做了所以我不太不太知道现在做 genomic 现在现在是一个什么情况但我知道就是说比如现在癌症的这一块诊断治疗或者诊断他制定这个治疗方案的时候需要知道这个病人他具体的这个癌细胞他的突变是什么
那这个就必须要去做测序知道这个病人的啊他的一些精组的信息那在分析这些精组信息的时候因为因为他有的时候这精组数据特别多他也需要用到这种啊 AI 的 AI 的技术然后包括嗯
就稍微扯远点包括制药的时候你就找一些一些一些靶点那这些靶点嗯设计也需要结合这个人类基因组它的整体的一些信息比如说这些某些突变可能跟某一些疾病相关可能跟可以变成某些药物的这些靶点那这个可能都会有一些呃的技术的使用那我因为呃
这几年因为没有做这一块所以我不是很熟悉但我知道这个是可以在这一块有很多的应用的可能还有就是医疗这块特别多就是用的特别多就比如像我们当年做产前诊断现在抽血抽完血之后有各种各样的一些数据但是一个人的比如说去体检体检的话你可能
某一些单向指标看起来还可以但是因为他这个人的这种整个身体状态他是一个很复杂的系统所以你单从一两个指标可能看不出来这个人有什么问题他是一个整体的可能是多项指标一起能够判断出来或者预测出来这个人可能会有一些什么样的疾病那这一块我知道有很多的这种 AI 的 Machinery Model 也可以派上用场
它不是一个单一的 feature 这样听下来就是在医疗的整个各个领域其实各种技术各种演进方向各种配合治疗都比较多我不知道就是说因为现在很多也处于研究阶段我不知道像在美国像这种医院他们这种买单的情况怎么样就是说我们最终要产生实际的价值那就是有人要为此付费我不知道还是说目前是说都属于一个观望科研阶段还是说
已经很多医院就是我愿意非常大的去投入到这块这可能也是医疗领域里面一个非常重要的一个问题就是我记得我当时在丹丹发布工作的时候有一个很多很重要的问题就是说当我们对病人进行就是基因组测序我们用了这种技术并且用了这种分析手段之后我们要 charge 这个病人钱这个保险公司有可能不 cover 就是保险公司有可能不报销
对所以就是确实是就是说很多时候用了一个 AI 的技术之后保险公司不给报销说不 cover 这种就是如果比如说医院或者是某些机构用了这个技术之后然后去 bill 就是去去 charge 去去收费的话可能保险公司不 cover 这完全靠病人 cover 这是还是蛮贵的所以所以这也是确实我观察到我看到的确实是有存在这种现象确实是存在这种现象作为这种导致现在 AI 技术在医疗领域里面应用比较
慢的一个原因之一吧就是你想如果你这个技术用在医院里面去没有人愿意为你付钱你想这么贵病人不愿意付保险公司也不愿意付的话啊
这个技术应用就普及普及开就可能会比较慢但我可能我不是百分之百的很清楚现在保险那块保险公司那块是怎么在发展但是我知道就是单单发本当时好像就在在好像在推进这些事情就是让这个保险公司愿意去为这些测序这些去去报销就是有一些
保险可以 cover 这些测序的部分这样当一个癌症病人来了之后他先对他进行全精组的这种测序直到他整体的这种突变的一些情况然后这部分费用可以由保险公司来负担这样病人就不用去承担然后有了这些基因突变的一些情况之后再对人下药因为很多
这个癌症药物其实是只能针对某一类突变才能起效果的如果这个病人没有类类突变的话那这个药物可能就不是疗效都不那么好所以这就需要知道这个病人整体的这个基因组的这种突变的一些情况就这个问题呢就跟我们这个栏目叫这个科技慢慢拍啊其实我们也在很多的层面也在讲其实呃
我在想就算说哈萨比斯他谈着我们技术上能够解决这个问题但我们想从整个社会的应用来讲应该也没有那么快你看从医疗就是一个比较复杂的问题对吧这项技术首先医生认不认可而一个医院认不认可病人认不认可
然后保险公司能不能接受对吧甚至我们的医疗的监管机构能不能认可它其实都是我认为是一个循序渐进的一个过程就跟你刚才谈到说这个个体是整个在一个生态环境中存在的它并不是一个某项技术或者怎么样它突变就能完成整个社会的一个进步的它需要一个很长的摸索的时间这个也是我们想表达的观点吧
对你刚才提到监管我也想查一句就是说在美国不光是一个 AI 的技术还是一个具体的 scanner 扫描仪这个要往医院里面部署要开始使用都是要经过 FDA 的在国内应该是叫 NMPA 就是之前叫 CFDA 后来改名了叫 NMPA 都是要经过这种监管机构的批准的然后很多的这种药物 AI 软件啊
都是要经过临床实验的像我最近就参与了一个临床实验就是我们开发的这个 AI 的这个产品在国内进行临床实验周期是非常长的可能从准备到整个临床实验做完可能需要一年多将近两年的时间这个周期非常的长所以不是那么很快的一个 AI 技术比如说我们今天看见一个大圆模型怎么厉害什么的可能半年之后就在医院用起来了这个
这个不大可能可能是可能就比如医生自己做一些科研可能会用起来那真正大规模变成产品在医院里面开始服务于病人这个周期是非常长的所以这一 part 整个我们就谈的是关于诊疗这个方面的一些内容我觉得另外一个现在可能大家认为比较有突破的就是 AI 制药
前一段国内的什么各种药厂什么 AI 制药领域炒股的人大家知道可能股票又涨了一波我不知道在您了解的范畴内对于 AI 制药的领域的现在的目前的进展和突破有什么 AI 制药的话我本身不是做这一块的所以我不是特别的了解我的对 AI 制药的理解只是停留在当时
alpha fold123 出来之后我看了一下他们的那些 paper 然后呃就是 u Washington David Baker 是另外一个做这个蛋白质结构预测的实验室他们出了一系列的这个软件叫 rozzetta 也是一个蛮不错的一个软件然后他们现在已经把它做成了一个平台
我的认识仅限于这一些然后我的话知道的就是做这个药物设计的时候很重要的一块就是这个蛋白质的这个结构我当时本科的时候我们学校生物很强的一块就是生物物理生物物理做的就是解析这个蛋白质的结构为什么
大家对这个蛋白质的结构这么热衷或者是这么花时间花精力去解决这个蛋白质的结构就是因为蛋白质结构跟这个制药是息息相关的就是相当于蛋白质它就是人人体内它起作用的一个最基本的一个单位就是人的这种各种各样的生理活动基本上都是通过蛋白质来发挥作用的
就是 DNA 转成 RNA,RNA 转成蛋白质然后最后起作用的就是这个蛋白质所以如果想治疗一些疾病的话那最重要的可能要改变这个生理这个过程的一些把点就就在这个蛋白质上面所以蛋白质的这个结构是非常重要的所以为什么说
最近年大家都对这个 AI 需要特别感兴趣就是因为 AlphaFold 至少在我看来就是因为 AlphaFold 的 Rezeta 这一类的工具的出现让大家看到了这种 AI 能够很好的去预测这个蛋白质的这个结构所以包括 DMI 自己也孵化了一个应该是一个公司吧叫什么 SO 什么
我忘了就是可能忘了去点名字他自己底下也孵化了一公司专门就是做蛋白质结构的所以可能就让这个领域内或者是一些创业者看到的机会所以很多人就沿着这个思路再往下做我可能因为我对这个领域不是特别了解有可能还有一些其他的方向我不知道可能只要还有一些还有一些什么其他的一些可能的方向但我相信可能
不仅仅局限于蛋白质的结构的这种预测可能还有许多其他的一些方面
但是这些药就是即使就像跟我们谈的问题其实即使它有效果它可能经这个一期临床几期临床最后最后去实验它这个最后推向市场的周期也是比较慢的就是可能据你所知就是目前现在即使 AI 我们已经能做出可能现在也没有达到这个上市的这个能力呢应该讲对所以现在你说这个就提醒我了就是说现在很多 AI 嗯
我刚才讲的是说你可以把想象成这个药物研发它其实有一个非常长的一个流程早期可能你需要找一些把点设计这个药物然后把这个药物合成然后开始临床实验临床实验完了之后再开始 FDA 我说美国比如 FDA 申请这就是整个一条流程 AI 可以在每个流程里面都可以应用
我就举一个可能大家没有意识到的一个问题就是比如说 FDA 的申请就最近其实 FDA 自己出了几个官方的新闻就是 FDA 它已经内部 FDA 自己内部开始用 AI 做 scientific review 所谓 scientific review 就是说
比如像这种药厂或者是其他的一些机构提交了一些新药的一些资料想申请 FDA 的一些批准这里面就有很多的这种 paperwork 就是各种各样的资料之前就是人工去读现在 FDA 自己内部就开始用完全用 AI
开始做这种 scientific review 就去阅读这些 paper 做一些资料的一些对比就比如说这个药临床实验上面它这个效果跟之前的某些药比起来它是好了还是差了大概就做这种事情就 AI 开始辅助所以我能想到的就是说那现在既然这种监管机构 FDA 都开始用 AI 进行 scientific review 了那这些提交的这些药厂提交的这些机构
那他们应该也我觉得他们应该或者已经早就开始用 AI 开始准备这些材料了也就是我们刚才说的在制药这个环节里面 FDA 申请这一块 AI 就可以极大的缩短它的流程比如说之前可能需要几个月现在可能用 AI 辅助可能几天材料的准备提交已经审批就可能把它就完成了那这样的话整个药物研发中的
这个很重要的一这个环节就可能极大的把他时间给压缩所以从整个流程来看的话从这至少这一块嗯要研发就可以提速了呃那那我不知道您现在对就是国内的就是不管是药啊或者诊疗有没有这个进展情况有没有了解啊就是因为中国呢以前的科技技术发展更多的是说呃这个
这个就是拿到一些技术然后我们去快速的复制然后去推广去应用这个效果很好但是你看大模型其实大家经历了这样的一个过程最早可能也是用国外的模型但很快大模型的这个能力就上来了我不知道像在医疗领域我不知道您这个同意有没有交流就是目前现在国内的这个水平是一个比离美国还差一段还是说已经齐平还是在某些领域已经超过美国了
我整体的感觉我觉得就是说中国跟美国的 AI 发展各有特点首先我觉得就是说中国人非常聪明我自己也是中国人然后包括美国的很多这种所谓的大厂里面什么 OpenAIMata 里面其实很多都是中国人的主力都是在贡献对
美国的特点我觉得可能就是像很多人网上也说就是他对这种 0 到 1 的这种创新确实是要比中国要稍微多一点我不能说中国没有确实是要多一点我觉得整体是可能我的一个感觉就是说美国的整体的这个环境他比较鼓励这种 0 到 1 的创新然后嗯我觉得就是说鼓励一个人做 0 到 1 的创新其实有很多的这种嗯
条件在这个地方第一就是说首先就是说这个环境不能是那种太公立的导向如果太公立的导向的话很可能就就就这个人他就没有这种这种良好的环境去做这种 0 到 1 的创新所以我觉得美国的话至少在我待过的地方整体对这种 0 到 1 的创新是相对来说比较比较鼓励的不是那么的公立对
国内的话因为我没有在国内待过我觉得国内的话比如像 DeepSeek 这种我觉得还是有很多的领导渔的创新的不能说完全没有我觉得还是有很多的
0 到 1 的创新的所以我觉得国内的现在这种 AI 技术的发展慢慢慢慢已经开始在赶超美国了然后那国内的这种 1 到 100 的这种创新就不用说了我觉得国内是做得非常好的非常快的就是它能很快的把一个新技术变成一个可以落地的一个产品我觉得美国这块相对来说是比较的慢一点或者比较差一点的中国的话可能
有人才有各种资源的优势所以能集中一个技术一旦出来了能很快的把它落地做成一个产品我觉得国内这块是做的非常的棒的对所以我觉得我觉得没有好和不好大家各司其职
做自己擅长的事情然后但是我是希望以后就是就是两方能合作吧就因为现在这国际环境不好就是把这种割裂开来因为我是从可能大部分还是在学术里面所以我觉得学术圈子里面是交流还是挺多的对但是他现在就因为大国际环境就是这个样子然后导致这种其实学术交流也受到了一些影响比如说像美国的签证很多中国的学者要过来就很麻烦
对所以所以我还是希望就是两方面大家都互相合作发挥自己擅长的东西因为就因为 eventually 最终对大家有帮助的还是最后那个产品吧就一个 AI 产品比如说在医疗领域如果有一个特别特别好的药那美国人也可以用中国人也可以用对所以我觉得嗯嗯我觉得就是 eventually 还是对人类是有好处的就说的大一点的话对人类有好处的这种这种斗争呀这种其实
没有太多必要在我看来从这种学术权的发展来看的话因为我是理解比如说对于医疗的这种专业领域的数据非常重要其实国内我觉得因为我们很多都是公立医院其实这一点我觉得就是中国的这种举国体制或者这种集中力量办大事的这种我觉得效能我不知道在这个领域会不会
会更明显一点就是在某项技术比如说我们已经能够突破情况下我们接下来是需要把数据整合起来对吧这件事情我相信在美国会比较难办因为都是私立医院大家各自持数据但是中国可能在这个角度可能会更容易一点我是这么思考的我觉得你这个角度是的这个我觉得是非常的好而且还有一点就是说整体来说
国内的这种医疗数据其实要比美国要更丰富一些就美国他这个看病的话我从一个病人的角度来说的话是很慢的要预约啊然后整个流程走下来其慢无比我觉得国内看病的话相对来说就比较的快一些所以所以国内的医疗数据也会多一些然后现在国内我知道
我知道很早的时候不知道很早可能十年以前国内很多医院都没有信息化现在我觉得大部分医院应该都已经信息化了所以这种数据都可以存下来所以国内其实是有大量的这种医疗数据所存在的所以我觉得国内医疗这块应该 AI 医疗这块应该还有很多可以做的很多东西
这是制药的方面我们最后就是畅想一下就是说我们也不用管哈萨比斯他讲了什么就是说我们通过我们对疾病的预防诊断然后诊疗以及药物可能我们人类的寿命可能就会增长或者从你的必要或者是一个估算来讲我们可能会人类的寿命会达到多少或者在什么时间点可能就能完成这个目标然后那个时候的社会可能
会是一个什么样的一个状况啊
OK 我觉得这是一个蛮有意思的问题就是我我是对技术发展我还是相对很乐观的我相信虽然没有达到那个哈萨比斯顿说的那种程度消除所有疾病但我相信也在医药领域里面能极大的就是促进医药医药领域的发展这个间接的或者直接的后果就是能够帮助人的这个寿命的延长这个我是完全完全相信的具体寿命能到多少这个我就
我就不好说了但是但是我又想回到我前面说的就是说他这里面其实是有一个自然规律的就比如说像前面讲到的那种人的衰老的过程然后细胞的凋亡的过程他这个线粒体的那个端粒就是在慢慢减少的减少到一定的程度的时候这个细胞就会自然死亡所以我觉得
人的寿命会延长但我觉得不会就是很夸张的比如说到五六百岁啊这种我觉得就自然规律是人是没法没法去去 overcome 没法去嗯去去改变的可能顶多我觉得可能一百多岁我觉得这是我能估计估计到的人呢这个啊顶尖的这个这个寿命对人类社会的话因为我我觉得这个就是一个很有意思很大的一个一个一个话题呃我觉得人类社会可能
比如像我现在我就有时候会思考一下人生的意义可能已经到了中年了会想很多很多这样的一些问题我在想那如果人的这个生命更长了那会不会就不是中年了会不会比如说人到 100 岁就来了个 100 岁的这个这种这种思考就会到了一个新的一个卡点人就会思考啊我已经活到 100 岁了我这个生命的意义是什么我觉得可是不是嗯很多人就开始呃
开始思考这样的一些问题然后我还觉得比较有意思的我现在能想到的就是说比如说三代通膛那人都活到 100 多岁了会不会出现这种四代通膛五代通膛嗯就是这样的一些比较有意思的一些一些问题然后可能让我想到另外一个问题就是一楼马斯克的移民火星的问题
像我前面讲的这个呃一些生态系统如果他的这个种群密度太高的话他有可能就会比如说爆发一些传染病啊什么的那如果大家都能活到 100 多岁的话那这个人口密度我相信是会非常高的那这里就会
引发了一个问题就是可能是不是地球都已经没有人类生存的地方了那是不是这种移民火星就会这个需求就会变得越来越大就会加速间接的加速移民火星的这样的一些探索的进程对我能想到的这些我觉得还是蛮有意思的如果你把这个故事我想咱们就是去倒推你比如说人类的寿命一直在增长对不对那可能古代可能就是
已经活到五六十岁或者七八十岁已经就算很稀少了对不对如果那个时候的人去推测说现在的人能活到七八十对吧那个时候我想他们是怎么思考这个问题的那时候可能我觉得大家也在想说我们自己种的粮食是不是不够吃但是你看其实我们如果从现在来讲我们基本上你看中国这么大的人口集数其实
基本上这个粮食的问题基本上算是解决了对吧因为他其他的科技手段也在解决这方面的一个问题那未来我觉得就是说人的寿命多少可能我觉得更多的是说大家能够健康的活多久对吧现在也有很多人活得很久但是他并不健康所以就是我反正特别希望就是说我们通过今天聊的这些
不管是前期的疾病的这个这个发现对吧疾病的这个克服到诊断到药物然后其实还是让大家能够比较健康的去生存对吧你只有健康的生存大家才能够到处去思考问题如果那时候都年龄太大都阿尔摩斯莫证了他也大家也想不了什么别的只能凑合着活着啊所以这个这个我可能是觉得就是最后一个问题反正是一个相当于这个比较开放的问题吧嗯哦
我觉得可能就两个层面一个是生理层面一个是心理层面生理层面确实是确实是比如说阿兹海默的话其实很多这个生活质量不光他自己还有这种家庭其实生活质量是比较差的所以很多人对很多家庭来说是一个很沉重的一个负担在美国社会所以很多时候所以这个现在
包括政府的 funding 很多都是在支持这种阿兹海默的这种研究确实是这种就是假设说人能活到一百多岁但是可能比如一百多岁后面的二十年或者三十年都是处于一种这种痴呆的状态的话不光他自己还有他的家人这种生活质量都是很差的对这是生理层面的然后心理层面的我觉得也是有可能就是人物比如活得太长了他后面
心理健康也是非常重要的有可能比如说他寻找不到自己的人生的意义或者是这种我不知道会不会一百岁之后会出现一种新的某种程度上的这种 depression 等等这些我觉得这个也是很重要的
行谢谢陈博士不客气今天我觉得就是谈的内容比较多差不多两个小时了非常感谢占用你的时间然后也希望你的自己的播客的文章然后早日能够发表二一个谢谢 YouTube 的频道然后订阅越来越多好吧能够帮助大家解读更多的一些论文一些文章然后有机会然后回国我们再来交流好的
好的谢谢因为我也是虽然是在 AI 医疗领域这个从业了我觉得也不算很久吧然后然后因为我做的领域因为我觉得 AI 领域嗯包括医疗领域其实很大的很多东西可以做所以我觉得我的看法嗯也算比较浅然后也有一些偏偏面的地方所以嗯大家供大家参考然后也希望大家一起能够交流
那我们今天访谈就到这里好再见好拜拜拜拜他曾说过要陪你去远方说你是他最深爱的姑娘年少的他无能为力不能陪在你身旁荒唐以为你能忘记他的脸庞
你又何必念念不忘像紫禁流放愿有灵魂囚禁在人间荒凉不如让一切随风去吧就算多孤寡也好过装扑誓言的谎话她曾说过要陪你去远方
说你是她最深爱的姑娘年少的她不能为你不能陪在你身旁她以为你能忘记她的脸庞一年年不想自己流发任由灵魂囚禁在人间荒凉
不如让一切随风去吧就算多孤寡也好过撞破誓言的谎话不如让一切随风去吧就算多孤寡也好过撞破誓言的谎话