大家好,这里是海外独角兽,开源 AI 研究平台海外独角兽的同名声音栏目我们主张用开源的研究和讨论精神,链接全球 AI 从业者,行业瞬息万变我们在这里拉齐认知,抹平红沟欢迎来到新一期海外独角兽,我是主持人 Penny 随着语言模型在强化学习和 agentic 领域的进步 agent 正在从通用领域快速渗透到垂直领域
科学和生物医药这类高价值领域尤其受到关注。如果说,AlphaFold 在 Foundation Model 层面是生命科学的重要里程碑,我们认为 AI Scientist 在 Agent 层面能够给科研带来和 AlphaFold 同样重要的影响。随着 Multi-Agent 技术的发展,AI 可能不再只是工具箱,而是能自主完成跨学科复杂研究,从而推动科学发现走向全新的模式。
今年 5 月,前谷歌 CEO Eric Schmidt 投资的 AI Lab,Future House 推出了首批 4 款 AI Scientist Agent。一个月后,他们又宣布自己的 AI 系统 Robin 成功发现了新药,AI Scientist 已经在改写科研和药物开发的范式。本期节目我们邀请到了 Biomni 第一作者,斯坦福大学 CS 博士生黄科新。科新的学术背景兼顾了生物和计算机研究,
多篇论文发表在 Nature 系列期刊及顶级机器学习会议上最近科新作为核心贡献者设计的生物医学通用 AgentBioMni 正式上线 BioMni 搭建了一个适合 Agent 的环境通过整合不同的工具数据库专业软件让 Agent 能够自主完成生物科研任务提高科研效率在本期节目中科新结合自己的科研经历为我们分享了 AI scientists 的理念
为什么普通 agent 无法胜任科研任务以及 AI for science 领域正在发生的重要趋势 Hello hello 柯欣首先非常高兴你能来到海外多角兽的播客我们今天可以就 AI for science 还有 AI science 的这些方向好好跟大家聊一聊首先请柯欣先给大家做一些自我介绍吧
可以可以 感谢邀请我要黄科兴 现在是 PhD 第四年在 Stanford CSG 我导师是 Uri Laskovic 过去这七年吧 从本科大三开始就一直在做 AI 加生物医药方向的研究从生物医药方面各领域都有 cover 一些包括从药物研发 clinical notes 之类的都有做一些 research 然后 AI 方面的话 最近做的比较多就是 AI scientist 就用 AI agent 做 biomedical discovery
我本科在 NYUMaster 在 Harvard 非常厉害的履历我们其实有观察到克星你是同时在 AI 和 Biology 这两个方向都做一些研究同时在这两个方向做研究的话会有什么不一样的挑战以及不一样的收获吗对我觉得两个方向都非常不一样像我其实是从做 AI 加 Bio 方向然后甚至也会做一些纯 Bio 方向我可以从这三个方向都稍微说一说有些 AI 方向肯定更加像是那种 method driven research
这一般来说我们有一个相对 existent 的 benchmark 然后我们就是 beat 的 benchmark 所以相对 well defined and clean cut 生物医药方向的话可能应该像是一个 result 或者是一个 problem driven 的方向就大家可能不是很 care method 就比如说你看一些 bio 那些 journal 它其实自己刚开始的 after introduction 就是 result 然后 method 是在 online 的一个 section 所以他们其实该 care 的是 result 是什么是 result 的 impact 是什么
所以这个就来自于说我们应该要 identify what's the problemwhat to ask 关于 problem 的 taste 非常重要 AI+BIO 方向的话其实我觉得 method driven 和 result problem driven 都有人这样做 AI+BIO 现在也有很多 task benchmark 所以有很多朋友们他们也是 beat benchmark
当然因为 AI 加 BIO 也是相对新的领域所以有很多很多新的坑所以这也导致大家会发现很多新的 application 做很多新的问题然后去 create 一个新的 benchmark 新的 task 我个人比较做的比较多是偏 AI 加 BIO 方向我可能是更加偏向于去找到一个新的 BIO 的问题我们叫做 method zero research
相当于做那些分张都没有什么 baseline 就直接自己搞 baseline 自己去 define baseline 做这方面的 method zero research 的话就肯定影响就会相对比较大当然 challenge 会比较高因为其实你要 work with biologist 找到这个问题是一个 meaningful 然后也是一个 machine learning 方面也是非常有意思的一个这样的问题所以我个人的话更加偏向于就解决一些 biological 的 real problems 因为我不会是为了一个 AI 问题然后去专门 develop method
所以我一般 AI 方向的 paper 其实更像是有个 biological 的 problem 然后我们用了一些 off-the-shelf method 以后都发现不 work 我们得要 develop 一个新的 method 新的一个 ML model 然后又发现这个新的 ML model 在解决一个可能之前的 ML model 也没有解决问题然后这个问题可以 generalize 到除了 BioLibre 的领域然后这时候我们就会发一篇 AI 的文章比如说一些 conference 的文章这个是这样做 research 的角度
这里我其实想 follow up 一下你提到你更倾向于去做一些从 0 到 1 的工作它的 impact 也会更大这里能不能给大家稍微举一个例子说明一下比如说什么样的 biologist 的这种工作是属于这种从 0 到 1 的
对,我可以举个例子我博弈的时候做了一个工作叫做 GEARS 那个解枪解决的 task perturbation 就是药物研发里面一个比较 fundamental 的 task 就是说我想要知道疾病的 target 是什么就它的那个八点是什么那时候出了那个 CRISPR 以后大家可以用 CRISPR to knock out 一些基因然后看整个灶对它的 response 是什么这个是一个完全新的 task
我们张大宇和很多 biologist 聊发现这个问题非常重要然后也是一个非常 fundamental 的问题其实现在最近有一个很火的概念是 virtual cell 就是这个 virtual cell 想解决的其实就是这个 fundamentally 如果你能够 perturb anything 你都能预测这个 cell 的 outcome 是什么其实你就是有一个 virtual cell
当然这是一个 one way to argue this is virtual cell 因为也有很多其他方法所以这是一个例子就是说我们那时候差不多三四年前我们找到了新的一个 biology problem 然后我们去 design 一个新的 ML model 然后来解决这个 task 如果真的能做成 virtual cell 的话其实相当于就是把人体的细胞甚至器官都能完全模拟了这个听起来还是非常难的一个任务
对对对非常难而且非常复杂因为 retrocell 这个概念其实 1990 年就已经有这样一个起来每过 15 年都会有这样一波就 2010 年的时候还有那个 Marcus Kovar 他们搞一个 wholesale modeling 他们是搞那种 ode 这种系列就把几千条 equation 那种 ode 拿来 fit 一些 experimental data 然后最近因为 AI 这一波 foundation model 火起来以后大家一开始扯 retrocell 这个概念
因为的确就是 holy grail 嘛就是如果你真的有一个 computational model 你可以任何的 perturbation 进去你都能够精准的预测它的 outcome 是什么那其实首先你很多 experiment 都不用做了你就可以非常快速的去做 incytical experiment 可以快速的去试各种各样的 perturbation 然后看它结果是什么然后可以去找到哪个基因能够导致这个 outcome
如果这部车能达到的话那才是一个 fundamental 的一个 problem 被 solve 但是现实的话 research 角度上来说其实离这个还是非常远也有很多 issuedata model 都有各种各样的 issue
对既然提到文化社会你说它是一个生物医药领域里面的王冠或者说圣杯这个比喻还是挺恰当的因为按照我们 common sense 来理解真的想要完全去模拟一个人体或者说生物体这种非常非常复杂的组织和构造听起来是个几乎不可能实现的任务如果说真的 machine learning 或者 AI 能够去离这个目标稍微近一点的话就算最终它不能完全模拟大家理想中它离这个东西稍微近一点它最近能进到什么程度
对其实我感觉是有两种 approach 的 virtual sound 像你刚才说的如果我们把所有东西都各种各样的 intricate 那种 detail 都 model 我感觉那个是不太实际的因为生物的 multi scale 它太复杂了基本上不太可能把所有的细节都给 model 在一起然后另外一种的话是把 virtual sound 作为 black box 的一个 model 我们就说你只要它的 perturbation 进去是什么它的 outcome 如果能够精准的预测其实这个 black box modelimplicitly 它就是一个 virtual sound 这个的话还是比较 realistic
就是假设我们有大量的 data 各种各样的 input perturbation 各种各样的基因各种各样的 chemical 在各种各样的 cell context 它都能够精准的预测 transcriptional outcome 是什么我们就可以说这个 virtual cell modelimplicitly 肯定 capture 了一些有意思的一些 signalscapture 了一些基因关系或者是更加 high level 的更加 intricate 的这些关系这个的话可能是可以达到的因为这的确最近因为有一些新的 experimental techniques
我们可以大量的去做 Protibition 的实验然后可以大量的收集这个 Protibition 的实验然后在各种各样的 cell context 所以假设有这很大大量大量 data 以后其实是一个比较 natural 的一个 machine learning problem 它预测结果我们也知道了然后直接可以去预测然后直接去 fit 就可以但是现在唯一最大的 challenge 是 data 不够然后因为这个 data generation 非常的 slow
所以不是 model 不够好是 data 不够理解也就是说并不是真的把这个组织或者细胞给模拟出来更多的是观察它的 input 和 output 的数据之间的关系如果能符合人体的机理的话其实我们就认为这个模型是有效的其实这个背后的理念和 M 的 skin law 倒是挺像
确实就像柯欣说的每隔一段时间 AI for science 领域都会迎来一波关注我们最近其实也有感觉最近引发这个关注可能也是跟 IM 还有 RL 带来很多的技术进步有关所以不管是投资人还是 researcher 都可能觉得新一波语言模型和强化学习的技术进步可以从比较通用的领域扩散到垂直领域然后科学还有生命医药可能又是最高价值的垂直领域之一
但是我们也觉得 AI for science 这个话题特别大所以可能我们今天想先从 AI scientist 这个概念聊起这个可能跟大家熟悉的 AlphaFold 包括刚刚我们说的这种 Virtual Cell 底层模型还不太一样然后这个概念也跟科兴最近想做的事情比较相关对 这边我们就比较好奇想 follow up 问问科兴的就是你会怎么定义 AI scientist 这个概念和我们一般说的一个通用 agent 有什么相同
或者有什么不同的地方然后它和我们前面说的那些底层模型之间的关系又会是怎么样的呢通用的模型就比如说像 deep researchcomputer use 这种 agent 像 cursor 之类的然后 AI scientist 的话我感觉它本质上来说其实也是一个 agentic system 它的 application 它的 goal 是去 perform scientific research 对我感觉如果要知道 AI scientist 具体要做啥的话就可以简单地讲一般 scientist 一般 day to day 做什么就可能会更加理解这个 AI scientist 应该是要做什么
一般来说比如说 biologist 他们对不对刚开始你有一个 hypothesis 你有个假设我这个基因导致了比如说那个 phenotype 然后我想要去证明这东西也是对的我会去做各种各样的实验去做这个 wild experiment 去做 biinformatic analysis 去 search database 同大量这种 perform 各种各样的 action 然后来获得 environment 就是从一个 database 的 outcome 的 biinformatic analysis 的结果 wild experiment 的结果获得一个 feedback observation 然后 inform next step
就可能 next step 可以是那我觉得这个 hypothesis 可能有点不对那可能要 refine hypothesis 或者甚至就是 go to the next one 所以 scientific method 从 hypothesis 到 experimentobservation 这个 loop 我们想用 ai 去 automate 具体的话可能有两个层面吧第一个层面就是 automation 一些 day to day 的 task automation 然后第二层面的话更加像是 discovery 就是一个 fully autonomous 的一个 scientist
他可以自己去 come up with hypothesis 可以自己去做 experiment 然后从 environment 里面获得 observation 然后来 come up with the next hypothesisrefine hypothesis 然后自己来去做一个 discovery 我觉得这是两个层面但其实本质上来说他其实还是用 underlying llm 作为 intelligence layer 就是 intelligence 的 engine 用一些 tool use 去 perform 各种 garantic or scientific 的一些 tools 然后来获得一些 observation 然后来 inform the next step 本质上来说其实就是一个 identity
明白,正好最近看到一个例子,就是 Future House,算是 AI scientists 理念一个比较先行的倡导者他们最近发布了一系列不同功能的 agent,然后宣布 AI agent 能开发出新的药物,比如说 DAMD 药物这种能不能给大家解释一下,像 Future House 开发的这个系统具体做了些什么,是怎么做到这样药物发现的和你前面说的那两种系统的状态,现在的进展更接近于哪一种呢?
Pitchhouse 相当于 Focus Research Organization 他们做的这个片 research 过去两年一直在做 AI scientist 这个方向他们目前做的相当于有几个 individual 的一个 agent 相当于有三个是做 literature research 就是比如说找到一些相关的 paper 其实有点像那个 deep research
但是跟他骗那种 scientific 的 literature 那种 deep research agent 然后他还有一些 agent 去做一些什么 find contradiction in the literaturehas anyone done that before 就是这种 literature research 他们做了很多然后他们最近也有出了另外一个 agent 就是做 data analysis agent 相当于他们现在有这么几个 individual agent 有一些是做 literature research 有一些是做 data analysis
然后他们最近做了一个 system 就把他们各种各样的 agent 给串在一起把它串在一起以后他就可以做更加 high level 的一些 task 就比如说你刚才说的那个 damd 那个药物他们其实做了一个 task 就是 given 一个疾病我说我想要这个 damd 我想要 develop 一个新的药
他们就让这个 agent 去 perform end-to-end,就是 from identifying relevant papers 然后到做一些 analysis,然后最后 output 一个药然后他们做的更加其实有点像一个 jock repurposing 这样一个 task 就是把可能这个药本身之前就对另外的疾病有效然后他们给它 repurpose 到这个新的疾病里然后当然他们的 paper 里面还做了一些 very initial validation
然后他们可以 claim 这是一个 discovery 因为它还没有被完全 validated 大家应该知道就 validate 一个药是要做 clinical trial 之类的它更像是有一些 initial evidence 去 say this is a potential discovery 跟我刚刚说的那两个层面就一个 automation 还有一个 discovery 的话我感觉他们 individual agent 的话其实更像是那种 automation 的 goal
Robin 这个 multi agent system 等于像是做 discovery 这样子一个我觉得很有意思的一个点就是他这里所说的 discovery 一个新药可能听起来这个概念是非常的 fancy 的或者听起来好像已经超过了现在的人类或者说有点像是一个 AGI 甚至 ASI 了但实际上我不知道这个概念是不是稍微有一点包装的成分在里面就是实际上我们真的可以理解成他发现了一个新药吗
我看在 Science 里面有一个比较有趣的点是你可以 make any hypothesis,make any claims,the key is to show if it's validated.就我今天也可以说我发现了一个新的 discovery,这个疾病我发现了一个新的药,但是 it's not validated,所以它其实不能够 claim 是一个 real discovery,但我觉得他们肯定是有些 PR 的成分在里面,把它变成一个 real discovery 之类的。
这肯定是一个非常有意思的弹幕一个 use caseAI agent 可以从头到尾从一个疾病 output 的药但你说让它成为 claim 说是一个真的 discovery 我觉得也不见得是一个非常大的一个 deal 更加具体说因为 drug repurposing 这个 task 其实是一个过去的十二十年一直都有的这样子一个 task 我们之前不用 AI scientist model 就是更加 conventional 的一些 model 像 takes in drug 的一些 informationtakes in disease information 它也可以做一些预测然后可以去 repurpose 那个 drug
然后有大量 taper 也都 claim 说 I for this disease, AI model create 了一个新的 drug 但是因为这是 AI scientist 第一次 AI agent 去做所以大家会非常的 excited 前面科兴正好提到了他们 Futurehouse 的 agent 比较接近 OpenAI deep research 对于像 OpenAI deep researchManas 这样类型的通用 agent 他们为什么没有办法真的做好一个 AI scientist 这里面真的要去端到端完成的一个区别或者说最后一公里会是什么
其实我觉得像 deep research 它能做很多 scientific research task 就因为其实 science 里面有很多就比较偏 literature based 的一些 task 其实 deep research 应该能做的很好但是你说因为 science 里面还有各种其他的 task 比如做一些 analysis 做一些各种比如 wild experiment 之类的这个方面的话我其实觉得最大的可能在 last mile 是缺少一个 environment 就这个 environment 我觉得就是一个比如说 biology 里面一个特殊的
可能有很大量 specialized tool 有很大量 specialized database 还有 software 然后这些都是 agent 现在就 LM 现在还没有 access to 的然后这些 curate 这些东西其实是非常的耗时耗力因为生物里面这个东西太 scatter 了各种各样的 database 各种各样的 software 都非常多所以 curate 这个 environment 其实是一个非常大共存量的一个事情这是第一个缺失的一个方面
第二个确实方面我觉得就是一个 expert 的 know-how 因为其实生物里面有很多 knowledge 它都是一个就是那种 tested knowledge 它是一个脑子里的一些 knowledge 然后这些 knowledge 的话是口口相传 implicit 的 know-how 有非常多因为它没有在 anywhere documented on the internet 所以它很难让 pre-training corpus 就直接可以 capture 这个方面的 knowledge 所以我觉得这也是很大很大的一个 last mile 一个 challenge
就是如何把这些 expert know-how 给把它 codify 成让 agent 可以 access 的一个途径然后当然还有另外一方面的 challenge 就是因为如果要做 scientific discovery 那它有些额外的需求我们需要发非常的 rigoroushallucination 啊之类的肯定会解决还有一些的话就是可能更加 creativity 像我刚才说的 bio 的 research 一方面是要做这些 analysis 做这些 research 另一方面是 come up with theproblems 对吧就需要一些 creativity 真的去
innovate 一个新的 hypothesis 还有的话越来越多人也在解决的一个东西就是一个 long horizon 这样的一个东西因为我们要 perform 一个 scientific discovery 一般来说我们 human 的话要做几年的工作来 perform discovery 所以这个也可能是一个现在 agent 可能还没有做的比较好的这样子一个点
这里我其实想 follow up 一下如果通用的 deep research 其实做不了 biology 的发现然后这种专门去做的环境还有数据这些整合还有包括 innovation 都是 biologist 或者 AI scientist 的一个必要条件的话最终我们理想中我们希望 AI scientist 他交给人或者说交给 scientist 的一个结果一般是什么样子的 deliver 成果可能有两个 main category 第一 category 就是如果一个 human scientist
跟像是一个 copilot 的这种东西就是说我想要 run 这个 analysis 非常 well defined 有这么一个 data 我想要就是要 run 这个比如说 run 这个 single cell agent 就去 run 了 run 完以后一个 report 给他就是说我已经帮你 run 了这些是一个 step by step 的 log 然后这个是他的 output 这个 visualization 你可以直接放进 paper publication 里面这个肯定是一种最直接的 copilot mode 的一个 delivery 结果另外一个结果如果他真的做 discovery 他是一个 fully autonomous 的一个东西
其实就是人就坐在那边然后他花了比如说几天时间做各种各样的 tool use 各种各样的 reasoning 之后读了 maybe after 1000 steps 他一个新的 discovery 然后这个新的 discovery 可以 in the format of 可以是一个 hypothesis 有各种各样的 evidence 他 collected 这个直接 deliver 给 human 我觉得这也是一个非常有意思的一个 output
但我觉得这个可能现在还离比较远第一方面就是 copilot 这个模式可能是现在最 make sense 的然后大家也可以看到 immediately 可以看到一些有用的地方可以直接用来把那些 deliverable 可以直接拿来用这样的我们是不是可以理解成现在 copilot 模式情况下 AI scientists 给人的结果其实并没有超出人的能力范围内就是说他可能并不能提出一些真正我们所说的创新的假设
包括 future house 他提出的这个假设可能也完全是在人的范围之内只是他更多的做了一些自动化的工作对大部分的 task 其实是这样的其实是 automate 但的确也有一些 task 一旦有一些 intelligence layer 在里面我很看这个 task 的属性就是有些 task 它就是一个简单的 automation 就做完这个 step 以后做下个 step 做下个 step 然后就结束了比如说 run 一个 gwas analysis 你让他 run 十遍它其实就是一个 similar pipelines
但有些 task 它其实是需要很多 intelligence 在里面的然后这时候你把需要 intelligence 的 taskdelegate 给 agent 它可能会做得比人好我举个例子比如说像 rare disease diagnosis 我觉得这个 task 就是需要很多 tool use+ reasoning 就是合理的利用这个 tool 然后我觉得还有一方面也是看 user 是谁大部分的一个 user 他其实是一个 specialist 比如一个 phd student after five years 他其实就是在研究一个东西然后他们想要做另外的东西的话他们都是要找另外一个人合作专门做这个人
所以假设这时候有个 agent 他是一个 copilot 然后他其实能完全做的比这个人好但他不是比 overall the best person in the world 好这个也是一个层面在我们之前交流的过程当中科兴其实自己也一直在开发生物领域的 agent 比如说像 AI biologist 这样的概念那么最近其实主导开源了一个叫做 Biomni 的 Biomedical agent 可不可以给大家介绍一下这个项目具体是做什么的
这个 BioMedia Project 核心的观点就是想 build 一个 environment 让 AI agent 可以做大量的 research tasks 现在目前大部分的 Bio agent 其实就是我们叫它 specialist agent 他们给一个 task 我讲是 single cell analysis 那个 research group 就是去 curate 大量的相关的 tool 把自己移植的一些 know-how 把它 bake 到 specialist knowledgespecialist agent 里面
我们 Lab 之前做了 LabMate 做很多这方面工作就是说做 spatial agent 最近有个 collaborator 会做一个 target discovery agent 然后包括最刚开始 CRISPR GPT 就是做 CRISPR experiment design 的 specialist agent 但是我们后来也意识到一个问题就是说 biotask 有 infinite number of taskspredefined workflow 就肯定是不能够 iterate over everything 然后其次的话如何让他可以做那种 cross subfields of biomedicine 的一些东西
所以这也是 motivate 我们想做一个 general purpose 的一个 biometical agent highly flexible 他可以做大量的 task 然后他也可以去做在 subfields 里面交叉的一些 task 因为一般来说这样子我才是有更多的 insight 更多的 noveltyBiomini 的话其实就像 after 有这个目标以后我们就开始去 build 这个 environment
碰到第一个问题其实就是说这个世界上实在有太多的 specialized tool 和 database 和 software 所以我们就用了一个比较 systematic 的方法去找到这些 resource 怎么找到其实就是通过 literature 的 mining 就是我们从 bioarchive 里面找到差不多每个 subject 我们都找到 100 篇 paper 然后我们让另外一个 agent 我们叫做 action discovery agent 去
去 read through each chunk of paper to identify what is the tool, what is the database, what is the software that are very important for research result 我们做了这些 processing 后我们发现本中有大量的 tool, software 和 database 然后过去的一年我们有差不多 5 个 teammates 我们就有大量的 engineering 就是把这个 environment 给 build 好这个 environment 有差不多几百个 tool 然后几百个 software 和几十个 database 然后把它 build 好以后我们就想要用 develop 一个 generalist 的一个 AI agent
去利用好这个 email 们可以去完成各种各样的 task
我们做 generalist agent 其实就是一个非常简单的一个 code as action 因为我们那时候意识到就是 code 是一个非常 flexible 的一个方法首先可以同时用 database software 和一些 specialized tool 然后它可以去有一些更加 complex logic 它可以就 if-else 它可以做 for loop 等等它是个 general task solver 然后我们用这个 agent 以后我们就是做了大量的一些 validation 比如说我们和一个 vallab 他们的一个人去做了他们有个 task 关于 cloning design 然后我们这个 biomni 就帮他设计了一个 step by step 的一个 cloning protocols
然后他把它完成了然后他又做了一些试试验根据这个 protocol 然后发现这个试试验是成功的这个是 YLAB 方面然后我们 DryLab 方面比如说我们和 MicroSnyderLab 他们有大量的 wearable data 其实很多的这种 data 都是没有被用来做 analyze 的因为他们没有人可以来做这个东西然后我们把它做了以后就发现有一些 interesting hypothesis 然后发现同一个 task 让那个 bioinformatician 来做要花差不多三周让 agent 来做就要花差不多 30 分钟这可以发现非常大的一个 productivity pool
然后我们其实 paper 里面有更加多的 result 我这边就简单的提一下我们有了这个 project 以后我们也做了一个 platform 就想让所有的 scientist 就可以直接来用直接来他们有些 research task 他们直接可以来 request 这个 biome 去帮他们完成然后我们这个 platform 也是 for free to use
感谢可心感觉这是一个非常非常详细的介绍这里面其实涉及到挺多的点的比如说这里提到说它是一个环境还提到说可能有非常非常多的非常碎片化的工具还有 database 在生物学的领域里面
这里不知道能不能稍微给听众解释一下比如说生物这个领域里面它有什么比较特殊的一些工具还有 database 然后它最后做出来的这个环境可能跟大家一般熟悉的 chatbot 或者说 deep research 的环境有什么不一样
我们把它分成了三类一个是 specialized tool 一个是 database 还有一个 softwaresoftware 的话其实就是一些 popular bioinformatics 比如说 software 比如说像 scanpy 做 single cell analysis 因为其实你可以 create 无数多个 toolon scanpy 但是因为我们想让一个 general purpose 一个 generalist
所以我们其实是说 LOM 其实已经 on the internet 看到了大量的 examples on how to use these software 所以我们其实就只要告诉这个 LOMyou have access to the environment 这个 software 是已经装好了然后我们有差不多 100 多个这样子的一个 common bioinformatics software
然后这个是 software 然后的话 database 生物里面 database 是非常重要因为它其实是大量的生物的一些 raw data 它们都存在 some database 里面我们这边的话就把所有的 popular 的那些 database 事业都给放到里面就比如像 open target genetics 像 open targets 还有像 clinvaregulantdbnomad 等等等等这种 popular database 我们其实都用了一个 specialized 的 defined 了一个 tool 可以让他 access 这些 databasevery easily 然后其次还有就是 specialized tool
然后这些 specialize tool 的话我们把它定义成一些 L1 可能让他自己写 code 是写不太出来的那些 specialize tool 就比如说一些 know-how 比如说我们和一些生物实验的 lab 合作把他们那些 protocol 都给拿下来当然有一些 free parameters 我们让 agent 自己去 input 但是有一个 protocol 的一个 template
比如说像这种的话就是一个 specialized tool 然后还有一些 AI tools 就是一些比如说 alpha fold 像 divdoc 这种 model 我们也把它定义成一个 specialized tool 因为这种让 LM 自己写的话其实是挺麻烦的然后还有这安装 environment 之类的总共差不多有几百个这样子的各种各样的 tool 所以是大量的一个 engineering 的一个工程
对确实听起来是个很大的工作量那我们做成这个项目的话团队一共有多少人这个需不需要比如说各个实验室甚至整个开源社区一起来帮我们贡献然后把更多的工具和更多的 database 给整合
对我们第一个 version 我们现在相当于是有差不多五个核心的学生在做来自于各个 labs 比如 Michael Snyder Labs 和 Ark Institute 也有一起合作和 Ginantech 也一起合作对我感觉这个 part is 一个非常 collaborative 的一个项目因为的确 Cure 这个 environment 它肯定不是一个人能够完全做好的
其实这也是为什么我们想要 open source 因为我们叫它这个 environment 只是 the first version 只是把这个 template 给做完但其实还有更加大量的 tool 大量的 specialize 的 knowledge 还有 software 和 database 其实都没有被放到里面所以这也是为什么我们把我们也会 open source 然后我们会有非常简单的一个 contribution guideline 然后我们会 build 一个 slack community 如果我们都把这个 environment build 好了所有人都可以 build on thatbuild upon that 就要不是重新 recreate the world 很有意思前阵子非常受大家关注的 Manas General Agent 他们有一个
很经典的产品设计理念叫 Less Structure, More Intelligence 这里就是说可能很多的 Agent 或者说 AI 它要去怎么使用工具或者怎么行动其实更多的来自于底层模型的能力更少的来自于提前的设计但是听起来尤其是生物学这样一个非常专业的非常 vertical 的领域里面其实有非常大量的 know-how 所以我不知道科兴你们和团队在设计的
这个 agent 的时候也是更多的去交给模型底层来自己去使用各种工具的路径还是说因为它非常的 vertical 所以你们反而要前置的给它很多很多提前的设计呢
对我觉得这是一个非常好的问题其实我们那时候非常 inspired by 这个理念 like structure more intelligence 所以其实我们 BioMini 这个 project agent 其实就是一个没有任何 structure 没有任何 predefined workflow 就非常 reliant underlying IOM 去设计怎么样用这些 tool 怎么样利用这些 softwares 和这些 database 但是但的确
在实际的应用场景下我们发现其实这样子的一个 general purpose 的 agent 他能够做很多很多 task 它的广度非常大在一些 task 上可能 50% task 已经可以达到一个非常好的水平但的确在一些比较精和专业的一些 task 上面 general purpose agent 不少目前的 LM 来说是还没有到那个水平有些原因可能是 LM 还不够好但还有另外一个原因像我之前说的就有很多 expert know-how
然后这种情况下就需要把这些 knowledge 提前告诉老案比如说一个 human expert 做这个 task 的时候是怎样做的就 step one step two step three
然后让他直接根据这个 instruction 然后来做这个 task 所以其实 by omni 我们的下个 step 我们其实是想要也有一个 resource 的一个 category 就是有些 task 有些 specialized knowledge 有些人可以 contribute 他们是怎么做的让 agent 可以自动去 pick up 当有个新的 task 进来以后发现如果是用这个 task template 然后直接可以去 retrieve
之前 expert 是怎么样 approach the task 让 LRM 把它做的更好这个是一方面另外一方面是其实我们也在想能不能让它更加 intelligent 因为这个的话之前还是比较 manual 了你要 collect 各种各样的你要找 expert 你要 learn from them 另外一个方向其实最近就是用一个 reinforcement learning 让他自己去 LRM 自己去 automatically figure out 这个的话我们最近也来做一些 project
就是因为 BioMini 另外一个我们当初想 build 的这东西的原因也是因为有了一个 environment 以后其实你可以 now do somereinforcement learning task 如果这个 task 是 verifiable 的话你可以把那个 reward 给 define 好然后他就可以自己去 train 这个 ROMintelligently used tool 和 reason 然后来获得更好的 performance 然后我们最近在做一些 task 用这个 ROM 来做的确能看到 interesting 的 performance 但是因为我们是开源的模型上面做所以效果没有像 closed source 那个 model
我比较好奇你们实际做的过程当中感觉哪一些任务比较适合最强的通用模型哪一些其实需要你们专门去训练 fantune 小的模型这个你们会有怎么样的能力上的区分会把它划成几层呢我们 train RL agent 它包括我们 train RLM 不用拖的话因为我们 resource 有限嘛所以我们只能在一些比较小的模型上面来试就我们肯定能明显看到比那个小的模型效果会好很多
但是它比最强的那些通用模型 close source model 其实都还没有到那个水平所以目前来说我们 deployment 的 BioMini 包括我们 web platform 其实都是用通用模型是来做的当然这个主要是因为我们现在做的二维化方向还是在 explore 之后的可能是在一些是非常 well defined 然后这个 task 有非常 clean 的 reward 有很多很多 examples 很多 data points 这些 task 上面我们可以试着去专门训练一些小模型让它达到可能比最强的通用模型效果更加好的
这个 reward 的话题非常有意思因为我们之前一直在讨论只有 coding 和数学因为它可以用形式化语言去验证只有像这样的一些任务它有很明确的 reward 或者说 reward 更好设计科兴提到的有一些非常 well defined 的任务或者说 outcome 可以去做 reward 我不知道这里方不方便稍微举个例子说一下它有什么特别适合去做 RL 的任务生物里面的话我目前总结下来说是有两个 category 的 reward
有一个 category 是 task space 是一个 limited answer space 就比如说我们想要设计一个 screen 总共只有 2 万个基因然后我们想要 design 一个 screen 我想要找 50 个基因然后这个时候我们其实有些实验我们做了一些 genome wide 的 screen 其实把所有 2 万个基因的 outcome 我们其实都知道是什么然后这个时候的话可以其实让 LM 去 design 的 50 个基因
他不管 Designers 拿 50 个 G 我们其实都能够算出那个 reward 其实这是一种情况就是说他整个 answer space 这个 solution space 其实都是 map out 的这个是比较少见的 task 因为其实 QA 这种 task 也是非常耗时耗力的另外一种情况的话是其实也有在生物里面有些具体的 task 它是有一个比较 well defined 的一个 oracle 的
Oracle 可能是一个根本生理 model 比如说 alpha fold2 比如说 protein design 里面可能有个 task 是大家想要花很多很多精力以后去 design 一个 protein 让这个 protein 的 stability 很好然后这 stability 怎么去 measure 呢现在一个比较常用的就是用 alpha fold2 让它 run 一遍以后看它 uncertainty score 是怎么样 PLODT score 然后这的话其实就是一个 reward 你要看它可以直接去 optimize 所以也会有这种 Oracle specific for each task 因为 bio 里面 task 特别散所以它每个 task
都要具体看有没有一个 reboot 是 well defined 的但我个人的确我们现在做这个比例跑起来其实找到这个 task 也很难就是我们花了很长时间去 bringstorm 除了 auracal 模型之外 Alpha fold 以及 Evo 2 我们前面聊到的那种 virtual sale 模型未来和你正在开发的 agent 之间的关系会是怎么样的他们之间是会协同一起并行的往前进步吗
对我觉得他们其实是一个相对的关系就是说 AI scientist 可以用这些 alpha4 的这种 tool 来做一些 task 然后从 alpha4 的结果我们来可以做比如说应该要做用下个 tool 用什么什么然后来完成一个 overall 的一个 goal 用像 verticell model 像 alpha4 这些 biological 防征系统他们其实都是非常想解决具体的一个 step
然后 AI scientist 看来像是怎么样去把各种各样的这种 tool 各种各样的 step 给 orchestrate 在一起来完成一个更加 high level 的一个 goal 目前来说我觉得跟人家像是 AI scientist 会用这些 alpha fold 这种 tool 当然另外一个角度上来说 in the future 因为现在 AI scientist 还有真的做 AI research 的 scientist 他们其实也可以 maybe in the future 可以 come up with a new alpha fold 就像 Google 那个 alpha evolve that can 就是解决一些比如说 build a bio foundation model
那话他可能就有这种闭环了就是先 AI scientists 去设计这些新的 model 然后 AI scientists 可以同时用这个 model 然后去 make discovery 也会 push AI scientists 去 make new tools 那可能就会有个闭环对我感觉这可能是 in a very very far far away future
AI Science 领域的 Alpha Evolve 只是很有趣的话题,就是如果 AI Agent 可以设计自己用的 Tool 的话,那么科学上可以探索的空间就会更大。我不知道这个对于科兴来说,它是未来完全自主 AI Biologist 一定要实现的终极目标吗?
我觉得 AlphaEvolve 这肯定是一个非常 interesting 的 application 因为它其实跟现在 AI 上来做的 task 有点不太一样现在 AI 上来还是说去 automate 一些 task 去做一些 discoveryAlphaEvolve 跟它是 fundamentally change how to do a task basically 对所以我感觉这个还是一个 autogonal 的方向我觉得两个都是互相 benefit to each other 然后除了这个目标之外比如说我们的 agent 现在算是到了哪个阶段接下来往后进步车型还有什么期待 AI scientist agent
未来持续进步的一些方向和 milestone 有很多种的方向首先第一个 environment 现在我们这个 environment 是一个出版它能够的确能做大量 task 就相对于这个 LLM 来说
相当于之前的那种 gender purpose agent 来说但是他还是有各种各样的东西他其实是完全做不到的所以我感觉这是一个需要一个一个 community 的一个 effort 去 build 一个非常 high quality 的 environment 然后其次的话我觉得是有了这个 environment 以后如何达到那种 super intelligence 所以说他能够做的可能比人还好
然后这种情况下的话就可能需要一些 IL 你需要非常 well-defined verifiable task 然后来让这 ILM 自己 figure outhow to use this environment wellto come up with completely new discoveries 我觉得这可能也是非常 exciting 的 direction 可能还会有一个方向落地情况下来说可能他会有个 completely new capabilities 我们其实之前有一个工作就是说 Azure 的 automation ability 意味着他可以大量的 scale upBIO 里面很多问题它其实就是一个 search problem
所以之前的话因为人做不到 manually 去 search 各种各样的东西但 agent 他现在可以有人的这种 reasoning ability 然后他可以去大量 scale up 去做这些 search 这也就导致他可以有新的 capability 就比如说我们之前其实做了一个工作叫 popper 我们就把一堆 dataset 给 agent 几百个 file 几百个 database 然后就让 agent 像一个黄金矿工一样就直接去 mine data
然后它可以去大量产生各种各样的 hypothesis 我感觉这是一个新的 level of capability 就是一个之前的没有 agent 的话它是做不出来的这样子一种 capabilities 然后我觉得像这种 capability 可能还有很多我们其实没有想到然后我们其实是让 agent 就 fundamentally changethe scientific method in some sense 就在之前的 scientific method 其实都是 observation hypothesisexperiment 这样一 linear 的一个线性的但这个是一个比较 open 的一个方向我感觉只有提出来以后才会意识到
科兴这里其实提到一个很有意思的点,就是生物领域里面很多问题都是一个 search 的问题我不知道这个 search 怎么理解,它是不是分两层,一层就是我们传统意义上理解的 search 就是去比人能更多的去找更多的资料,然后更多的把不同学科之间的这些知识还有 database 串联在一起
然后另一层是说前面也提到就可能很多的结构或者说基因的序列它可能本身就是现实存在的但是人可能之前没有能力去在这么大的一个搜索空间里面去找到这些结果我不知道这么理解这个 search problem 对不对比如说柯基能不能再展开讲一下对因为生物里面很多比如说我有 2 万个基因我想要知道哪个基因是导致这个 disease 因为现在的话 restricted by human
所以他可能只能做 50 个基因顶多了因为他一个一个 manual 来看但是如果你像 agent 他可以 automate 他可以 scale up 他可以直接 2 万个基因全都给做了直接能够有另外一种 insight 之前的话我们就 manually 做这个 style 因为我们这个 resource is limited
现在的话因为它之前是个 search problem 所以现在它可以直接把它传输给 iterate 或者是如果要更加大的这个 search space 比如说一个 combinatorial 的基因就基因和基因这个 combination 这种话可能这个 agent 他可以自己去设计怎么样的基因 combination 是最 make sense 的然后去用他的 prior knowledge 然后去更加好的去 search 下一个 multi gene 是什么下一个 multi gene experiment 是什么
也就是说不做选择而是 AI 或者 agent 的以后有能力把所有的可能性都给便利一点对或者是更加 intelligent 的去 search 这个 space 明白
刚好说到数据,其实我们会有一个模糊的感觉除了 LM,就是语言这个模态之外其他的很多模态的数据都不是那么轻易能获得的因为语言模态的大部分数据都是在互联网上现存的其实去做数据的清洗和获取都比较容易其他的不管是多模态还是机器人还是生物领域的数据似乎获取起来的成本都比较高如果我们就看生物领域的话它的这个数据现在的获取成本是什么样的
并且就是说如果有很多数据它还是需要来自于实验的话 AI 怎么能够去帮助大家更好地去整合这些实验中不同模态非常大量然后多尺度的这些数据的确数据在生物里面肯定是一个最大的 bottom-up 其实很多时候就是说你有一个新的数据以后其实如果这个数据里面真的有 signal 其实是一个非常容易直接去可以 surface 那个 inside
然后最近其实有一些有意思的工作是让 AI agent 去 curate 这些数据就我们之前一个 previous labmate 他的那个 art institute 做了一个叫做 SA base camp 生物里面的数据有一方面是 private 还有一方面他就 scattered 他在 public 在整个所有的 on the internet 然后一个 agent 他可以自己去搜索自己去做 web searchcomputer use 然后他可以自己去 scrap 这种各样的 data 然后把它 curate 在一起
所以 data curation from agent 也是一个比较有意思的一个 perspective 当然另外一个导致上来说是有没有可能让 agent 自己去 generate 去 guide human on how to generate data 现在就是那种 fully automated lab 一个 AI agent 读了很多文章看了这些之前的实验结果他也可以告诉 robotics lab 我下一个我要做这些实验
然后这 robotics 来把实验结果告诉 agent 这样就是 fully automated loop 对我可以感觉 data generation overall 的话肯定有各种各样的途径去 scale up 当然还有另外一种 scale up 怎么去让 AI agent 自己去 fundamentallychange how theexperiment techniques are being done 因为其实现在很多实验数据为什么数量不够大是因为他的 experiment technology 还没有到那个地方比如像 genome sequencing 他从 20 年以前花一个 billion dollar 去 sequence 一个 gene
现在的话可能几百的奥特曼你就可以 sequence 一个技能在 20 年有非常多的这种 experiment technology 的变化这 experiment technology 其实就是一个 research 的结果其实就是一个 human reasoning 加各种各样的实验试错所以另外一条线可能 AI agent 也可以做这方面的事情可以去加速试实验的实验的设计本身实验的技术本身我觉得这也是一个 a way for AI agentto generate more data 的一个方式但这可能是一个更加远的一个方式因为它需要很多 creativity 它需要很多 innovation
这个很有意思,也就是说现在我们获取生物数据的成本其实是在显著下降的,而且这个下降的其中一个原因是我们其实是可以用 Resonate 去设计这个试试验,就是可能以前会有观念是把前期的这个干试验或者说设计这个和试试验分开,但实际上就是 AI 也可以去加速试试验通过 Resonate 的方式。
刚刚那个是一种方式其实现在实实验也有很多 dry 的部分比如说我要设计实验的 protocol 是什么然后这种 AI agent 现在也可以帮忙比较更加好的设计实验的 protocol
对刚刚克星跟我们介绍了 BioMini Agent System 设计的这个理念现在因为毕竟还是第一个 version 它的这个主要的使用者会是谁比如说它更倾向于去给像克星这样一些在大学里面的年轻的 researcher 去用还是说它最终可能有一个目的是让药企里面的成熟的真的去做 drug discovery 的这些 researcher 去使用
我觉得使用者的话是有很多 segments 那第一个 segment 肯定像是 academia 那些 researchersindividual scientist 这个的话他们可以帮他 automate 这种 day to day task 然后但因为很多其实这些 task 都是非常 general 的嘛所以他可以在药期里面也会碰到
在医院里面也会碰到在可能一些给药剂提供服务的那些外包公司是也可以用的我们可以跟他说是 task 哪些类型比如说 task 类型第一种的话就像 literature research 我想要知道比如说 variant 它具体会有哪些 mechanism 这种时候我们可以搜各种各样的 database 然后搜一些 web search 给你 curate 一个 report 这种是可以跟他说这种 deep research type 的这种 literature 第二种的话就是像比如说一些 data analysis
在学校里在药企等等他都会有碰到这个问题就是说我有个 data 我想要做一个 standardize 的一个 analysisgwas single cell 等等然后 agent 我们现在 agent 也都可以帮他完成第三个类的话就像我刚才说的 ylab 的 protocol design 然后这也是一个非常大的一个类型就是说对于试试验的那些科学家我们在做试试验之前我们其实是要产生一个 protocol 就一个 step by step 比如这个 step 要放温度多少下个 step 你要用什么 reagent
等等以后之前的话 Agent 可以帮他 design 一个 protocol 之前的话他可能要花很多时间去 design 的 protocol 然后他可以辅助 Wirelab scientist 去做这方面的 protocol design 然后最后的话可能还会有一些 clinical 方面的一些 application 就是他可以做一些 disease diagnosisclinical decision support 其实他是一个非常 general purpose 的 agent 车型这张聊到了很多实际在 bio pharma 当中可能能用起来的例子
之前其实你也在 Gene Tech, Pfizer 等等多家制药公司工作和合作过这些合作对你的研究和做 Biome 产生了哪些影响我个人是非常喜欢去这些 Domain 的这些公司里面真的去和他们深度的去合作和深度的去了解他们的需求是什么他们感兴趣的东西是什么我觉得对我产生的最直接的影响肯定就是让我更好的有对 Problem space 的 Truciation 就是说什么样的问题是值得去做的什么样的问题是他们是 care 的什么样的问题会有更加大的 impact
所以包括 Bio Omni 我们其实有很多的 use case 是发码比较 care 的 use case 比如说设计一些就 target discovery 甚至还有一些药物的一些性质预测就 adm ad property prediction 甚至还有一些 virtual screeningmolecular docking 等等等等我们其实我感觉都是因为我之前跟这些制药公司我们之前合作过这种 kind of project
然后把它放到 BioMe 的 key use case 这样子嗯柯欣章说到了很多种生物制药当中实际的任务我们最近一直在想的是生物领域其实缺乏像 ImageNetSweeBench 这样比较统一的标准之前姚胜宇也发出一篇文章嘛提到成人 agent 和 IO 的下半场 benchmark 非常重要如果让你来设计的 AI biology 的 benchmark 你会怎么去设计有哪些比较重要的核心指标或者任务
有各种各样途径去设计这个 benchmark 其实我们 by omni 我们 create 了一个新的 benchmark 就是我们 curate 了差不多 8 个新的 research task 然后这些都是有非常 well defined 的一个 expert curated 的 ground truth 他可以去 measure 一个 agent 的在一些 real world research task 的 performance 之前的话以后有一些 question answering 的这种 multiple choice research 的 benchmark 这个 agent 也没有这个 general knowledge 会不会能不能用一些 tools 之类的就不是那种 real research task 很像是一个 exam style 的那个 benchmark 我们最想要 evaluate 的肯定是
agent 在一些实际应实际的这个 vc 擦伤 performance 这个怎么去 cure 其实是非常广因为 bio 里面有特别多的 task 我们也 kind of impossible 就是把所有的 task 都 curate 好一个非常 well defined 的 benchmark 和 ground shoes 啊之类的所以可能有一种方式的我我之前最近也在想就有点像那个 chabot arena
也可以做一个 preference based 的一个 benchmark 有一些 well defined research task 然后让两个 agent 去 generate a report 或者是 some result 然后可以让一个 biologist 去 rate 哪个好哪个差当然这个肯定会有很多很多的问题但是我觉得这也是一个 one way to evaluate 这个 benchmark
我觉得 preference 的说法还挺有意思的这个 preference 就是比如说作为一个研究员他的 preference 因为 chat arena 的 preference 其实就是用户更喜欢哪个回答所以这个研究员更喜欢哪个回答其实可能也是基于他的一个科学的品位或者是他有的时候不一定是基于事实对吧的确其实有感觉这个东西真的要 curate 起来其实挺麻烦的它可以让它的 output 是一个非常 factual 的 output
比如说一个 task 是我想要 design 50 个基因给这个 screen 然后他就给我这 50 个基因然后让这个研究员自己去看是不是 make sense 的这个基因这样的话就可以去 element 一些 potential confounder 可能 report 的 language syntax 这种的确也还是非常看 user 他的品位是什么同样的 50 个基因两个 50 个基因的 list 不一样的 research 会有不一样的 taste
特别是像这种比较 open-ended 的 question 每个人也没有很好的 judge 就是说可能 human scientist 也不是一个很好的 judgejudge 这个 preference 是什么所以这是一个非常有意思的问题感觉现在也还没有一个 clear 的一个 answer
我们的听众有可能对生物领域还有包括生物领域的这些研究者从业者日常在做的事情都比较陌生比如说这些研究者不管是在药企还是在学术界大家每天可能 daily work 里面大部分花时间的一些非常占用他们时间的一些工作比如说大概有哪几大类然后我们有了 BioMini 之后这里面哪些工作能真的帮助他们去解放出来
对我觉得有那么几个类吧第一个类肯定是 Bioinformatics 的 Data Analysis 这个其实 Fundamentally 就是一个 coding 的问题然后现在 coding 的话这个 LM 非常非常强所以这肯定是第一方面有大量的时间和 cost 可以被解放
其实在药企里面或者在实验室里面一些大的生物实验室我们了解到其实 70% 80%的 data 其实就放在那边就是因为没有一个 bioinformatician 来帮他们做这个 analysis 所以其实如果有了这个 agent 以后他可以大量的去 analyze 很多新的数据然后再产生一些新的 discovery 我觉得这是一个最 immediate 的应用吧
第二的话其实就是像关于那个 Wirelab protocol design 这也是个非常大的一个类别因为之前你设计一个 Wirelab protocol 其实挺花时间之前跟一个 Wirelab scientist 聊他说他一半的时间其实花在在电脑里面去设计这个实验然后另外一半的时间是真的做这个实验如果把设计这个实验的这个步骤全都给 automated 掉也是非常 immediate 和 valuable 对我感觉这可能是两个最直接的方面嘛
这又确实非常有意思如果我们想再理解一下 BioNi 这个系统它是由一个 agent 还是多个 agent 组成每个 agent 都扮演什么样的角色这个能不能再给大家展开介绍一下对 BioNi 现在它实际上是一个 single agent 然后它可以是一个 generate purpose agent 它可以去做各种各样的 task 然后当然其实我们在设计的时候我们其实是设计了一些 subagent 就比如说我们有个 tool retrieval 一个 subagent 帮你去 retrieve 那个 relevant tool from the environment
然后还有一些 database 其实我们也是用了一些 subagent 去做 database query 但是我们整体的结构其实是一个 single agent 只不过把这些 subagent 都变成一个 tool 一样的形式来用然后的话我觉得 multi agentBioMini 是一个 foundation 它是一个 single agent 它可以做各种各样的 taskmulti agent 之后可以把各种各样的 BioMini 的 agent 可以 chain 在一起然后每个 BioMini 做各种各样的 task
然后这个情况就会成为一个 multi agent 去比如说做更加 high level 的那些 task 比如说我想要做像 fisherhouse 那个类型我想给我一个 disease 我要找到一个 drug 这个的话可能有 multiple agent 可能会做的比较好因为它是一个 complexity 比较高的一个 task 它需要做各种各样的 step 然后还有甚至我们之前有那个 popper 我们另外一个工作叫做 popper 就是说也是一个 multi agent existence 有一个 agent 去 propose hypothesis 另外一个 agent 去 validate hypothesis 然后两个 agent 可以都是 by omni 只不过是不一样的 assistant prompt
然后的话这个 multi agent 他可以自己去 iterativelyforsify hypothesis 然后 refine hypothesis 等等等等对所以我们目前的角度就是说 BioMini 是一个 foundationmulti agent 我们可以 build 各种各样的 agentic system 去达到如果想要做更加 high level 的那些 task
Bioinformatics 它和 Coding 任务比较接近然后正好过去的一年当中 AI Coding 和 AI for Science 就是最近发展特别快的两个方向那么我比较好奇的是车薪做 Agent 的过程当中会不会觉得 AI for Science 领域也会出现像 Cursor、Devon 这样未来的机会应该是必然会出现更加大的一个机会比如说像 Cursor 和 Devon 他们就是 Automate Coding 这个 ability 嘛
所以它是一个去 scale 一些 expertise 然后 asci 其實也是去 scale 一个 biomedical expertise 其他 domain 的其他 scientific 的 expertise
然后如果你看白阿发码甚至是简单的去给个 expertise 去 automate 这种样的 task 白阿发码的 R&D cost 可能是一个什么 300 billion dollar 的 market 然后里面有巨大的 low productivity 和 reparative task 白阿发码效率非常低因为研发一个 110 年 3 billion dollars 他们非常习惯这个 long horizon 有很多很多 arrow 的这样子一个场景
然后其实现在也有一个风向就是说大家想要把所有的 bio pharma 的 cost 都各种各样降低增加这个 productivity 所以这是一个非常大的 market 而且这个只是
去 automate 一些 task 第二层面就是做 discovery 的话那就给他另外一个大的 market 一个药如果做出来的话其实他可以 sell billions of billions of dollars 所以的话如果一个 AI agent 他真的能够 discover 新的药那就是一个 trillion dollar market 肯定会出现像 cursor 或者 devon 机会的一个赛道明白那随着 AI biologist
像张章说的那样从 automation 到 discovery 如果我们展望的稍微久一点 3-5 年之后你预期 2030 年左右那时候药厂以及所有的生物实验室会以什么样的形式运作呢
对我觉得这是很有意思的问题 2030 年因为其实也就五年嘛所以有感觉会随着时间 evolve 就第一步肯定是 augment human 就有点像 cursor 一样可能到时候会有一个 workspace for biologists 他可以去 automate 大量大量的 duty task 然后第二步的话是就是有点像 autonomous agent right
他可以自己去 make discoverymake hypothesis 然后 human 是根据上是一个 supervisor 他就是比如说每周可以一个 agent 就是把他把他的这个实验结果发现新的东西 report 给你对然后我觉得这是让你之后的话就是比如说一个 phc 点底下有 10 个 agent 他
他可以帮你做完东西然后我可以总结一下然后汇报给一个 PI 第三步的话可能非常像是一个 organization 我们之前有想过一个 concept 就是一些 virtual pharma 就是有没有可能甚至是一个 agent 就是一个 pharma 设计一个药各种 design 然后甚至他直接可以做一些 robotics 的这个 wild lab 的一些 orchestration 等等等等就有点像那个 one man 的那种什么 billion dollar startup 可能是一个 one man 或者 one agent 一个 billion dollars 的 biotech 我感觉可能是
完全有可能可能不是 2030 年可能是 2050 年吧呀然后 DMEA 里面的话 PI 可以 hire 更加更加少的 PH students 甚至 in the future just have one PI lab 因为我们最近其实已经能看到到有些 PI 他们 hire 一些 bioinformatician 他那些 task 我们完全能用 agent 可以去 automate 掉所以之后可能会越来越倾向于这种 one PI 这种 lab 嗯
车薪这边说的很有意思的趋势就是未来有可能能一个人带着很多 agent 作为同事去运作很多的方向那么如果对于很多接下来想切入像 AI for science 或者说 AI for biology 或其他比如说材料科学领域的 AI scientist
你会有什么建议吗我觉得有一个建议可能就是 deeply collaborate with biologists 真的去从色神处地从他们的角度着想他们需要什么不是说我要 create 一个 hammer 我可以去解决什么他们的问题然像是 talk with them 然后不要说我 develop 什么东西我就说我想要了解你的这个
问题是什么我想要知道你的 day to day work 是什么样的 form some collaborations 我感觉这是一个比较好的一个方式吧然后我觉得最近也是一个比较好的时机因为的确能够感受到 biologist 现在对 AI 非常的 open 因为我从七年以前开始做刚开始前面五年 biologist 对 AI 是一个没有那么 open 的这样一个态度他们刚开始觉得这是一个 some technology 但是也不会影响他们
但是最近两年明显能够感受到他们非常 open to collaborate 他们甚至想要非常 actively 去 use AI 他们自己也会去用一些 AI 对所以我感觉也是一个很好的时机确实我们也经常听到一些可能本身不写代码的生物学的研究员现在都开始用 cursor 写代码了我感觉这确实是他们拥抱 AI 还有所有 AI 产品的一个很好的时机对大家发码里面也是一样就是这也是一个比较
现在有一个非常 top-down 的 AI 的拥抱的浪潮从 high level senior people 他们一直想说 how do this company use AI 这是一个非常不一样和五六年以前就那个时候做 AI for job discovery company 耀起其实对这个是非常 conservative 的这些耀起从你的了解来说首先肯定要有一笔预算去做 AI 方面的投入
之前对他们来说一定会花钱去买的 AI 工具有什么比如说可能在我们概念里面可能只知道 AlphaFold 最近你会感觉到有一些什么新的变化吗
对我觉得 AlphaFold 肯定有些药企会用用的最多其实还是 ChaiGBT 我感觉说实话对然后 ChaiGBT 他们会有一些 Enterprise version 其他的就是 external 的 AI 的 tool 我感觉其实用的非常的少有一些就 database 的一些 analytics 这种但我感觉不是那种非常 core 的就 research 的方面的 AI 这些药企用 ChaiGBT 主要是来做什么呢 run 一个 bio pharma 除了 science 以外其实也有很多很多方面比如说
business intelligence 你想要知道这个 target 另外的砝码有没有人在用比如说我想要设计一个 clinical trial
我要怎么设计这个 criteria 然后甚至做一些 literature research 这 science 方面也是也会用到很多对所以感觉因为它 chat gpt 应该是一个非常 fundamental 的一个就是非常 general purpose 所以所有药企也都会用然后他们也会 build 一个 customized version 他们就把药企的一些 private documents data 可以都 connect 到 chat gpt 里面这么看如果要做一个 vertical 的 AI scientist 或者 biologist
跟 ChaiGPT 某种程度上还有一定的竞争但 ChaiGPT 因为没有这个 environment 所以他们更加像是做一些 tech space 我感觉不像是那种 real research task 更加像是一个非 research 的一些 company stuff 当然也不排除 ChaiGPT 之后会做 scientific discovery 他们最近不是 Grakbach 还放了一个什么 adiquate 的那个就 molecular structure 的一个 ChaiGPT support 对对对是的
那你和这些用户合作的过程当中有没有看到一些 BioMini 特别有意思的 Use Case 可以分享一下比如说是 ChatGPT 做不了的或者是用户非常 Surprising 能做到这个程度的因为我们现在还没有 Formal Release 所以我们现在的 Data Point 其实是比相对比较少但是我们目前跟一些 Lab 合作我觉得用户对于这个的 Expectation 没有很高他们现在觉得 ChatGP 能做的东西就是回答一些问题
所以如果展示给 BioMini 给他们的时候比如说我们把他们的一个 GWAS analysis 从头到尾直接 run 了一遍它产生了很多 beautiful figures 可以放到 publication 里面就是他们觉得这种东西很好用我马上就想用这个就是一个比较实际的东西就是很多人的 research task 他们都不知道 what is possible 所以如果当 BioMini 完成了这个 task 然后把那个 report 给他们以后他们就会觉得 pretty surprised
因为其实 biologist 还是一个相对比较 conservative 的 community 他们对新的 technology 特别是 computing technologyopen mindedness 虽然目前在越来越多但是还是相对比较 conservative 包括比如说要相信技术的 output 是不是非常 robust 他们还是有一些 concern 的然后他们也不知道这个技术现在目前进展到什么地步了比如说现在我们 autonomous agent 能够让他们完成 analysis 他们其实是没有这个 assumption
这种 Aha moment 真的能帮他们解决问题其实也很好就像 Cursor 装饰 Type 其实做 Auto Complete 式的非常简单之前就有的任务但如果把这个任务解决到极致理论上这群用户就会有非常好的满血对我觉得就是需要很多这种 Aha moment 对非常同意而且我听起来觉得 Bionomy 其实不仅是用了模型的能力
更多的是他还给了这些 researcher 还有生物医药学家一个新的用户界面让他们能直观的感受到模型到底能做什么 agent 到底能做什么相当于是降低了他们使用 intelligence 的一个门槛
Exactly 其实我们过去的一个月我们一直在花时间是 Build 这个 UI interface 因为 biologist 肯定他不会写 code 他肯定是需要一个 no code 的一个 solution 然后我们怎么样让这个 UI interface design in a way 就是让 biologist 觉得用起来很爽我觉得这是一个其实是一个非常多细节的问题我们其实跟很多 biologist 在聊因为我们 team 里面有很多 biologist 他们关注的点很多时候就是非常的不一样要从头设计 interface 来满足他们的需求
然后让他们有这种 magical experience 我觉得这也是一个很有意思的一个问题今天我们也讨论了很多 AI scientist 方面的问题对柯鑫来说你觉得 AI scientist 它发展到什么程度取得什么样的进展是让你觉得比较理想的然后大家都会觉得非常 exciting 的我觉得还有各种各样的 milestone 我觉得最终的 milestone 肯定是他 make 了一个 nobel prize level 的一个 discovery 就像迪桑发现了 crisper 这样级别的 discovery
他可能还会有另外的 milestone 比如说找到真的一个被 validated 的一个完全新的 disease target 我觉得这也是一个非常重要的一个 milestone 因为他能够找到第一个 validated 的话他也能说明他能找到更加多其他的然后甚至他可以从头到尾设计出一个 drug 也是一个非常大的一个 milestone 因为它是一个 end-to-end 的一个 drug discovery 比如说像 diagnose 的之前没有人能够解决了一个 real disease 的 diagnosis case 那也是一个非常大的 milestone
因为我感觉 AI scientist 其实就是去 simulate human scientist 所以 human scientist 能够做的东西他如果都能做甚至能做得更好那就达到那种 super intelligence 的这种感觉这肯定是一个最终的目标听起来你觉得 AI scientist 其实是跟 AlphaFold 这样的科技进展同样让你兴奋的一个进展
对我觉得刚开始前面五年我其实没有在做 agent 方面的工作我其实更像是做像 alpha 4 之后这类模型就是用 biological data 去做一些 modeling 这样的方面工作然后我明显感觉就是个 AI scientist is a different capabilities 他能解决 a wide range of different tasks 他 introduce 是这个 human intelligence 的这样一个东西所以他能够 open up 一个完全不一样的 capabilities or scientific discoveries
所以我感觉这是一个非常 exciting 然后有非常多 open question 的这样一个方向对非常期待 Beyond Money 的发布也非常期待未来可心预演的一个人的要起的出现