Kasaf: 我认为一个好的算法应该能够在各种数据集上稳定地工作,例如进行链接预测。数据集本身就是数据集,重要的是我们向数据集提出的问题。Bastian提出的RINGS框架是一个很有趣的评估图学习数据集的方法,它通过扰动图来测试数据集的鲁棒性和实用性。我们应该思考向数据集提出的问题,因为有时网络可以帮助我们发现新的问题,而不仅仅是回答旧的问题。例如,在GitHub存储库网络中,人们的合作并非总是基于地理位置,而是编程语言。使用错误的同质性标记会扭曲网络,并导致结果失真。数据驱动和探索性的方法可以帮助我们从网络中学习新的知识,而不是只提出旧的问题。学习的智慧在于提出正确的问题,而不是回答问题。这篇论文的结果更偏向机器学习社区,而不是网络科学社区,因为网络科学社区一直都在做这类事情。我们需要思考我们提出的问题和我们依赖的数据集。
Bastian Rieck: 我是巴斯蒂安·里克,瑞士弗里堡大学的终身教授,机器学习方向。我的实验室名字“IDOS Lab”源于希腊神话中的敬畏女神,体现了我在科学研究中的敬畏之情。人工智能与纯数学不同,人工智能高度依赖数据,需要根据数据集回答问题。我热爱开源,并通过GitHub跟踪我的工作,并保持学习。我从2018年开始使用Markdown文件进行项目和个人事务的结构化记录。我最初学习的是纯数学,后来转向机器学习,因为机器学习的结果更易于衡量,结果也更直接。拓扑学在机器学习中有很多应用,例如将拓扑信息融入模型。拓扑方法可以补充机器学习中其他结构归纳偏差。拓扑学是关于形状的数学,它有三个主要分支:点集拓扑、代数拓扑和微分拓扑。拓扑学是研究形状的数学。机器学习吸引我的地方在于它有数据和明确定义的问题,结果也更直接。机器学习的结果更直接,不像纯数学那样需要等待很长时间才能得到结果。图的生成和推理方式多种多样,这让我很感兴趣。现在有很多来自分子建模或药物发现的数据集,以及社交网络数据集和道路网络数据集。图学习方法主要有两大类:图神经网络和Transformer架构,图核方法由于计算效率问题而逐渐被淘汰。我们的目标是提供一个框架来评估图学习数据集的实用性。我们想提供一种方法来衡量图的“图性”,即节点特征和图结构对结果的贡献程度。我们想提供一个框架来评估图学习数据集的实用性。在评估图学习方法时,除了精度、精确度等指标外,还需要考虑节点或特征之间的距离度量。在评估图学习方法时,除了精度、精确度等指标外,还需要考虑节点或特征之间的距离度量。RINGS框架旨在对图数据集进行分类和评估,它考察节点特征和图结构的相关信息。许多图数据集都包含图和节点特征,RINGS框架旨在评估这些特征对结果的贡献程度。RINGS框架通过扰动图结构和节点特征来评估数据集的实用性。RINGS框架通过扰动图结构和节点特征来评估数据集的实用性。理想的图数据集应该同时具有信息丰富的结构信息和特征信息。许多数据集并不需要同时具有信息丰富的结构信息和特征信息,这可能会导致错误的结论。如果使用不需要图结构的数据集来评估图学习方法,可能会得出错误的结论。如果使用不需要图结构的数据集来评估图学习方法,可能会得出错误的结论。如果使用不需要图结构的数据集来评估图学习方法,可能会得出错误的结论。基准数据集的质量会影响对方法的评价结果。我们不能完全依赖现有的数据集来评估图学习方法的优劣。我们不能完全依赖现有的数据集来评估图学习方法的优劣,因为有些数据集即使去除图结构或替换为随机图,性能也不会下降。如果扰动网络后性能没有下降,则说明图结构没有发挥作用。如果扰动网络后性能没有下降,则说明图结构没有发挥作用。我们在RINGS框架中使用了四种扰动:无扰动、空图/特征、完全图/特征和随机图/特征。我们在RINGS框架中使用了四种扰动:无扰动、空图/特征、完全图/特征和随机图/特征。许多基准数据集需要重新考虑,因为其性能并不总是由图中的所有可用信息驱动。许多基准数据集需要重新考虑,因为其性能并不总是由图中的所有可用信息驱动。目前只有少数数据集,主要是在分子领域,同时具有信息丰富的结构信息和特征信息。有些数据集过于简单,研究人员应该停止使用它们。有些数据集过于简单,研究人员应该停止使用它们,例如酶数据集和Reddit数据集。有些数据集过于简单,研究人员应该停止使用它们,例如酶数据集和Reddit数据集。分子数据集可能因为其规模较大而具有更好的特性。分子数据集可能因为其规模较大而具有更好的特性,也可能因为分子天然具有结构和特征。未来的论文应该包含使用RINGS框架的结果,以显示扰动后指标的变化。未来的论文应该包含使用RINGS框架的结果,以显示扰动后指标的变化。未来的论文应该包含使用RINGS框架的结果,以显示扰动后指标的变化。理想情况下,扰动后性能应该急剧下降。理想情况下,扰动后性能应该急剧下降。某些流行的数据集存在偏差且不具有代表性,这体现在节点和边的分布上。某些流行的数据集存在偏差且不具有代表性,例如AIDS数据集,其性能几乎完美,这表明任务可能过于简单。某些流行的数据集存在偏差且不具有代表性,例如AIDS数据集,其性能几乎完美,这表明任务可能过于简单。我们应该更多地考虑图的来源,因为不同来源的图具有不同的特性。某些流行的数据集存在偏差且不具有代表性,例如AIDS数据集,其性能几乎完美,这表明任务可能过于简单。我们应该更多地考虑图的来源,因为不同来源的图具有不同的特性。我们当前的框架只考虑了消息传递图神经网络,这是一种局限性。我们当前的框架只考虑了消息传递图神经网络,这是一种局限性。我们希望社区能够使用RINGS框架来讨论新的数据集,并更加关注数据集的设计和维护。我们希望社区能够使用RINGS框架来讨论新的数据集,并更加关注数据集的设计和维护。
Deep Dive