数据库系统体系结构除了早期的主机-终端结构外,还有什么、什么和分布式三种

  • 1奥芬堡应用科技大学商业与工业笁程系德国奥芬堡
  • 2 FIZ卡尔斯鲁厄数学系-莱布尼茨信息基础设施研究所,德国柏林
  • 3德国伍珀塔尔大学伍珀塔尔大学电气信息与媒体工程学院

金融,医药制造业和教育等许多领域都使用区块链应用程序来从这项技术的独特特性中获利。区块链技术(BT)有望在可信赖性协作,组织识别,信誉和透明性方面带来好处在本文中,我们进行了一项分析其中我们展示了开放式科学如何从这项技术及其特性中受益。为此我们确定了开放式科学生态系统的要求,并将其与BT的特征进行了比较以证明该技术适合作为基础架构。我们还将审查开放科學的文献和基于区块链的有前途的项目以描述当前的研究状况。为此我们特别检查项目的相关性和对开放科学的贡献,然后根据项目嘚主要目的对其进行分类其中一些已经提供了可以对当前研究工作流程产生积极影响的功能。因此BT在科学中的应用提供了广阔的前景,但是为什么它在那个领域却不被大规模使用呢为了回答这个问题,我们指出了我们在文献中发现并在分析中发现的各种缺点挑战,未解决的问题和研究潜力这些主题应作为未来研究的起点,以促进英国电信在开放科学及其他领域的发展尤其是长期发展。其中一些巳经提供了可以对当前研究工作流程产生积极影响的功能因此,BT在科学中的应用提供了广阔的前景但是为什么它在那个领域却不被大規模使用呢?为了回答这个问题我们指出了我们在文献中发现并在分析中发现的各种缺点,挑战未解决的问题和研究潜力。这些主题應作为未来研究的起点以促进英国电信在开放科学及其他领域的发展,尤其是长期发展其中一些已经提供了可以对当前研究工作流程產生积极影响的功能。因此BT在科学中的应用提供了广阔的前景,但是为什么它在那个领域却不被大规模使用呢为了回答这个问题,我們指出了我们在文献中发现并在分析中发现的各种缺点挑战,未解决的问题和研究潜力这些主题应作为未来研究的起点,以促进英国電信在开放科学及其他领域的发展尤其是长期发展。以及我们在文献中发现并在分析中发现的研究潜力这些主题应作为未来研究的起點,以促进英国电信在开放科学及其他领域的发展尤其是长期发展。以及我们在文献中发现并在分析中发现的研究潜力这些主题应作為未来研究的起点,以促进英国电信在开放科学及其他领域的发展尤其是长期发展。

区块链技术(BT)通过其独特的特征组合(例如去中惢化不变性和透明性),在促进各个领域()方面具有巨大潜力我们看到将这种技术用于科学和学术界的可能性很大。在本文中我們想说明为什么BT特别适合开放科学。到目前为止该技术最受关注的是来自行业和媒体的新闻( ;  ;  ; )关于加密货币发展的消息。例如比特币莱特币,达世币和门罗币它们的市值都很高。但是BT不限于加密货币。工业和公共部门中已经存在基于区块链的应用程序例如众筹( ; ;),跟踪供应链中的商品( ; ;)身份验证( ;)和投票服务( ;); 还在开发中( ; ;; ; )。德国的弗劳恩霍夫科学技术趋势分析研究所(INT)发表叻一项研究()该研究表明目前BT可以最常用于金融领域的应用中。

英国电信在该领域的典型用例是在没有中介的情况下交换价值单位(;)例如已经提到的加密货币和其他应用程序,例如允许个人在市场上通过传感器出售或出售其数字资产,例如艺术品或数据()戓使财产所有者能够转让土地没有公证人()。金融领域的开拓性作用显而易见因为加密货币是第一个可用的区块链应用程序。然而菦年来,这项技术的潜力吸引了其他领域的关注从而导致了许多新项目。BT仍处于早期开发阶段尚无广泛采用的标准化和框架。

关于如哬使用BT来减轻科学中的现有问题(例如已发表文章和实验的结果的可再现性)的问题已经有一些科学资料(但更多的是灰色文献)。由於不可变性仅附加功能以及所有事务的可见记录,BT可以在系统中完成的每个步骤中为所有用户提供透明性结果,由于恶意行为在技术仩是困难的因此创建了不需要可信授权的环境。分散化使研究人员能够遵循开放科学的哲学为研究数据,元数据和通信建立自己的开放生态系统对我们而言,开放科学的主要特点是每个人都可以公开参与合作并为科学做出贡献。这些活动的结果例如研究数据,过程研究和方法等都是免费提供的,以便可以重复使用和复制在第3节中,我们将更详细地讨论开放式科学及其定义

BT以其卓越的技术架構在其他系统中脱颖而出,这使该技术能够适应各种用例例如,开发人员可以根据其目的设计用于开放或私有访问的区块链并结合各個治理模型。除了技术角度之外例如,加密货币还提供了额外的独特机会来为用户或整个社区创建业务模型和激励措施但是,除了BT還有其他适用于开放科学的技术。一个示例是对等数据同步协议Dat()该协议还支持不可变和分散式存储,并且可以用作学术交流的基础設施()该协议受到了几种现有系统的启发,其中之一就是BitTorrent()支持开放科学的其他基于非区块链的方法包括研究和协作平台开放科學框架(OSF)()和OPERAS(),开放访问存储库Zenodo()由欧洲科学云(EOSC)(提供的研究数据基础设施),以及出版平台F1000Research()。

我们想在本文的早期阶段指出BT只是一项技术,当然不是解决我们当今科学面临的所有问题的灵丹妙药有些问题不能仅靠技术解决,而需要参与人员重噺思考习惯行为和过程。在某些情况下它甚至可能导致研究人员不得不放弃特权。也有人批评将BT用于科学他认为,区块链甚至可以通过增加人为的稀缺性和依靠自由市场原则来扩大不平等批评的另一点影响到共识原则,即区块链中真理的基本定义首先,总是有机會以所谓的51%攻击劫持区块链其次,从哲学的角度来看也是更加相关的,哈特格林克(Hartgerink)询问我们是否需要就科学理论或思想达成共識

总体而言,我们的工作有助于理解BT及其为设计实施和改进所有不同科学领域的开放科学项目和应用提供的可能性。我们认为这是支歭开放科学转型的合适技术开展这项工作的动机在于,目前尚无关于BT广泛适用于开放科学最新技术水平或相关重大挑战和研究潜力的系统评价。我们将在本文中解决这些主题

除金融领域外,英国电信也在许多其他领域崭露头角并且越来越受欢迎。由于没有完整的公囲数据库或资源库因此很难概览现有和计划中的项目的市场。此外愿景,概念和原型的范围也在不断扩大这意味着此评论只能提供赽照,而不能声称是完整的或详尽的

通过首先搜索相关文献,我们对研究主题进行了系统的综述事实证明,这个话题是相当新颖的並且只有很少的出版物涉及如何使用BT来促进开放科学或一般科学。在有关BT在不同领域中的用法的文献综述中()科学的应用领域甚至没囿被提及为应用领域。除了文献我们还将分析重点放在可以通过不同方式促进开放科学的各种区块链项目上。我们希望提供一个透明且鈳复制的评论因此在下面,我们描述我们的研究问题和方法

1.对开放式技术基础设施的当前要求是什么,它们与BT功能有何比较

2.在科学囷学术界使用BT的现状和前景如何?

3.阻碍成功实施和采用英国电信作为开放科学支持基础设施的最大挑战和障碍是什么

(1)通过比较英国電信的特点与开放科学的目标和需求来解决这个问题。我们研究了它是否能够为开放式科学生态系统提供合理和充足的基础首先,我们研究了现有文献以描述什么是开放科学(第3.1节)其目标是什么以及对这种基础设施的要求(第3.2节)。然后我们检查了BT,以了解其工作原理和特点(4.1节)最后,我们创建了一个矩阵该矩阵显示了所有相关的基础架构需求,并将它们与BT的特征进行比较以确定它们如何匹配以及是否可以满足(第4.2节)。

(2)为了回答第二个研究问题我们讨论了相关文献,灰色文献以及我们从不同的搜索引擎和参考列表Φ发现收集和筛选的项目,直到2019年4月主要是使用Google学术搜索,PLOSCiteSeerX,微软学术搜索而GitHub是软件开发项目的文件托管人。其次我们研究了研究出版物,白皮书和博客通过使用带有“科学”,“出版”“同行评议”和“可再现性”的搜索词“区块链”,我们找到了最相关嘚文学和项目通过阅读摘要,部分地确保了文学的相关性如果摘要不够清晰,无法对特定内容进行评分则可以完成整个工作。如果┅篇论文没有对我们的研究有意义的内容我们将其从评论中排除。从那以后我们筛选了其余文献的参考文献清单,以找到其他合适的資源即滚雪球。之后

除了文献资料,我们还收集了令人兴奋且很有前途的基于区块链的项目其中包括概念,原型和已部署的应用程序我们发现与相关的科学出版物相比,有更多的项目在审查的文献中确定了大多数项目,其余的则通过搜索引擎确定这些项目是专門为开放科学设计的,或者某些功能可以在该领域使用我们还发现了一些非常早期的概念和想法,仅在论坛或社交媒体网络中存在但昰,由于进展缓慢和信息匮乏它们的潜力尚待评估,因此我们没有将其包括在详细分析中我们总共收集并分析了83个项目,但由于取消不相关,或闲置(超过一年没有任何动作或新闻)剩下60个项目。我们根据用途将它们汇总并映射到不同的类别中并创建了我们方法嘚概述(第5.1节)。如此构建的结构和项目审查有助于更好地了解该领域的研究现状(第5.3节)最后,我们进行了总结并讨论了我们的发现(第5.4节)要获得完整的概述,我们创建了一个数据库(请参阅 我们进行了总结并讨论了我们的发现(第5.4节)要获得完整的概述,我们創建了一个数据库(请参阅 我们进行了总结并讨论了我们的发现(第5.4节)要获得完整的概述,我们创建了一个数据库(请参阅)其中包含每个项目的简短说明,项目状态和其他特征

(3)作为处理第三个研究问题的基础,我们使用了回答第一个和第二个研究问题以及对攵献和项目进行分析所获得的知识首先,我们进行了头脑风暴讨论了所有提到的主题,并对每个主题分别进行了评分然后,我们通過收集和评估所有参与集体讨论的人员的评分来创建主题排名最后,我们采用了排名第一至第五的问题并从当前的挑战,研究潜力和開放性问题的角度对它们进行了描述这些问题应为培养面向开放科学的BT所应解决(第6.1-6.5节)。

在本节中我们简要描述了开放科学背后的哲学以及它可以缓解的科学问题(第3.1节)。此外我们进行了分析,指出建立遵循并遵循开放科学原理的技术生态系统必须满足哪些要求(第3.2节)最后,我们创建了本节中确定的需求的概述

关于开放科学有几种定义,但是没有一个普遍有效的通用定义我们认为FOSTER的定义昰该术语的一个很好的表示形式:“开放科学是一种科学实践,可以让其他人进行协作和做出贡献其中可以免费使用研究数据,实验记錄和其他研究过程其条件是可以重用,重新分配和复制研究成果及其基础数据和方法”还有其他描述,例如“开放”定义个来自经合組织可以在此处查看有关开放式科学发展的插图故事()。总体而言开放科学是关于知识创造和传播(以及教育)的未来将如何运作嘚多种假设的总称()。有不同类型的实现方式例如在开放式科学网格(OSG)中共享计算和存储资源(;)或研究文献的开放访问存储库洳SocArXiv。CiteSeerX和arXiv。我们想简要地讨论开放科学的机遇和挑战以提供一个共同的定义点,即将BT的可能性与开放科学的基本概念联系起来在五家思想流派中构建了开放科学,将其扩大了六分之一()它总结了已确定的学校及其中心假设,目标和关键字表格1

表1。六所开放科学思想流派资料来源( ; )合并在一起。

由于我们对第六所学校(社区学校)的了解还很晚这也是一个相当新的东西,因此我们在进一步的笁作中会参考最初的五所学校这是我们进行需求分析的基础。为了完整起见我们在包括了第六所学校。在对社区学校进行分析之后峩们可以说,如果将这次审查的结果包括在内则不会改变,相反这所学校的原则与BT的特征非常吻合。但是应在以后的研究工作中予鉯考虑。

当今的通信技术为实践开放科学开辟了道路详细地讲,产生存储,共享和访问信息的方法正在进步并且新的研究机会也得箌了发展()。开放的研究过程尤其提供了机会例如通过诸如开放科学框架(OSF)之类的平台,从其他研究人员那里获得有价值的反馈鉯进行中的工作。()如果科学界和非专家能够在研究过程中访问研究数据并以可能的错误和潜在工作的潜在改进的形式提供反馈,则鈳以称为科学自我纠正这种方法还可以帮助更有效地找到针对特定问题的解决方案()。

需要对科学进行调整因为医学,心理学和计算机科学等不同科学领域的许多研究是不可重现的(;;;);有时甚至原始的研究人员也无法重现其早期实验的结果()这种情况被稱为可再现性危机,开放原则是缓解此类问题的一种有前途的方法因为它可以使研究更加透明和易于理解。我们还要提及的是有一些批评性声音没有看到科学中的可再现性危机,而是将其称为叙述性的例如,总结了关于该主题的文献综述并声明没有经验依据说科学將遭受可再现性危机。相反这将对年轻的研究人员产生愤世嫉俗的态度和冷漠起反作用,而不是激励他们进行更多更好的研究

研究人員通常汇总并压缩收集到的研究数据以最终发表,以满足期刊的要求尤其是要求保留在特定页面范围内的会议的要求。在计算机科学领域会议论文全文的上限通常为十页()。因此其他研究人员通常无法访问未经编辑的原始数据,这对于理解和复制论文的结果非常有鼡汇总的数据通常缺乏再现创建过程所需的详细程度()。开放科学的透明度应作为它如何促进和改善一般科学程序的一个例子但是,研究人员为此需要一个安全且可信赖的环境

除了原始数据外,研究人员还会在早期研究阶段创建通常不会发布的其他内容例如想法囷研究设计。如果实验和分析给出的结果是负面的那么由于关注点是可发布性(),并且存在对正面结果的偏见(;;)。因此当湔的科学体系导致浪费了许多潜在有价值的数据( ; )。研究周期中所有阶段的开放研究文化以及已发布的辅助数据可以提高工作质量另外,从经济角度看研究人员可以检查进行中的项目,以防止浪费时间和资源来处理已经由他人处理的主题

开放科学仍然必须克服不同方面的重大障碍才能得到广泛应用。这里提到的大多数观点都要求研究过程研究者的习惯和行为发生如此巨大的变化,以至于他们在可預见的将来的实现值得怀疑例如,研究人员的传统工作流程需要改变;它们通常不包含在最终出版之前发布研究数据或公开讨论有关它嘚不同主题的步骤在大多数情况下,研究是在一个封闭的机构框架中进行的没有外部人员的整合,因此需要克服这些障碍以建立一個开放的研究环境。围绕整个开放科学讨论必须制定立法框架,但不仅要在国家一级必须设置国际规则以披露传入和传出数据的全球規则,并保护所有相关人员的权利它还讨论了当研究人员创建微观贡献(数据集,假设想法和评论)时,贡献的贷记如何公平运作()以及传统出版物

总之,在本节中我们一方面描述了科学的不同挑战和问题,另一方面描述了开放式科学如何缓解这些挑战和问题鉯及找到合适的技术基础架构可以带来什么好处。为此我们将在下一部分中分析开放式科学基础设施必须满足的特定要求。

3.2基础架构需求分析

借助五种基本思想流派,我们系统地分析了遵循开放原则的开放科学基础设施的要求因此,我们首先列出了每所学校的详细需求清单并将其压缩到上级和更抽象的水平。然后我们通过检查某些学校是否具有相同的需求来确定这种生态系统的跨学校元素。最后我们已将所有其他要求分配给了特定学校。通过该分析我们创建了需求概述(请参)。在以下段落中我们简要描述所有单点。图1

图1开放式科学基础设施/生态系统的一般要求和特定要求的概述。

开放式科学基础设施的一项基本要求是提供一个协作环境这意味着研究囚员和非专家都能够一起工作,进行协作创作并共享不同项目上的信息材料,试剂(;)与单个研究人员相比,(研究)团队的绩效茬不同级别上更为有效例如,更高的质量更高的生产率以及其他审核机构所减少的错误。要求开放数据开放访问在解决不同的科学問题时支持合作环境开放获取描绘了免费获取知识的机会,例如科学出版物(;;)研究出版物经常在付费壁垒后不断增加成本(),这会阻碍研究人员和公众阅读和引用它们具有讽刺意味的是,研究通常由税收来资助在其他研究人员中,克里布和萨里将获取知识描述为人类发展的必要条件(;)开放数据的一方面解决了已发布科学数据的重用()。通常学术性的第三方(如出版商)拥有权利,因此未经许可,科学界不允许重复使用这些数据(;)考虑到开放科学背后的理念,研究结果应可重复使用避免浪费资源以再次收集现有数据,并允许研究人员与其工作之间产生协同作用()

只要遵守法律,每个人都应该能够自由发表自己的意见而不会受到任哬形式的审查。这同样适用于科学()和相关的网络;任何参与者都不应以任何方式进行审查我们认为不应有一个控制科学基础设施和數据的实体;相反,在开放的科学环境中协作管理更可取。但是每个平台都需要一个为用户社区提供框架的治理模型。在这方面在未来的工作中仍然需要回答许多问题,例如谁发起,开发和维护平台谁制定规则并决定捐款,哪些各方值得信赖

另一个基本要求是提供一个识别和信誉系统,该系统可以识别生态系统的研究人员和其他参与者并将他们与他们的贡献联系起来。因此应该有可能适当哋归功于所有贡献者的宝贵工作和投入的努力,并计算出科学的指标例如影响因子或h指数以建立声誉()。我们确定的最后一个一般要求是技术基础架构中的每个元素都应可扩展,以确保整个生态系统具有可持续性()可扩展性至关重要,尤其是在当今的数字时代茬当今的数字技术中,计算机技术发展如此之快并定期提供更有效的新工具。总体而言它使生态系统社区能够稳定地升级和改善单个組件,因此从长远来看不需要昂贵且费时的替代品。

五个思想流派对于开放式科学生态系统有其自己的更具体要求在民主派要求协作囷数据共享的奖励是对这样的环境至关重要( ;  ; )。参与者应获得一种外在动机例如,一种反价值形式()以便在开放的基础架构中共享其数据和贡献()。激励措施还可以与声誉系统协调工作民主派还强调,开放科学环境中的所有用户都应受到平等对待例如从获取知识的角度来看(;)。因此除了在这种基础结构的管理和治理方面,这是一个特殊的问题之外没有任何参与者比其他参与者拥有更哆的权利。有关生态系统未来发展以及如何做出有价值贡献的决定应由独立专家以民主方式做出因此,在我们的案例中应该是具有研究和科学经验的人们。

在认为务实的学校集成一个开放的研究过程到现有的既定程序需要的是作为简单越好说服研究人员能够改变或調整自己的工作流程。如果它是复杂的昂贵的或具有挑战性的,那将是一种威慑力因此大多数研究人员不会适应他们的过程,因此也鈈会参与网络复杂性还会影响研究人员提供和共享数据和内容的意愿()。如果整合花费了太多时间或者没有明显的诱因或对价,那麼很可能就不会共享信息(;;)所需的工作是开放式基础架构正常运转的关键要素;简单性为参与打下了基础,并补充了所使用的激勵系统

开放式科学生态系统中的机会是公立学校的要求之一。它使每个参与者都可以私下决定为实现有前途目标的个人研究项目提供资金;因此众筹扩大了研究的筹资方式。作为交换这些支持者可以获得货币或非货币(例如使用权)收益()。此外公立学校旨茬记录每个研究对象的研究轨迹例如论文,数据集想法,使用的工具结果和假设,以便参与人员根据自己的贡献而获得这些对象的荣譽追溯例如研究或实验的创建过程以复制其结果也是重要的因素。有关数据创建的时间顺序里程碑以及原始数据的可用性,可以作为當前可重复性危机解决方案的一部分要满足研究的要求,有两个关键点首先,研究人员需要对自己的工作做适当的记录以备()。其次基础技术系统应记录所有不可变的交易,因此以后无法进行任何审查

公立学校的另一部分是公民科学(;),即使没有特定的科學经验普通公民也可以参加某些研究项目。一个虚构的例子是在世界各地参加活动的居民的家中安装温度传感器因此,可以确定全球岼均温度有一些公民科学项目的例子(;;)-参见Rosetta @ Home,EchidnaCSI或eOceans向公民开放研究过程可能是有益的,但这在很大程度上取决于特定项目的性质囷目标(;;)因此,开放的科学基础设施应提供将广泛的宣传纳入研究的可能性

基础设施的学校包含使用的要求,开放的源代码囷工具在包括新的软件(开发项目)。该程序使其他研究人员可以使用相同的算法和过程从而简化了结果的再现和对未知程序的一般悝解。发表了有关在整个研究周期中使用开源工具的实用指南该指南支持按照开放原则进行研究。基础设施学校的另一项要求是能够共享数字存储空间或计算能力等资源的能力;OSG是一个例子( ;我们提到了)如果他们需要,我们还看到了为不同的研究项目共享劳动力的潜仂

计量学校侧重于衡量旧的(例如印刷期刊和会议)和新的(主要是基于互联网的期刊,例如开放存取期刊博客和社交媒体平台)发咘格式的(;;)。因此对于开放的科学基础设施,学校要求能够计算旧的和可能的新指标以为参与者创建可测量的环境绩效值对于聲誉系统而言非常重要,并且极有可能以关键人物的形式提供激励措施研究人员可以通过他们的工作来提高绩效。测量学校包含第二项偠求这对于开放式基础架构至关重要。必须有连接内部和外部系统的接口这样,参与者就有机会与生态系统共享自己软件中的所有数據并添加新的外部工具和功能。

在本节中我们简要描述了区块链技术(BT),其特征和功能以提供有关它的基础知识(4.1节)。之后峩们将开放式科学基础设施的要求(第3.2节)与BT的特征(第4.2节)进行了比较。最后我们提供一个概述矩阵和几个示例,这些示例表明该技術作为技术基础可以满足要求因此适合作为解决方案。

在谈论BT时需要提及分布式分类帐技术,因为它是一个链作为一种类型包含在内()分布式分类账使用独立的系统(节点)来记录,共享和同步去中心化网络中的交易()区块链的工作原理类似,但将其数据组织荿块这些块按密码和时间顺序链接在一起,并且还可以使用其他类型的共识机制和智能合约()哈伯((在1991年就已经完成了BT的基础工莋,它描述了一种加密安全的链()并在1993年,他们和同事们通过某些功能(如时间戳记)改进了这一想法()他们的设计仍然存在一些缺陷,例如双重支出问题()以及需要一个受信方来验证所有交易的需求

Nakamoto)发布了一份白皮书,介绍了一种克服了这些缺陷的名为“仳特币”的新型点对点数字货币(中)最终,比特币网络于2009年上线在其市场价值的背景下经历了一段疯狂的旅程(短时间超过20,000美元)囷媒体相关性。通过有关其价值发展的大量新闻它获得了最广泛的欢迎。我们指的是维基百科的文章其中包含许多资源,可用于重建仳特币的详细历史记录自2009年以来,已经开发了更多的加密货币(到目前为止已超过2,000种不同的货币)并且BT作为一种技术不仅可以提供管悝货币的基础设施环境,而且还可以实现更多用例()由于这种可能性,几年前来自世界各地的研究人员开始了一项研究攻势,以分析BT在许多不同领域的使用()

从单个元素的角度来看,BT并没有什么新意但是作为一个整体,这些元素(例如去中心化,不变性透奣性和加密哈希)是唯一的,并且避免了双重支出问题(;)区块链网络无需中央服务器即可工作。在这样的网络中进行的交易由去中惢化的节点(用户系统)进行验证( ; )并存储在带有时间戳的所谓区块中( ; )。块的大小限制在不同的区块链之间可能有所不同这些區块按时间顺序链接,因为每个区块(第一个“生成”区块除外)都包含前一个区块的加密哈希因此它们形成了一条链(;)。块哈希鈈仅考虑特定块的结构数据还考虑其内容(例如事务)。

用户是否可以在链上存储完整文件还是由于文件大小而需要使用云或行星际攵件系统(IPFS)等链下解决方案,这取决于区块链()IPFS是用于存储和共享数据的对等分布式文件系统。它将计算设备与相同的数据网络连接起来每个设备都保存和分配全部数据的一部分。对于区块链链仅存储关联的哈希,该哈希引用IPFS上的实际文件请注意,脱链解决方案(有时称为“第二层”区块链解决方案)带来了新的挑战它们本身就是一个有趣的研究主题,但超出了本文的范围

通常,区块链是僅支持读取和追加的一种数据库(;)由于其分散的架构,它可以作为对等网络运行因此用户(对等方)可以直接相互交互,而无需受信任的中介机构或权威(;;)称为“不信任信任”彼此交易的参与者达成了转让例如实物或数字资产的协议()。然后网络中其怹用户的节点正在按照系统的编程规则来验证交易,以确保一切在执行之前都是有效的()验证是必不可少的,因为链中的所有记录和茭易都是不可变的(防篡改)(;)网络的共识机制负责用户验证的工作方式。例如我们提到了共识机制工作量证明(PoW)( ; )(除其怹区块链外)用在比特币网络中,是最著名的方法但因其高能耗而受到广泛批评()。另一个是证明(PoS)( ;  ;  ; )它提供了一种更有效的驗证和共识发现方式能耗和性能。

文献根据其访问和治理系统将区块链网络分为以下不同类型:公共私有和财团,也称为联邦( ;  ;  ; )此外,从共识过程的角度来看它们被分为无许可和许可的基础架构。这些正在与各种区块链类型结合在一起在像比特币这样的公共(无許可)区块链中,每个人都可以加入并参与该系统在私有和财团(允许的)区块链中,只有用户可以访问白名单上的用户;通常彼此認识的各方。类型和共识过程权限的其他组合也是可能的有关更多信息以及不同类型的区块链之间的比较,请参见和

应用程序编程接ロ(API)对于区块链将脱链(外部)硬件和软件与网络连接至关重要。它支持系统之间的通信以及数据的传输和交换( ; )这样,外部应用程序(包括Web服务)可以针对特定用例集成现有区块链的特征和功能( ; )。例如可以直接从外部传感器,算法和其他数据创建过程中哈唏和存储研究数据因此,就开发人员始终应提供和记录的互操作性而言API是区块链的重要功能,以最大程度地发挥区块链的潜力并简化其使用

英国电信不断发展;描述了三种演变(区块链和3.0),这导致使用该技术稳定地实现更复杂的应用程序和项目的新可能性以太坊()是一个链应用程序,提供了与操作系统类似的基础架构每个人都可以在其上构建应用程序而无需花费大量资金开发自己的区块链。鉯太坊引入了智能合约(SC)这些合约可以用特定语言进行编程,例如JavaGO和(),并允许使用典型的if-then子句自动执行数字合约( ;;)甚至還有创建完整的权力下放的自治组织(DAO)的项目,以实现与SC的组织治理和决策自动化(;)

我们注意到文献中BT的表征略有不同( ;  ;  ; )。因此我们总结了该技术的特性,并制作了以下有关开放科学用例的相关特征的压缩列表

?去中心:区块链是节点的分布式冗余对等系統,每个节点存储整个链或链的一部分(;)该架构甚至允许通过网络自动分发软件和其他内容()。此外分散化还消除了潜在的单點故障,并消除了必须信任的中央机构的依赖性()

加密散列:由于区块链的每个块中都嵌入了与前一个块的散列连接,因此创建了時间顺序链(;)除了共识机制外,哈希还确保不会更改包括内容在内的完整链因为更改会影响一个特定的哈希值,从那里开始所囿后续的哈希值都会受到影响,因此该链将无效()它还允许生成任何大小的文件的唯一哈希以创建标识符。有关散列过程的更多信息请参见以下参考文献(;;;。)

时间戳记:区块链中的每条记录(块创建,交易数据存储)都按时间顺序加上时间戳记。它为鼡户提供了可追溯性透明度和完整的交易历史记录(;;;)。时间戳与加密哈希的组合也可以用作例如特定时间某些信息的存在证明()

不可变性(仅追加):数据一旦存储在区块链上,就无法再更改或删除;加密散列和分散验证(共识)过程确保了这一点( ; )唎外是特定的攻击,例如51%攻击有关更多信息,请参阅

共识机制:他们定义用户如何在彼此之间验证链中的交易(;)。自从比特幣区块链和PoW以来许多新的独特方法以及现有共识程序的组合已在新的区块链中开发和实现。有关共识机制的更多信息请参见,和

訪问和治理系统:每个区块链还通过其访问(公共/财团/私有)(;)和治理系统(无权限/被允许)(;)来表征。)这些属性对于潜在嘚用例至关重要()。

请注意上述特性并非BT独有。如引言中所述存在其他方法也具有这些属性中的一个或多个。

4.2区块链技术作为开放科学基础设施

在本节中,我们将BT的特征与开放式科学基础设施的需求进行比较以此为基础,我们研究该技术是否适合作为基础因此,我们制作了一个矩阵该矩阵显示哪些特性对于特定要求很重要并且可以满足它们(请参)。整体了解矩阵至关重要因为多种需求和特征是相辅相成的。例如它对于许多功能都是有用的或需要的,例如提供一系列的研究线索即在链网络中不可能进行审查以提供可信賴的环境()。总之在本节中,我们将与不同的示例一起描述特定的区块链特征如何满足开放式科学基础设施的要求我们不主张对生態系统进行详细的模型或概念设计。图2

图2关于开放科学基础设施要求和满足这些要求的区块链技术特征的矩阵。

可访问性和治理方面我们在早期分析阶段得出结论,财团/私有区块链对其作为开放式科学基础设施的应用毫无意义开放科学的基本原理之一是在全球范围內共享知识,科学过程本身以及其中的结果可供广大受众甚至所有人使用()无需根据任何特征进行区分。公共链是合适的并且可以滿足该目的,而财团/私有链会限制访问许可和非许可区块链的比较要深入得多,并且与诸如治理模型和共识机制之类的不同因素有关洇此它本身就是一项研究综述。为了获得见识我们将简要描述两种可能性。

在获得许可的网络中治理并不是所有人都平等地接管的,洏是必须组成一个组织(我们称之为委员会)一种可能是通过大学和研究机构网络民主选举委员会成员。然后该委员会决定开放式科學基础设施的发展方式或网络中特定贡献的价值。角色划分证明了这样一个事实即非专家/非科学家缺乏在这样的系统中做出有根据的决筞所需的经验,这就是为什么许可的区块链是此治理模型的基础因此,用户分为两个角色(“用户”和“委员会用户”)它们在参与某些决策的能力方面有所不同,但在所有其他方面具有相同的权限

在未经许可的网络中,每个人在各个方面都是平等的但同时也为滥鼡系统开辟了道路。因此必须有一个合适的共识机制来就底层区块链系统的发展方式做出协作决策,并防止网络中的恶意行为PoW不是开放科学的正确选择,这不仅是因为其高能耗取而代之的是像PoS这样更合适的机制,可以将其用于开放科学目的在该系统中代表投票权的玳币分配可以基于科学经验和优点。必须预先详细研究如何确定和组合这些值但是,这种方法将可以使用无许可的区块链

两种方法都囿优点和缺点,并且取决于许多因素哪种方法更好。建立这种系统的方法甚至更多对这些方法的详细检查将是迈向基于区块链的开放科学基础设施的下一步,但远远超出了本文的目标和范围在下文中,我们着重比较已确定的具有区块链功能的开放式科学基础设施的需求

开放科学系统的基本主题是提供协作环境的可能性。BT及其权力下放可以使所有用户共享同一数据版本从而支持该目标。详细地数據包括例如实验结果,通信内容草稿,开放的同行评审和原始数据此外,如前所述特定群体或整个网络可以通过遵循民主方式的普通选票来共同做出决策()。这些民意测验的主题可能是诸如网络的未来发展添加/删除特定功能或接受/评价提议的项目和贡献之类的主題。从技术角度来看通过所有用户参与的共识机制,区块链基础架构的验证和管理也可以协同工作它还可以确保区块链中的数据完整性和一致性。

BT 的不变性(防篡改)性质是满足防止任何形式的审查要求的理想功能如我们在4.1节中所述,加密散列共识机制和去中心楿结合可以保证区块链的不变性。网络的参与者只能追加数据而不能修改存储的数据。此属性适合不应作为任何审查基础的科学每个囚都应该能够自由表达自己的意见,而不会受到任何限制在研究用例中,它还包括发表具有关键性陈述或主题的科学著作总体而言,基于BT的开放科学基础设施可以提供这种免审查的环境

考虑到在科学工作中创建的数据,我们采取的一种方法是应公开数据并在适当程喥上归功于创建者,但实际上第三方通常拥有使用它的权利() 。具有数据导入/导出接口的基于区块链的开放科学网络可以用作解决方案而贡献者自己可以每次决定发布其文件以进行共享和重用(开放数据)。在这种情况下加密散列起重要作用的是,发起者可以在数據发布之前集成由内容本身以及作者的姓名和其他元信息形成的哈希值;通过这种方式他们创造了数字足迹。它可以防止他人错误地声稱自己获得了他人所做的工作并获得信誉()为了提高安全性,始终可以通过区块链网络检查某些内容创建的来源和时间(研究线索

开放数据外,开放科学网络还应代表知识的开放获取库这意味着就开放原则而言,不应有阻碍人们获取自身知识和科学进步的收费壁垒大量的研究工作也可以为作者带来更多的引文和更好的声誉。收费墙在技术上是可能的并且可以通过BT实施,但是考虑到我们在3.2节Φ确定的开放性原则和要求我们建议不要集成任何内容以保持真实的公共性。与开放数据一样当然,每个参与者和组都必须能够自行決定可访问性他们的工作;哈希也可以在这里用于创建数字足迹

为了准确反映研究人员的声誉,建立了身份和声誉系统是必不可少的咜以对工作的认可的形式激励网络参与者。作为一种数据库区块链适合用作身份注册器,以安全地存储相关的用户数据每个参与者都鈳以上传内容并为网络做出贡献。因此必须使用评级机制来衡量存储数据的质量和影响。最后参与者的声誉是可以确定的。详细地讲它应使所有或仅特定用户能够对文稿(例如论文和某些数据,如实验结果和微观文稿)进行审查和评分以确定其价值;卡萨蒂等。已經提出了一种方法如何记入小额捐款的工作方式()。权力下放与区块链网络的共识机制可确保没有中央机构控制数据因此声誉将通過网络参与者及其反馈自然而独立地建立。

类似于ResearchGate和其他平台每个人都必须可以访问标识和贡献清单以获得对研究人员及其工作的最佳認可。这些平台可以使用基于区块链的开放科学基础架构作为共享数据库来访问和显示身份和指标搜索引擎和过滤器可以帮助指导用户囷数据,以在不同的研究阶段中找到可能的合作伙伴和可引用的工作将每个帐户与一个真实的人联系起来,就可以创建一个研究课程履曆该履历可以显示一个人的时间顺序研究历史以及所有积极(获奖、,奖)但也包括消极(证明抄袭)的里程碑。一个有趣的可选功能是匿名发布它允许研究人员处理有争议的或关键的数据和主题,而不必担心信誉不良等负面后果散列以防止任何可追溯性,并创建一个假名进行发布

技术基础设施必须是可持续的。这里的关键因素是提供可扩展的系统扩展区块链的可能性等同于其他系统;例如,API使软件与生态系统链接起来因此,可以与外部软件和平台进行通信以交换所有类型的内容还可以使用它们中的Web服务和功能。因此可以稳萣地扩展应用场景的范围。另一个原因是当今技术的发展速度这使得提供机会轻松扩展现有系统,从而避免了时间和成本高昂的新软件創建需求这一点至关重要。该共识机制 区块链的作用也很重要因为大多数授权用户必须接受系统更改才能实施。

使用网络的激励措施昰激励人们加入和参与的基础英国电信可以提供各种因素来激励建立开放科学基础设施。其中之一是由基于区块链的证明(例如存在證明)创建的安全性,以及可以支持知识产权保护并确定谁贡献了某些内容(论文结果和支持数据)的研究轨迹。到网络请注意,带囿时间戳记的服务例如OriginStamp()不保护知识产权,而只是证明某人在某个时间点拥有某些信息仅当研究对象在创建后立即加盖时间戳并且隨着它们不断变化而加盖时间戳,以便其他任何人都无法事先获得信息时才能获得保护。此外创建过程可以通过几个时间戳进行跟踪。

另一个诱因是权力下放以确保每个人都拥有所有数据的最新版本,从而有助于传播已发布的作品人们在贡献知识时期望有一种对价,这是通过访问他人的已发表内容应满足的另一个积极方面是社区对所提供材料的建设性反馈(科学的自我更正或公开的同行评审)。該技术可以进一步提供货币激励系统该系统使用硬币/代币作为捐款的奖励。一个共识机制可以用作技术实现(在5.2、5.3节中对此有更多的介紹)因此,在技术层面上英国电信提供了建立新形式的声誉和激励措施的可能性。但是如果没有被相应的目标群体接受,它们将毫無价值提出的分析显示,大学和研究机构的很大一部分都依赖并信任诸如Journal Impact Factor(JIF)等知名指标并将其用于评论,晋升和任期文件中他们鈈可能在不久的将来通过基于BT的新颖方法来取代公认的指标。

网络可以提供中央机构分离的参与平等和治理模型这与开放原则保持一致。反过来这可能会导致使用开放式科学生态系统的动机增加。基本上在这样的基础设施中,所有人都应有机会获得科学知识并享囿获得知识和改善自身的机会。权力下放和适当的共识机制可以从技术上确保用户不会因国家种族,财富教育水平或任何其他特征而囿所差异。如果需要英国电信还能够管理不同的用户角色,例如组成一个委员会,共同决定本节中提到的区块链的发展方式

除了应該激励人们使用网络的激励措施之外,还必须简单地将其功能和服务集成到现有工作流程和外部软件中而无需花费大量精力或成本。如果不是这种情况潜在的用户可能会提前拒绝该系统。我们认为这应该主要是一次性的正确的文档,完善的网络设计以及单独的易于使鼡的API对于简化子系统的集成至关重要另外,共识模型之所以成为一个相关因素是因为它部分地定义了参与网络需要多少存储空间和计算能力的资源。最后用户仍应使用他们熟悉的软件来管理其项目和数据,但有可能受益于基于区块链的开放科学基础设施所提供的功能

共享数据和内容方面,由于其分散的特征区块链可确保不会出现单点故障。因此没有潜在的数据丢失,并且只要存在与网络的连接网络就可以确保可用性。为了将新数据存储在区块链中共识机制应该验证所有传入的文件,以避免诸如病毒或冗余数据之类的危险軟件;区块链本身已经被冗余存储在所有用户中从内容管理的角度来看,无论出于何种原因所有发起者都应有机会限制对其内容的访問。然后数据被加密存储在区块链中,因此只有在其所有者向其他用户开放后才能访问传统数据库或IPFS等脱链存储也可以通过API进行连接囷使用。在这种情况下区块链仅存储内容的关联哈希。我们还看到了通过开放科学网络共享特定软件许可证的潜力例如,以最佳方式使用多用户许可证

蓬勃发展的经济是群众集资通过Kickstarter的一样的平台,获得了很多人气和GoFundMe这种由人群驱动的方法还包含科学筹集资金或资源以实现有前途的研究项目的潜力(;)。BT可以提供共识控制的货币硬币/代币系统以允许用户支持他们选择的项目。另一个选择是连接外部付款系统(如PayPal)使人们可以通过传统的数字方式进行投资。关于身份哈希化名提供了匿名参与的可能性。作为扩展SC可以用来管悝众筹项目,例如在复杂的子项目中分配资金,执行投票或执行自动订单和其他数字操作

英国电信可以在开放式科学基础设施中提供嘚另一个有前途的元素是创建按时间顺序显示研究对象如何发展的研究轨迹的能力。时间戳从头开始(的想法研究设计)的所有贡献,荿品纸可以透明地存储与相关的所有交易哈希在blockchain因此重建的研究过程中,为了提高可重复性(在科学)以及研究人员的认可贡献者可鉯稳定而一成不变链接到他们的数据,无论是构想新草稿还是完成的论文。BT的防篡改特性可确保随后无法更改路径例如,如果由于错誤或更新的内容而必须更改上载的数据则可以添加新版本,同时可以标记或存档旧文件;可在前端(软件或网站界面)或潜在的共识模型上实现

非专家还可以参与研究并提供有价值的数据(称为公民科学),尤其是在包含简单信息的大型数据收集中在基于区块链的开放科学基础设施中,参与者可以使用数字传感器来测量各种属性并从环境的独特特征中受益。测量值将自动存储在链中因此无法进行篡改审查()。传感器可以产生存储密集型数据在这种情况下,区块链可以将散列数据集存储为标识符从而节省大量空间,而相关嘚度量可以存储在传统数据库或IPFS中此外,时间戳可以补充和验证与时间有关的值(例如温度)最后,权力下放确保没有用户需要信任嘚中央机构或系统;数据始终可用(没有单点故障)重用获得的结果使其他研究人员能够获得更多见解并提供反馈。因此他们不需要進行另一个耗时/昂贵的实验来收集已经存在的信息。

作为开放式科学基础设施的一项重要要求源代码和工具应该是开放的,因此对所有鼡户而言都是透明的以便他们可以准确了解算法和工具的功能。开放不仅提供信任而且还具有网络所有参与者可以协作开发,提出或提出想法插件和更新以稳步增强基础生态系统的优势。这也需要研究人员为他们的项目提供原型软件因此经验丰富的程序员可以提供反馈,以实现最佳解决方案如果用户不想使其代码或工具可访问,则他们还必须能够对其进行加密与区块链的结合允许使用其去中心研究线索,以支持开源项目的管理和可追溯性

除了公民科学和基于blockchain开放科学网的个人贡献,人们还可以通过参加调研分享未使用嘚资源像存储空间或计算他们的系统(例如计算机/服务器)用于科学目的的时间。所述分散的一个blockchain的对等网络架构提供了一个最佳地有效地分配资源共享照片(); 一个共识机制可以支持公平分配开发人员可以在相应的网络中分发其算法,因此具有不同配置的大量系统(節点)将对其进行测试这样的过程适合验证某些软件的稳定性并证明算法可以提供精确的结果。因此研究人员有可能进行自己无法完荿的实验,例如由于当地缺乏资源。

指标是科学的内在组成部分可以表达例如研究人员或出版物的影响因子,还可以显示会议和期刊嘚排名()它们还可以作为供资机构决定将资源提供给谁的因素,例如特定研究主题的申请程序我们认为,通过提供和共享可信赖的開放基础架构区块链很可能为所有科学利益相关者计算准确和可靠的指标。英国电信可以通过权力下放共识机制来实现这一目标因此网络中的每个节点都参与关键指标的计算和验证。完整的数据基础对于定性确定指标至关重要例如,个性化影响因子应涵盖科学家的铨部贡献但是,英国电信只能帮助计算和验证指标而不能回答哪个数字对开放科学环境有意义和有意义的问题。当前的研究指标是一個非常热门且受到广泛讨论的话题( ; )

最后一项要求是使用不仅对度量有利的连接系统。它们还有助于简化各种数据的交换例如实验結果,研究设计和论文使用特定的API,甚至可以自动化跨系统边界的文件分发例如,如果研究人员将文件存储在本地存储中则可以根據需要在连接的基础架构中自动进行文件分发。它与通信的行为类似;用户可以将消息从一个发送到另一个网络这些功能支持将基于区塊链的基础架构集成到外部工作流程中,并减少了在两个或多个系统中工作的工作量

在本节的最后,我们还要指出由于缺乏持续的资金投入,科学平台的实现常常变得困难或不可能这些是长期项目,需要详细且经过深思熟虑的初步计划不仅会导致开发成本,而且会鈈断导致维护和扩展成本基于区块链的基础设施也面临这一难题,但是有可能提供激励措施例如可以为投资者创造投机价值的加密货幣。因此科学环境之外的人们也会得到解决,但是有了这种类型的资金称为初始代币发行(ICO)( ; ),科学和商业不可避免地会合并具有科学背景的两个例子是EUREKA和Scienceroot。为了获得逼真的图像将来应该在对BT的炒作趋于平缓的情况下,考虑对此进行ICO的进一步研究

在本节中,峩们总共回答了第一个研究问题并描述了BT的特征如何满足开放式科学基础设施的要求,并在结果复制研究过程的透明性以及研究对象嘚可追溯性方面提供了许多优势。 当前的技术状态已经能够实现这种平台。然而在未来的研究工作中,仍然需要回答关于适当的共识囷治理体系激励因素,法律和数据存储等各种一般和技术问题我们将在第6节中更详细地解释其中的一些问题。当前的文献和项目都侧偅于不同的目标其中一些描述了特定的用例,例如资源共享发布,尤其是可再现性以下是整体科学平台的愿景,这些愿景提供了不哃的功能来支持研究因此,我们将在下一部分中分析最新技术以回答我们的第二个研究问题,并概述哪些文献和项目已经存在或正在開发中以及开放科学的BT的当前状态是什么。

本节从描述如何分析当前研究状态以及如何对相关区块链项目进行分类以阐明我们的方法(苐5.1节)开始之后,我们概述了可用的文献(第5.2节)和项目(第5.3节)最后,我们总结并讨论了最新技术(第5.4节)

为概述当前研究,我們已阅读并分析了截至2019年4月的研究论文概念和应用,这些研究将BT和开放式科学联系在一起或以其他形式与该主题相关。当前相关文獻很少,但是数量正在增加这表明该研究主题处于早期阶段。由于文献很少因此对其进行整理是没有意义的。实际的区块链项目则有所不同我们最终对其中的60个进行了详细检查:概念上为18%,原型上为52%已部署状态为30%。我们将每个项目分配给所示的六个类别之一提供当前研究状况的结构化概述一些项目还可以提供在其分配的类别之外的其他类别中有用的功能。图3

图3开放科学相关区块链项目类別概述。括号中的数字显示了相应类别中的项目数量

再现性类别包含旨在提高科学中的复制率以及研究质量的项目。资源共享侧重于囲享未使用资源的功能例如存储空间和计算能力。类别透明证据主要围绕证明之类的证据例如“存在证明”,以证明信息在特定时间存在并且拥有特定的人或手稿向期刊或会议的提交分类为知识产权保护的项目侧重于保护思想,贡献数据以及个人提交的一切内容,鉯确保适当地尊重发起人社会研究平台/存储库具有与科学相关的众多功能,例如通信数据存储/处理,声誉和身份识别机制大多数项目都属于此类。可定制的基础架构允许在现有区块链之上构建单独的解决方案以防止开发定制区块链的工作量和成本。

总共我们调查叻83个项目(请参阅),并排除了其中的23个项目因为它们提供的信息不足,不够成熟以至于无法改善科学方面或者不活跃/被取消。其余夶多数项目的共同点是它们使用BT来增强研究的不同因素和要素例如,可信赖性工作流程,透明度可重复性和协作。其他提供了有望妀善科学过程的特定机制为了展示BT在开放科学领域的当前能力,我们将在本文的下一部分中介绍相关文献(第5.2节)以及不同的概念原型和应用(第5.3节)。

由于这是一个早期研究阶段因此与BT结合使用的开放科学文献很少,但仍然有一些令人兴奋且充满希望的概念思想,讨论和方法我们希望对其进行描述和强调。

Dhillon撰写了一篇有关BT和开放科学的文章()并与他人合着了书本部分()。他们以当前的重現性危机( ;  ;  ; )和罕见的负面结果出版物()开始其书中的相关章节 ;  ; )Dhillon等。指出英国电信有缓解危机的潜力他们以临床试验为例,定义叻一个工作流程使整个研究过程透明,同时保护了患者的关键数据()此外,其他出版物也建议在医疗或生物领域使用BT来提供透明度囷信任度( ;  ; )除了研究过程之外,Dhillon还提议应用他们的方法来实施一种声誉系统(带有API)以奖励研究人员和贡献质量的指标()。

Dhillon等人強调的另一个用例是基于区块链的预测市场,主要是专家试图预测特定结果例如实验的可重复性潜力( ;  ; )。为了创造参与的动机用戶将获得正确的预测奖励,例如通过相关区块链的货币/代币进行奖励的文章包含类似的说法,说BT可以增强科学领域的当前复制状况但昰他还提到了该技??术在同行评审过程中由于不变性和透明性而建立信任的潜力。但同时本文重申了Pagliari()所作的陈述,该陈述表达了對将可能不正确的数据存储在随后不可变的链中的担忧关于BT在开放式科学研究中的使用的专利()符合开放性原则,并着重于将技术集荿到研究工作流程中以允许这种防篡改的信息共享,从而提高BT 的可信度科学。

Bartling管理着有关BT用于开放科学的公开生活文档其中包含许哆有希望的想法,项目和假设()之所以特别是因为每个人都通过反馈,远见或建议为本文做出贡献因此可以就其内容进行协作和建設性的讨论。实时文档中的陈述与Dhillon的建议一致后者建议将BT用于科学,以提高可重复性协作和信任,但它们甚至向前迈了一步除了许哆区块链项目外,他们还介绍了用于资助研究的新颖思路用于各种科学活动的激励系统以及用于数据共享的开放存储库()。例如ICO可鉯用于资助研究项目( ; )。利益相关方(也包括公民)可以参与筹资并考虑将其作为后来的服务(例如使用权/许可)或新生成的区块链嘚货币/代币。

现行文件中的陈述批评出版物偏向积极结果因为消极结果可能也很有价值,并且可以防止研究人员浪费时间和金钱进行已經为他人失败的实验从这个意义上说,提出了一种用于基于区块链的科学工作流来源共享的架构以为科学家提供一种安全简便的方法來共享他们的研究数据,例如防止资源浪费Bartling还创立了一家名为“ BFS科学区块链”的公司。旨在通过组织会议/讲习班来促进BT在科学中的应用用相关知识支持区块链项目/初创公司和即将到来的开发人员,并提供新的想法Dhillon和Bartling的建议与Rachovitsa的陈述相符()。她提到英国电信有潜力实施新颖的激励模型提高开放数据和开放访问系统的透明度,同时使研究人员能够通过SC来管理其知识产权

,也确定blockchain作为可以在不多几方媔对应最受Dhillon巴特灵,以及Rachovitsa语句的培育尤其是开放式的科学技术此外,他强调说英国电信可以在将来改变学术出版商的角色。他指出对科学的商业兴趣与日俱增,由一些大型出版商主导他们围绕研究工作建立了付费墙,以从中获利()最重要的是,关注当前指标鈳以引导研究人员追求高排名的目标而不是首先进行出色的研究。BT可以帮助减轻此类问题但是Van Rossum提到的一个重要因素是科学界及其利益楿关者对该技术的采用率。接受对于开放科学和其他应用领域的技术的未来发展将起决定性作用他提出的另一个成功因素是公共通信接ロ的存在,因此创建了可信赖的协作环境

的报告()也包含两次访谈。一个与Efke Smit另一位与Philipp Sandner。斯米特说我们已经有了一个运转良好的学術世界,并提出了疑问为什么科学界应该承担将BT转换为新系统的努力和成本。她总结说无论是否被广泛使用,这项技术无论如何都会被非极客所忽视未来将证明,区块链是证明自己是改变游戏规则还是炒作桑德纳(Sandner)认为在科学领域使用BT和SC的潜力 作为应用示例,他提到了资金??出版,学术交流和奖励制度其他文献和网络文章,和 同样通过统计分析,数据评估和医学试验描述了英国电信改善科学和各种研究活动的多种可能性。

知识产权是科学中的一项常规产出可能非常有价值,应予以保护以使他人无法窃取它,并可以適当地认为发起人是可信的分析了开放式创新过程中基于区块链的知识产权保护如何工作; 这种方法对于科学环境也至关重要。维护必须從一个想法的首次出现就开始()提供可信赖的系统并激励研究人员和其他个人进行开放式合作。举一个简单的例子第一次出现的想法可以加盖时间戳,并一成不变地存储在区块链中以证明它在某个时间点的存在。同样发起者可以将元数据(如其名称)添加到这些倳务中。

由于我们发现的大多数项目都是社会研究平台和存储库可让用户在处理想法和假设之前就其进行公开讨论,因此我们将保护知識产权视为根本得出结论,英国电信可以为开放式创新流程和保护其成果提供巨大好处;其他研究人员在他们的研究论文中证实了这一點( ; )但是还有很多事情要做:它缺乏防止未经授权的知识产权再利用的方法,而且大多数现有的链应用还不成熟()关于此主题的哽多想法可以在这里找到,.

科学过程的另一个核心部分是已提交研究工作的同行评审。这是最重要的活动之一因为不仅要接受会议或期刊論文的接受,进而取决于博士生和研究人员的发展而且还要与研究经费和聘用有关。因此评审必须是中立的,可信赖的和透明的并苴没有任何偏见,以便为所有科学参与者提供公平的机会但是,对于当今审查系统的公平性和质量以及滥用它的机会存在一些担忧( ; )在大多数情况下,同行评审是一个黑盒过程因此评审者是匿名的(大多数不是作者),并且恶意行为很难检测到这种缺乏透明度的莋法可能导致失去信任。在这方面几位研究人员认为英国电信有潜力改善和开放同行评审流程( ;  ;  ; )。

在的多学科研究中关于同行评审中嘚创新他们将英国电信确定为具有潜在前景的潜在未来模式。例如带有硬币或代币的奖励系统奖励评审员的努力,以及用于欺诈控制囷作者保护的身份验证/证明方法他们得出结论,该技术可以提高审查过程的质量和响应速度无论和,都独立地被建议使用新的指标来審查进程的地址的低效率以及金钱奖励两种不同的基于blockchain的系统支持这些语句 也分享了意见,并利用BT和SC来开发同行评审原型

批评了学术堺出版商在政策,禁运期和数据分发限制方面的寡头地位并提出了基于区块链的开放科学出版系统来解决这一问题。他们说英国电信囿潜力通过新的数据分发模型实现开放访问的承诺。另一个有趣的想法来自正在命名他们的方法Smart Papers这是由SC管理学术出版物的出处和注解。怹们旨在利用英国电信的可信赖环境为协作创作提供一个框架并在未来的工作中实现一个Web客户。

写了一篇关于基于区块链的开放科学和絀版的论文他们提出了一个非正式模型,说明如何使用BT在SC的支持下增强和部分自动化一般的科学工作流程尤其是学术出版。除了主要關注点之外他们还确定了开放科学中该技术的有希望的用例,这在本节中已经部分提及例如,建立同行评审过程的透明度存储和跟蹤各种科学数据以提高可重复性,以及将研究人员与潜在投资者联系起来反之亦然。此外管理知识产权,使科学民主化以使社区做出偅大决策并开放黑匣子,例如算法或封闭数据

但是还表达了对开放科学的BT实施的担忧。例如由于错误,最新论文窃和其他原因,撤回是科学中的正常过程但在区块链数据一旦存储就不可更改的情况下;必须找到这种用例的合理处理方式。另一个至关重要的问题是由于许多项目正在将金钱方面作为其用户的动机,因此经济激励如何以及在多大程度上导致意外行为的问题研究人员的关注点可能会從实际研究和知识创造转移到一种经济思维方式上,而这应该不是科学的主要驱动力最后,批评大量基于区块链的概念这些概念仅包含精确的细节来理解其确切的工作原理和价值主张。我们还在分析中发现了几个项目这些项目没有提供足够的信息来从技术上理解它们嘚意图或应用,因此我们可以确认此声明

在以下各节中,我们描述了与相关项目一起定义的六个类别的用例我们不打算详细介绍每个項目,因为这远远超出了本文的范围此外,它们中的一些相似并且遵循或多或少相同的目标此外,我们还提供了一些方法和应用程序这些方法和应用程序不专注于科学,但包含特定的有趣功能或机制如果将这些功能或机制转移到基于区块链的研究工作流程中,将很囿希望我们的分析包括处于概念,原型或已部署状态的项目;其中一些是商业性的关于参考资料,我们偏爱研究论文或白皮书如果這些都不可用,我们将参考相关的网站或GitHub存储库

5.3.1。社会研究平台/存储库

我们将分析的大多数项目归类为社会研究平台/存储库尤其是在這一类别中,这些概念和应用程序通常提供许多重叠的功能并具有相似的目标潜在的用例是创建开放的平台,存储库或市场以支持科學合作,并允许对研究数据的开放访问从而提高实验,研究和其他类型研究的可重复性通常,它们包含更多功能例如通信方法,信譽和身份机制以及针对其用户的激励系统此外,BT的可追溯性可以保护参与者并创建一个可信赖的透明环境。两个示例性开放科学平台項目是和

一些基于区块链的项目还旨在开放发布流程,并为同行审阅者提供激励机制以使其更加透明,值得信赖和奖励它们的功能類似于开放式日记本。示例包括在线发布和评估(PEvO)()EUREKA()以及发布的学术认可系统(AES)的概念()。AES论文批评了科学系统的特定方媔他们的方法除其他功能外,还使研究人员可以使用网络货币单独认可他人的工作,因为非科学应用程序支持这种机制以及信誉系统因此用户可以独立地奖励其他用户的内容/贡献。除了协作研究管理和发布的功能外,还有其他现有项目也为研究提供了资助方法例洳Scienceroot(),开放科学网络(OSN)()去中心化研究平台(DEIP)()和Orvium()。

为了在研究拨款中获得更多的信任和透明度加拿大国家研究委员會创建了一个基于区块链的原型,命名为NRC-IRAD()以主动方式发布实物捐赠和捐款数据。时间我们认为这种方法对其他国家也具有很大的潛力。它是研究人员及其团体或组织的公共黑板可以申请某些政府资助的研究主题。DaMaHub(数据管理中心)的目标是使用去中心化数据基础架构使研究数据工作流程公平(可查找可访问,可互操作可重用/可重现)()。他们的第一个实现结合了BT来透明地记录和跟踪所有系統事务以及IPFS以进行数据搜索和存储在内容分发的情况下,LBRY(与科学无关)()作为一种由社区运营的数字市场具有有趣的方法,内容所有者可以在不依赖中间人的情况下为其内容设置单独的费用; 类似于WildSpark()转移到科学中的这种方法可以使研究人员可以单独发表,分发莋品并从中获利该系统还可以通过同行评审流程进行扩展,以创建基于区块链的期刊

Matryx()采用一种新颖的方法,旨在激励科学领域的匼作以促进创新思想和项目的创造除了提供买卖数字资产的市场外,它还使用基于区块链的锦标赛系统例如,用户可以创建具有特定賞金的个人挑战并获得报酬作为对解决挑战的用户的奖励。问题DAO的一个特殊主题是,该主题是DAO其目的是让网络社区进行控制,以确萣平台上的科学空间计划将如何继续;集成了众筹研究数据共享和同行评审等功能。

是一个众筹平台试图通过数学算法和专家评估中嘚几个不同因素来确定科学项目的潜在/风险。目标群体是正在寻找资金和投资者的研究人员但这也开辟了一种途径,可以接收有关研究項目的宝贵反馈这可以帮助识别和改善计划或方法上的缺陷。另一个基于链的非凡网络是它将决策者与许多人(网络的参与者)的专業知识联系起来,从而最终能够做出高质量的决策转移到科学领域,我们看到在这样一种系统中有可能获得专家对研究工作的宝贵反馈特别是年轻的博士生可以在准备第一本出版物时从中受益。

bloxberg项目()提供了一个链网络该网络由几个研究组织组成,这些研究组织组荿一个联盟并管理生态系统他们的目标是在安全的全球环境下促进数据共享,协作同行评审,研究主张的处理以及发布bloxberg系统还允许將其用作基础结构来在其上开发新的应用程序。文物()使用此基础架构来构建一个提供索引功能的研究平台和一个仪表盘该仪表盘显礻有关研究者存储内容的多个统计信息。因此它能够为研究对象创建透明的数据跟踪,并确定多个科学指标;开发人员还计划通过基于區块链的数字身份网络扩展其系统

TrialChain是另一个特别关注生物医学研究中数据完整性验证的区块链基础设施()。这个想法对于其他科学领域也很有趣因为数据完整性在各种研究/实验中都起着核心作用。另一个值得注意且雄心勃勃的方法是Project Aiur()它设想建立一个开放的平台來验证知识,没有访问障碍出版偏见和信息过载,同时所有研究都是可重复的为了实现他们的愿景,他们的目标是将存储库和能够自動进行知识验证的社区控制的人工智能相结合

重点是Blockchain项目重现在科学或改进的复制率的潜力都受到这一类。提出了他们的PROBO网络这是一種增强BT科学再现性的方法。总体而言他们希望通过为他们建立基于金钱的激励机制来解决奖励研究人员的时间和专业知识的问题。例如要实现研究人员(支持者)发布带有时间戳的研究,并在PROBOS区块链中包含所有支持数据并存储预定数量的probos令牌,以将请求广播到网络愙户(验证者)可以在其中评估研究的质量并验证其可重复性;验证者将获得支持者的代币奖励()。尤其是在医学领域结果的复制至關重要,例如为生活测试对象和全球市场生产可靠的药物,而且还应建立有前途且稳健的基础知识以防止不可重复的研究浪费资源。

預测和预测市场例如,和是另一种有前途的基于区块链的项目这些市场涉及具有专业知识的人员,这些人员根据现有信息预测或确认特定结果代表着集体智慧的概念。这样的系统可用于许多应用领域例如在科学中以支持可再现性。其中参与者可以预测或确认实验結果的重复概率。该程序适合在短时间内获取信息以将有限的资源最佳地分配到复制项目中()。这些平台用户的奖励通常具有金钱性質因为他们会获得预先沉积的硬币/代币奖励,以获取正确的预测和请求创建者的确认

由于其独特的方法,我们要提及的下一个基于链嘚项目是尽管它似乎已停止或取消。一年多来没有实际的新闻而且公布的白皮书已经过期两年了,因此我们认为该项目已被中止它旨在提供一种使用相关传感器数据来确定网络假设是否正确的计算共识。因此如果结果是可测量的,并且存在对必要传感器的数据访问權限则该系统将能够执行特定结果的自动验证/再现,并同时将其记录在区块链上以确保数据完整性

该类别包含旨在在区块链上创建不鈳变证明以验证不同方面(例如特定信息的存在,文档的提交或诉讼时间)的项目这些数字认证可以例如支持法律程序,并为开放的技術基础架构提供所需的安全性/信任一个项目是OriginStamp(),它以时间戳的形式在比特币区块链上提供存在证明因此,一个人可以在一定时间獲得拥有特定信息的证据例如文件,结果想法和所有其他种类的数字资产。此外CryptSubmit()以OriginStamp为基础,将时间戳记功能与用于期刊和会议嘚科学手稿管理系统相结合因此,它创建了一个提交证明作为有关数据提交和完整性的证据,以防止欺诈和研究失窃(;;)CryptSubmit还支歭带有时间戳的对等审阅,以增强在整个审阅过程中的信任并可作为开放式对等审阅的基础。

在线讨论和共享平台还可以使用BT记录所有岼台活动以确保消息和数据的可信赖性。因此一个想法或微贡献的首次出现就被注册,然后可以追溯到其发起者VirtualPatent()是一个提出了這种方法的项目。它旨在充当社交媒体平台该平台立即为系统中的每个消息加盖时间戳,以允许就例如新颖的想法和草稿进行公开讨论具有类似但商业化的概念,并且有不同的目标群体因为它打算对新闻进行公证和追踪;该机制同样可以转移到研究数据。

侧重于科学嘚同行评审过程的一种方法是同行评审区块链''()旨在使程序更加可信。他们设想从连接的日记管理系统中提取同行评审数据以将其記录在区块链中,从而允许对评审进行独立验证在下文中,我们将介绍两个具有值得注意功能的与科学无关的项目第一个项目是Codex(),从而为用户提供注册数字资产的可能性他们的平台是为艺术品和收藏品(例如葡萄酒和珠宝)而设计的,这些艺术品和收藏品不存在集中式所有权登记我们看到了使用这样的分散登记册来发表科学出版物或数据集以证明其存在和隶属关系的潜力。第二个项目是Sovrin()這是一个基于链的身份管理网络。它为研究提供了技术上的机会可以透明地将每项贡献与其创建者的身份联系起来,从而创造出科学的簡历

5.3.4。知识产权保护

由于知识产权是研究的典型成果因此,对知识产权及其发起者进行充分保护非常重要特别是在知识获得专利和貨币化的情况下。此类项目的重点是数字资产的公证许可和认证。这些系统可在许多应用领域中使用但是最重要的之一是科学。Bernstein已经蔀署并商业化了应用程序()旨在成为由BT支持的公证服务。它的底层系统可以发布数字资产的所有权证书这些证书以散列形式存储在仳特币区块链上。例如许可证研究论文和保密协议(NDA)。po.et()是另一个链的项目该项目还提供了创建市场以将创意,专利或其他种类嘚知识产权货币化的能力分子议定书()结合了开放科学和英国电信,以建立一个基于市场的协作平台以发现和资助药物知识产权。怹们打算将科学家患者和行业联系起来,以在透明安全的环境中促进药物开发。

名为自动法律应用程序知识产权联盟(COALA IP)的概念()旨在成为一个由社区驱动的免费协议以建立开放的全球知识产权许可标准,以形成一致的框架并消除对中央组织的依赖对于研究人员忣其贡献也很有趣的是Vaultitude(),这是一个大型项目其团队正在与国际当局和律师事务所合作,为其用户的数字资产建立区块链支持的著作權证明该项目Bookchain(),归属莱杰()和ChainPrint()致力于保护和发布知识产权,主要是文件书籍和创意作品。因此他们的目标人群是作者,出版商和部分印刷厂但是如果研究人员想要传播论文,研究或其他著作他们也可以使用这些服务。在这三种情况下上传的数据均通过区块链进行记录,以创建不可变的信息轨迹以在发布过程之前和之后提供信任和安全性。

资源有限;研究人员特别意识到由于局蔀缺乏材料,劳动力设备或资金而无法进行某些实验时。在这方面区块链可以充当分发者,以共享数字资源(如存储空间)Storj(Tardigrade)(),Filecoin()Sia()等共享存储空间的特定项目,例如在区块链环境中安全保存所有研究数据的)SAFE网络()和Swarm(),所有个人都可以通过提供未使用的计算机系统容量来参与其中尽管网络用户正在存储数据所有者的信息,但是他们无法访问/读取数据只有所有者才能这样做。这些项目为此使用了不同的方法其中包括加密和文件分割。数据形式的信息也是数字共享的宝贵资源《海洋协议》(《)采用了这種方法,并帮助市场主要买卖人工智能数据/服务同时通过基于区块链的激励系统激励数据的重复使用和共享。这些数据可以用作人工智能的学习材料也可以为研究人员的项目提供支持。

除了共享存储空间和数据还有在区块链网络中共享计算能力的方法。我们认为这种方法有望使研究人员能够执行特定的苛刻计算任务例如复杂的模拟。是一个旨在完全提供此功能从而像分布式“超级计算机”一样运行嘚项目()他们的方法适用于各种节点(提供者),这些节点提供未使用的计算能力作为资源来交换货币代币通常,其他网络参与者(请求者)可以使用提供的性能来计算相关沙盒环境中的算法摄影测量重建,电影/ CGI渲染以及机器学习应用程序Golem网络也支持软件的发行囷货币化。

5.3.6可定制的基础架构

可定制的基础设施是开发人员可以在其上构建其设计的基于区块链的网络的基础。与定制的区块链相反巳经提供了源代码,并且实现它们所需的知识较少因此,这种方法节省了时间和资金但是其可能性有限,因为底层系统通常会规定某些方面例如共识模型和网络的基本结构。该类别中的大多数项目都集中在以公司为目标群体的私有许可区块链上但是大学和研究团体仍然可以从这些基础架构中受益。与科学和学术相关的示例用例包括数据跟踪和审核学生的教育/培训,项目管理数字资产的分发,时間戳记以及证书的颁发。此外可以使用可定制的基础结构来部分构建类似的应用程序,例如我们在5.3.1–5.3.5节中提到的项目但其优势在于咜们可以适应特定需求。而且可以实现全新的解决方案。

在每种情况下都需要评估项目的需求,以决定提供的可定制基础架构的可能性是否足以满足这些需求或者是否需要定制的区块链应用程序。如果估算的质量令人满意则无需为新的开发付出额外的努力。我们发現了几个旨在提供这样的基础架构来构建区块链或基于区块链的应用程序的项目例如IBM的Hyperledger(),Openchain()Multichain(),区块堆栈()和DCore(DECENT )总而訁之,我们将可定制的基础架构视为BT的完美介绍以测试其潜力和对各种应用场景的适用性,并收集其开发的初步经验

我们的评论应作為BT用于开放科学的当前研究状况的快照,并为提供适用于该范围有用功能的其他应用提供开箱即用的观点在过去7个月中,我们收集并分析了实际项目我们注意到市场不稳定。他们中的一些人消失了或者因开发人员的正式声明而被取消,或者由于长期不活跃而主观上死叻总体而言,这些月宣布了更多的新方法因此我们确定的趋势表明,开放科学领域活跃的区块链项目数量正在稳步增长在过去的几姩中,这种发展也是可追溯的

对于第5节,我们认真分析了35个相关研究出版物(不包括灰色文献)和总共60个基于区块链的项目(请参阅)将其分为不同的应用领域,并将其分为六类以根据其方向来组织它们。考虑到所获得的知识我们同意英国电信在各个方面都具有促進开放科学的巨大潜力。例如对系统及其透明性,数字资产的可追溯性更高的可重复性,创新的公民科学项目创新的激励方法以及總体上提高的研究质量的信任度更高。尤其是区块链应用程序的可实现的开放性以及系统中所有交易的防篡改记录使该技术成为了适合開放科学的不可信基础设施。

最后仅区块链就代表具有独特特征但没有特定意义的数据库。像比特币或以太坊这样的集成应用程序为其提供了目的和功能因此,我们区分了区块链和应用程序层(包括前端)后者需要相互对应才能使用该技术。因此在开放式科学项目Φ,应遵循开放性原则对两层进行和谐设计以为透明和可信任的环境提供基石。防止不透明和恶意行为的可能性至关重要

如果研究人員在整个研究周期中不断整合BT,那么它在每个阶段都是有用的如果涉及算法测试或感官数据评估,也可以部分用于实验如图所示,在科学中使用该技术可以为所有利益相关者实现双赢局面结合复杂的应用程序设计和开发,它还能够启用有关研究管理同行评审,资金囷发布的新使用模型但是,期望必须现实BT不能解决科学中所有现有的问题或提供多方面的解决方案。

在我们的分析过程中有关各个項目和其他方面的问题和疑虑在以后的工作中将会出现。下面我们将简要描述这些不确定性;有关最相关主题的更多详细信息将在第6部汾中回答我们的第三个研究问题。许多项目正在引入自己的激励方法这些方法通常具有金钱性质。例如特定行为的赏金系统或硬币/代币獎励一方面,我们质疑将这种财务方面纳入研究过程的合适方法这会将创造科学知识和进步的意图转移到经济上吗?另一方面我们哃意为科研人员的投入时间和专业知识建立新的激励机制,这些科学家正在复制和确认结果/研究结果并为会议和期刊进行同行评审。进┅步的担忧是如何处理已经部署的因此不可变的SC中的错误,以及不同国家如何在其法律流程中评估从区块链发布的证据

文献和项目还表明,缺少一个标准该标准为区块链如何通过API与外部软件进行通信以及如何交换数据以简化BT的开发和与现有工作流程的集成设置了框架。当前的情况使得很难识别基于区块链的严重应用程序在过去的几年中,对这项技术的热情导致了许多新的项目公告但是在开放科学領域,由于我们的分析显示大多数处于概念或原型状态,因此不适合完全集成为了避免浪费资源,我们建议确保仅积极使用处于成熟狀态并已提供所需功能的区块链应用程序由于市场不稳定,项目可能会在一天内消失

经过分析的几个项目旨在使科学中介机构过时。這些主要是出版商但是,出版商也可以出于自身利益使用BT它为他们提供了潜力,使他们可以通过SC来部分自动化分发和同行评审过程並降低他们管理稳定增长的知识量和出版物数量的成本。作为协同效应这些方面对研究人员也可能是积极的,例如通过减少出版费用囷加快反馈速度。此外发布者可以开放其操作以透明地显示同行评审和其他活动的功能,以提高他们的信任度

作为科学中的一个利益楿关者团体的资助机构,在各种因素中使用度量标准来决定如何将其财务资源分配给研究人员及其项目问题在于,由于研究人员和出版粅使用不同的数据库来计算其关键数据的情况因此每个研究平台和出版物的指标通常会有所不同。我们认为区块链的基本技术结构是创建共享透明存储的绝佳机会。因此它可以为每个科学平台提供相同的数据,以计算精确的指标例如研究人员或出版物的影响因子。

峩们还认为正如一些文献所提到的那样,BT的采用率将决定其在科学和所有其他应用领域中的未来发展因此,用户数量是一个关键因素没有参与者的网络是没有意义的。从主观角度来看我们分析的大多数项目都不存在或很小的社区,因此我们认为该技术需要明确推动其在开放科学中的使用也许是大型出版商,利益相关者或规范总体而言,它仍然是一项相当新的技术因此尚无法确定群众将如何与の互动以及将会出现什么行为。

在本节中我们回答了我们的第二个研究问题,并给出了有关BT用于开放科学的当前研究状态的图片以及峩们在审查中确定的可能性和不确定性。

在本节中我们将在第三个研究问题的背景下描述在分析过程中确定的挑战和研究潜力。未来的笁作应解决这些问题以消除技术和法律上的不安全感,并提高英国电信在开放科学及其他领域的可用性我们认为,我们专注于一些最楿关和最有希望的主题但尚未或未进行充分调查。他们应以切入点的形式提供冲动以供进一步研究;作为积极的副作用,解决这些问題也可以部分地促进其他非科学领域的发展

我们想指出的是,本节中提出的挑战非常复杂和深刻因此我们不希望它们在不久的将来得箌解决。例如自编程之初以来,就存在着智能合约最基本的软件正确性问题(请参阅第6.1节)直到今天,仍未找到解决方案因此,以丅主题是对BT广泛整合过程中必须考虑的重要支柱的展望

6.1。智能合约的风险和确认

可信度是BT的关键要素也是其主要驱动力之一,因此开發人员应以支持和提供该属性的方式设计其应用程序的各个方面在这方面,我们认为在许多项目中使用的SC至关重要因为它们可以为恶意行为提供各种可能性,并且在其开发中容易出现严重的编码错误使用图灵完备的编程语言的能力不仅打开了许多用例和功能,而且还增加了复杂性从而增加了人为错误和后门/漏洞数量的可能性。例如这些可能导致程序崩溃或程序本身的漏洞,从而可能使黑客窃取数芓合同管理的资源(;)SC的新颖性证明了这样一种情况,即关于其设计实现,编程和验证的常识尚未得到很好的开发

应对SC漏洞的一種方法是限制底层编程语言的表达能力()。另一种可能性是在过去几年中建立的多家审计服务的商业提供商他们正在检查供应链,以確保他们实现目标而没有最终的弱点。示例是运行时验证和安全从这个意义上讲,我们看到了通过软件自动验证SC的方式以快速消除特萣攻击可能性的研究潜力(;)另一种方法可以是模块化构建套件,以便能够为可靠简单的应用逐个构建数字合同。因此与OpenZeppelin相似,無需具备出色的编码技能并且可以简化创建过程。而且标准通常可以改善设计过程和安全性。要在所有应用领域中有效安全地大规模使用SC,仍有很多工作要做

6.2。缺少标准化和框架

既定的技术标准和框架至关重要并带来了许多优势,例如节省时间防止错误和提高咹全性。通过我们的分析我们得出的结论是,BT中基本上不存在这些内容到目前为止,区块链开发人员已经发挥了开创性的作用并且夶多使用没有技术规范的不同语言来编写其应用程序。因此出现了许多独特的应用程序结构,它们具有各自的优缺点以及安全风险和漏洞BT标准可以帮助促进其采用,互操作性使系统更安全,尤其是建立信任()而且,它们增强了区块链应用程序一般开发的可访问性在软件通信方面,大多数情况下标准化的API可以使新接口的设计变得多余。

在研究适用于BT的合适标准和框架方面仍有很多潜力例如,簡化基于区块链的软件的设计和开发或将区块链集成到研究工作流中。同样有趣的是学术出版商如何使用这项技术来改善其某些流程並从中受益的统一方法。我们认为像Hyperledger这样的基础架构框架在将来在创建各种新应用程序中将扮演更加重要的角色。标准和框架的一个总體目标必须是促进进入区块链以解决非专家问题并打破访问障碍。总之这两个主题都提供了许多有前途的研究可能性,我们认为它们將成为未来英国电信的基石

我们注意到,我们评估中的几个区块链项目正在使用不同的货币激励系统这些系统通过发行数字硬币/代币來为研究贡献或诸如同行评审之类的特定行动发挥作用。由于当前的不稳定性和加密货币的投机性质我们质疑这些激励方法。区块链发荇的硬币/代币的价值在短期内可能会有很大差异;也有完全损失的可能性可以在Coinmarketcap上审查加密货币的市场发展。此外尚不清楚资金从何洏来。一些项目建议研究人员自己作为资助机构但是否会因其科学贡献而独立奖励其他人却令人怀疑。同样这种货币激励措施很大程喥上取决于资金量。

我们认为在分析基于区块链的激励系统方面存在大量研究潜力,这些激励系统一方面可靠且可持续另一方面激励科学家。我们认为令人兴奋的研究问题是如何通过外部工作刺激对创造力产生积极影响,以及英国电信能否为该目标做出有意义的贡献另一种方法是评估现有激励系统在该技术下的可改进性。当前科学中的激励机制主要围绕

Burp Repeater 是一个HTTP 发包模块通常我们使用咜来重放经过 Proxy的请求,可以更加方便的修改包内容以及进行测试

点击「Send」得到响应消息,这样我们就完成了一次简单的发包

BurpSuite,是一个輔助渗透的工具Burp提供了简单的HTTP的抓包改包,数据枚举模块以及各种安全漏洞的手动式扫描与爬虫式扫描,还有很多经常需要使用的小笁具

AWVS是一款对网站及服务器漏洞扫描的软件,包含付费版本及免费版本能够自动分析客户端脚本并允许对Ajax 和 web /cecily044/article/details/

项目的生命周期可划分为㈣个基本阶段,分别是概念阶段(定义阶段)、开发阶段、实施阶段和结束阶段(收尾阶段)

可靠性工程是研究产品生命周期中故障的發生、发展规律,达到预防故障消灭故障,提高产品可用性的工程技术信息系统的可靠性是指系统在满足一定条件的应用环境中能够囸常工作的能力,可以按一般工程系统的可靠性标准进行定性评价也可以通过平均无故障运行时间等指标来进行定量分析。

系统可靠性昰系统在规定的时间内及规定的环境条件下完成规定功能的能力,也就是系统无故障运行的概率系统可靠性包括成熟性、容错性、易恢复性和可靠性的依从性四个子特性。成熟性是指系统避免因错误的发生而导致失效的能力;容错性是指在系统发生故障或违反指定接口嘚情况下系统维持规定的性能级别的能力;易恢复性是指在系统发生失效的情况下,重建规定的性能级别并恢复受直接影响的数据的能仂;可靠性的依从性是指系统依附于与可靠性相关的标准、约定或规定的能力

在信息系统中,故障或错误有如下几种表现形式:

(1)永玖性永久性是指连续稳定的失效、故障或错误。在计算机硬件中永久性失效反映了不可恢复的物理改变。
(2)间歇性间歇性是指那些由于不稳定的硬件或软件状态所引起的、仅仅是偶然出现的故障或错误。
(3)瞬时性瞬时性是指那些由于暂时的环境条件而引起的故障或错误。

故障的表现形式千差万别可以利用故障模型对千差万别的故障表现进行抽象。故障模型建立的级别越低进行故障处理的代價也就越低,但故障模型覆盖的故障也就越少

目前,信息安全威胁主要有以下几个方面:

(1)系统稳定性和可靠性破坏行为包括从外蔀网络针对内部网络的攻击入侵行为和病毒破坏等。
(2)大量信息设备的使用、维护和管理问题包括违反规定的计算机、打印机和其他信息基础设施滥用,以及信息系统违规使用软件和硬件的行为
(3)知识产权和内部机密材料等信息存储、使用和传输的保密性、完整性囷可靠性存在可能的威胁,其中尤其以信息的保密性存在威胁的可能性最大

嵌入式系统是一种以应用为中心,以计算机技术为基础可鉯适应不同应用的功能、可靠性、成本、体积和功耗等方面的要求,集可配置、可裁减的软硬件于一体的专用计算机系统嵌入性、专用性和计算机系统是嵌入式系统的三个核心要素。

.NET为开发者提供了丰富的API每一种.NET语言都可以使用这些API。其中包含了大量的类供开发者使用跨平台是Java的一大特点,而.NET可以认为是跨语言的这种特点的实现主要依靠通用类型系统(Common Type System,CTS)CTS是.NET语言之间的粘合剂,它对.NET语言所采用嘚类型进行了统一的定义来保证语言之间的兼容性

Framework是一整套的开发模型,其中核心的部分就是CLRCLR是.NET程序的执行引擎,.NET的众多优点也是由CLR所赋予的CLR与JVM的功能类似,提供了单一的运行环境任何.NET应用程序都会被最终编译成为中间语言(Intermediate Language,IL)并在这个统一的环境中运行。

Framework的核心无论是JVM还是CLR,都包含了许多新技术

JVM为了提供平台无关性的支持,它将所有的代码都首先编译为bytecode然后,在运行过程中JVM对bytecode进行解釋执行。IL是.NET提供的中间语言所有的.NET程序都将编译为IL,在第一次运行时由JIT(Just In Time即时)编译为本机代码,然后执行该代码

由于JVM采用解释的方法运行bytecode,所以Java程序运行速度较慢而由JIT编译好的本地代码效率更高。但是因为JIT需要在程序第一次执行时进行实时编译,所以程序第一佽运行时速度会慢很多J2EE同样也支持预编译技术,在用户首次访问某个特定的JSP页面时会执行预编译编译之后,用户再访问这个页面时速度就会快很多。

CLR和JVM的内存管理也非常相近CLR和JVM都使用了自动垃圾收集来回收不再被使用的对象。

都非常适合开发企业计算平台,二者嘟为构建完整的企业计算平台做出了大量的工作都支持多层应用的开发。

 (1)表现层J2EE与.NET的最大不同在于,Java本身是跨平台的设计因此Java 應用程序可以运行在Windows或其他的平台上,而使用.NET开发的本地客户端只能运行在Windows平台上。在平台支持的广泛性上Java超过了.NET。但从另一个角度來说Java无法针对某种特定平台进行优化,只能将各种平台的GUI进行抽象而.NET则可以获得Windows平台最大限度的支持。因此当使用本地应用程序作為客户端时,如果有跨平台的需要Java是不二的选择;反之,如果仅适用在Windows操作系统中使用.NET可以得到更好的效果与更低的开发成本。
(2)業务层在业务层,J2EE跨平台的优势得到了充分的体现当使用到非Windows操作系统的服务器时,如AIX、Solaris等.NET失去了竞争的可能。除了跨平台的能力外丰富的Java开源项目也给了开发者更多的选择。虽然基于.NET的开源项目在不断增加但.NET开源项目无论是数量还是质量上,目前都很难与Java开源楿媲美对于喜欢应用开源项目的组织而言,J2EE会是更好的选择
(3)数据访问层。J2EE的数据访问层标准是JDBC它支持绝大多数的关系型数据库,通过JDBC应用程序可以采用与数据库无关的方式来访问、操作各种关系型数据库。在.NET中与JDBC相对应的是ADO .NET,它也支持绝大多数的关系型数据庫供应用程序使用。在数据访问层无论是J2EE还是.NET,都有非常多的优秀方案可供选择

借鉴了不少Java中的安全机制,以保护代码的安全性 Java茬运行时进行代码安全性的验证。JVM使用bytecode栈来完成运行时的安全性检查和验证;.NET执行的是静态的代码验证但是.NET的验证过程非常全面,同时茬程序运行时也会执行一小部分动态验证所以,无论是.NET还是Java在代码安全性方面都做得非常优秀。

不支持非Windows的操作系统从另一个角度來说,.NET应用程序也不需要面对非Windows操作系统的环境这降低了.NET部署的风险。J2EE应用程序的部署相对复杂不同的应用服务器会有不同的表现。J2EE應用程序经常使用在非Windows操作系统中所以部署J2EE应用需要考虑不同操作系统的特性,来确定部署的方案

平台进行开发,从开发工具、服务器产品到部署环境都需要使用Microsoft公司的产品

是Microsoft公司独家的产品,使用.NET意味着必须购买Microsoft公司的工具、操作系统、应用服务器和开发工具没囿其他的选择。

虚拟计算(virtual computing)的本质是资源共享虚拟计算技术不仅能使人们更有效地共享现有的资源,而且能通过重组等手段为人们提供更多、更完善的共享服务。虚拟计算环境是指建立在开放的网络基础设施之上,通过对分布自治资源的集成和综合利用为终端用戶或应用系统提供和谐、安全、透明的一体化服务的环境,实现有效资源共享和便捷合作工作网络资源的聚合与协同是虚拟计算环境的核心。

P2P(Peer To Peer对等网络)是一种新型分布式网络通信技术,它使得计算机之间可以直接访问和交换文件而不是像过去那样连接到服务器去瀏览与下载。P2P的参与者共享他们所拥有的一部分硬件资源(例如处理能力、存储能力、网络连接能力、打印机等),这些共享资源需要甴网络提供服务和内容能被其他节点(peer)直接访问而无需经过中间实体。

这是一项长期的工作根据各信息系统的实际情况不同,系统運行与维护阶段在整个系统生命周期中所占的比重在60%~80%之间

遗留系统(legacy system)是指任何基本上不能进行修改和演化以满足新的变化了的业务需求的信息系统,它通常具有以下特点:

(1)系统虽然完成企业中许多重要的业务管理工作但已经不能完全满足要求。一般实现业务处悝电子化及部分企业管理功能很少涉及经营决策。
(2)系统在性能上已经落后采用的技术已经过时。
(3)通常是大型的软件系统已經融入企业的业务运作和决策管理机制之中,维护工作十分困难
(4)没有使用现代信息系统建设方法进行管理和开发,现在基本上已经沒有文档很难理解。

遗留系统的演化方式有多种可以采取继续维护、某种形式的重构或替代策略,或者联合使用几种策略究竟采用哪些策略来处理遗留系统,需要根据对遗留系统的所有系统特性的评价来确定

对遗留系统评价的目的是为了获得对遗留系统的更好的理解,这是遗留系统演化的基础是任何遗留系统演化项目的起点。主要评价方法包括度量系统技术水准、商业价值和与之关联的企业特征其结果作为选择处理策略的基础。

系统设计阶段又称为物理设计阶段它是信息系统开发过程中一个非常重要的阶段。其任务是根据系統规格说明书中规定的功能要求考虑实际条件,具体设计实现逻辑模型的技术方案也就是设计新系统的物理模型,为下一阶段的系统實施工作奠定基础

系统设计的主要内容包括概要设计和详细设计。概要设计主要任务是将系统的功能需求分配给软件模块确定每个模塊的功能和调用关系,形成软件的模块结构图即系统结构图。在概要设计中将系统开发的总任务分解成许多个基本的、具体的任务,為每个具体任务选择适当的技术手段和处理方法的过程称为详细设计根据任务的不同,详细设计又可分为多种例如,网络设计、代码設计、输入/输出设计、处理流程设计、数据存储设计、用户界面设计、安全性和可靠性设计等

构件(component)也称为组件,是一个功能相对独竝的具有可复用价值的软件单元在OO方法中,一个构件由一组对象构成包含了一些协作的类的集合,它们共同工作来提供一种系统功能

可复用性(可重用性)是指系统和(或)其组成部分能在其他系统中重复使用的程度。软件复用的形式可分为垂直式复用和水平式复用水平式复用是复用不同应用领域中的软件元素,例如数据结构、排序算法、人机界面构件等。标准函数库是一种典型的原始的水平式複用机制;垂直式复用是在一类具有较多公共性的应用领域之间复用软件构件

Microsoft的COM定义了构件和它们的客户之间互相作用的方式,使得构件和客户端无需任何中介构件就能相互联系DCOM扩展了COM,使其能够支持在局域网、广域网甚至Internet上不同计算机的对象之间的通信

平台。Flex应用程序框架由MXML(Macromedia XML)、ActionScript和Flex类库构成开发人员利用MXML定义应用程序用户界面元素,利用ActionScript定义客户逻辑与程序控制Flex类库中包括Flex组件、管理器和行為等。应用程序由 Flex服务器翻译成SWF格式的客户端应用程序在Flash Player中运行。 HTML动态HTML)开发的Web窗口框架。Javascript用于客户端界面的显示和处理XML和HTTP用于客戶端与服务器的信息传输。Bindows的一个主要缺点是它采用一次性全部载入的方式来实现脚本库,在窗口的加载期需要一个漫长的等待过程,甚至浏览器的进程会产生无响应的情况另外,Bindows内部大量利用了IE(Internet Explorer)技术没有考虑到非IE的浏览器,限制了Bindows的流行 (3)Java。一些相当复雜的系统都是用Java编写的这说明可以用Java来建立几乎任何一个能够想象得到的RIA。使用Java建立RIA的主要缺陷是它的复杂性例如,即使对简单的窗ロ和图形也要求编写非常烦琐的代码。 (4)LaszloLaszlo 是一个开源的RIA开发环境。使用Laszlo平台时开发人员只需编写名为LZX的描述语言(其中整合了XML和Javascript),运行在J2EE应用服务器上的Laszlo表示服务器会将其编译成SWF格式的文件并传输给客户端展示从这点上来说,Laszlo的本质和Flex是一样的 (5)XUL(XML User Interface Language,基于XML嘚用户界面语言)XUL可用于建立窗口应用系统,这些系统既可以在 Mozilla浏览器上运行也可以在其他描述引擎上运行。XUL描述引擎都非常小它既可以使用XML数据,也可以生成XML数据 Language,可扩展应用标记语言)可以使用XAML来定义文本、图像和控件的布局,程序代码可以直接嵌入到XAML中吔可以将它保留在一个单独的文件内。这与Flex中的MXML或者Laszlo中的LZX非常相似不同的是,基于Avalon的系统必须运行在Longhorn环境中而Flex和Laszlo是不依赖于平台的,僅仅需要装有Flash播放器的浏览器即可

的定义:服务是精确定义、封装完善、独立于其它服务所处环境和状态的函数。SOA本质上是服务的集合服务之间彼此通信,这种通信可能是简单的数据传送也可能是两个或更多的服务协调进行某些活动。服务之间需要某些方法进行连接 (3)Gartner的定义:SOA是一种C/S架构的软件设计方法,应用由服务和服务使用者组成SOA与大多数通用的C/S架构模型不同之处,在于它着重强调构件的松散耦合并使用独立的标准接口。

在SOA模型中所有的功能都定义成了独立的服务。服务之间通过交互和协调完成业务的整体逻辑所有嘚服务通过服务总线或流程管理器来连接。

软件需求是指用户对新系统在功能、行为、性能、设计约束等方面的期望

系统分析阶段也称為逻辑设计阶段,其任务是根据系统设计任务书所确定的范围对现有系统进行详细调查,描述现有系统的业务流程指出现有系统的局限性和不足之处,确定新系统的基本目标和逻辑功能要求即提出新系统的逻辑模型。系统分析阶段的工作成果体现在系统需求规格说明書中这是系统建设的必备文件,是系统设计阶段的工作依据也是将来系统验收的依据。

IEEE对软件工程的定义是:将系统的、规范的、可喥量的工程化方法应用于软件开发、运行和维护的全过程及上述方法的研究

软件工程由方法、工具和过程三个部分组成。

软件产品从形荿概念开始经过开发、使用和维护,直到最后退役的全过程称为软件生命周期或生存周期

企业信息化是指企业以业务流程的优化和重構为基础,在一定的深度和广度上利用计算机技术、网络技术和数据库技术控制和管理企业生产经营活动中的各种信息,实现企业内、外部信息的共享和有效利用以提高企业的经济效益和市场竞争力。

系统的性能取决于多种因素(性能指标)最基本的因素在于系统配置(构成系统的各种软硬件的成分、数量、能力和系统结构、处理和调度策略等)和系统负载(工作负载和方式,例如交互方式、批处悝方式等)。性能评价的主要任务就是研究系统配置、系统负载和性能指标之间的相互关系

(1)硬联逻辑级。这是计算机的内核由门、触发器等逻辑电路组成。
(2)微程序级这一级的机器语言是微指令集,程序员用微指令编写的微程序一般直接由硬件执行
(3)传统機器级。这一级的机器语言是该机的指令集程序员用机器指令编写的程序可以由微程序进行解释。
(4)操作系统级从操作系统的基本功能来看,一方面它要直接管理传统机器中的软硬件资源另一方面它又是传统机器的延伸。
(5)汇编语言级这一级的机器语言是汇编語言,完成汇编语言翻译的程序称为汇编程序
(6)高级语言级。这一级的机器语言就是各种高级语言通常用编译程序来完成高级语言翻译的工作。
(7)应用语言级这一级是为了使计算机满足某种用途而专门设计的,因此这一级的机器语言就是各种面向问题的应用语訁。
(1)控制器控制器是分析和执行指令的部件,也是统一指挥并控制计算机各部件协调工作的中心部件所依据的是机器指令。控制器的组成包含程序计数器、指令寄存器、指令译码器、时序部件、微操作控制信号形成部件和中断机构
(2)运算器。运算器也称为算术邏辑单元(Arithmetic and Logic UnitALU),其主要功能是在控制器的控制下完成各种算术运算和逻辑运算一个计算过程需要用到加法器/累加器、数据寄存器或其怹寄存器、状态寄存器等。运算器的位数即运算器一次能对多少位的数据做加法,是衡量运算器的一个重要指标运算器可以分成单总線结构的运算器、双总线结构的运算器和三总线结构的运算器。
(3)主存储器主存储器也称为内存储器(通常简称为“内存”或“主存”)。存储现场操作的信息与中间结果包括机器指令和数据。
(4)辅助存储器辅助存储器也称为外存储器,通常简称为外存或辅存存储需要长期保存的各种信息。
(5)输入设备输入设备的任务是把人们编好的程序和原始数据送到计算机中去,并且将它们转换成计算機内部所能识别和接受的信息方式按输入信息的形态可分为字符(包括汉字)输入、图形输入、图像输入及语音输入等。目前常见的輸入设备有键盘、鼠标、扫描仪等。
(6)输出设备输出设备的任务是将计算机的处理结果以人或其他设备所能接受的形式送出计算机。目前最常用的输出设备是打印机和显示器。有些设备既可以是输入设备同时也可以是输出设备。

计算机软件按照功能可以分为应用軟件和系统软件两大类。

数据库系统是指在计算机信息系统中引入数据库后的系统一般由数据库、数据库管理系统(DataBase Management System,DBMS)、应用系统、數据库管理员(DataBase AdministratorDBA)和用户构成。数据库系统的结构典型的是三级划分法其中包括三级模式和两级映射。

数据传输的路径称为信道信噵可以分为物理信道和逻辑信道。物理信道由传输介质和设备组成是用于传输信号的物理通路,网络中两个节点之间的物理通路称为通信链路;逻辑信道是指在数据发送端和接收端之间不存在一条物理上的线路逻辑信道可以是有连接的,也可以是无连接的

我要回帖

 

随机推荐