现在,只要登录一个网站,你就可以获取超过份关于冠状病毒的研究文献。这对于正在研究新冠病毒的科学家来说,是一个省事又省力的好工具。
当地时间3月16日,美国多家研究组织人员联合发布了关于冠状病毒的开放研究数据库,该数据库的论文来自同行评审期刊,非同行评审的预印本论文网站bioRxiv和medRxiv等。目前,这个数据库涵盖了SARS-CoV-2(新冠病毒),Covid-19(该疾病的科学名称)和冠状病毒组等多方面内容。也就是说,这个数据库几乎包含了与新冠病毒相关的最全科学文献。同时,这个数据集还能实时更新,发布更多的研究论文。
据了解,该数据库是在美国白宫科学技术政策办公室(OSTP)的要求下,通过三个组织之间协作而完成的。其中,美国国立卫生研究院的国立医学图书馆(NLM)提供了对现有科学出版物的访问权限;微软则利用其文献策划算法来帮助查找相关论文;非营利组织艾伦人工智能研究所(AI2)提供了可将研究论文从网页转换为PDF格式的算法处理能力。目前,该数据库可以在AI2的SemanticScholar网站上找到。
Semanticscholar跟谷歌学术搜索功能类似。它是AI2结合了自然语言处理和计算机视觉的新学术搜索引擎。但相比谷歌学术搜索,SemanticScholar更加精确,简洁明了,它的搜索结果会显示关键信息,例如作者,方法,数据和引文,使科学家可以更轻松地快速评估每篇论文。
值得一提的是,AI2还使用ELMo和BERT等最新的自然语言模型来描述论文之间的相似性。同时,该数据库还有一项新功能,可以帮助研究人员,根据自己的兴趣创建个性化的研究摘要。
世界卫生组织(WHO)和美国疾病控制和预防中心(CDC)表示,他们希望为更好地了解新冠病毒的起源和传播提供帮助,以协助开发疫苗和治疗方法。
在白宫工作的美国首席技术官MichaelKratsios在一次电话会议上告诉记者,他们希望计算机能够比人类更快地扫描研究结果,并发现人类可能错过的发现。
报道指出,机器学习(Machinelearning)是人工智能的一种形式,其软件被设计用于自行检测数据中的模式,目前已被医疗保健和其他行业用于从大量文本中开发摘要。但在它能够有效地得出结论之前,有时需要分析数百万个类似的内容。
来源:澎湃新闻,环球时报
End
声明:本