我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:高清跑狗图 > 读字段 >

IrisAI:让人工智能成为你的科研助手

归档日期:06-12       文本归类:读字段      文章编辑:爱尚语录

 作为P2P网贷的发源地,英国一直是发展金融科技的沃土,近年来也不断涌现出众多优秀企业。上个月,未央团队赴英国学习游览,探访了当地一系列代表性的金融科技公司,在此陆续为你呈现他们的商业模式与创新之处。本文为系列报道第六篇。

 Iris.AI成立于2015年,该公司致力于通过人工智能帮助企业研发部门或高校的研究人员来进行学术论文的筛选,成为人们的科研助手。根据统计,每天会有超过3000篇学术论文发表。如何在较短时间内,在数以百万并且每日不断出新的学术论文中找到与自身研究课题最为相关的资料,是研究人员一直苦恼的事情,而Iris.AI则希望通过人工智能,帮助研究人员解决这一问题。

 目前,Iris.AI已经发布2.0版本,主要通过对用户输入的字段或论文摘要进行学习,从中提取包含了语义背景的关键概念,并以此来帮助用户找到相关度较高的话题及其他论文资料。用户在输入论文链接后,便能够在短时间内获取Iris.AI所构建的知识图谱。

 Iris与传统利用关键词进行搜索的工具的不同之处在于,其结合了该词汇在段落中的具体含义,因此能够筛选出更为相关的论文资料。Iris首先通过TF-IDF(term frequency–inverse document frequency)算法择取文本中的关键词,这里的文本即为论文的摘要部分;而后将这些关键词与其具体语境语义相结合;最后通过算法将这些带有语境的概念分类集群,而这些全部会通过机器学习完成。目前,Iris已经学习了约7700万篇公开数据库中的英文学术论文。

 客户方面,Iris.AI主要针对于生物科技、制造业(尤其是材料业)与工程领域企业的研发部门,以及部分高校。之所以集中于这些领域,主要是Iris在现阶段更适用于对自然科学等的概念提取,而社会科学方面对语义理解的要求更高,因此需要更为强大的学习能力,Iris.AI也会在这方面继续探索。

 针对不同的客户,公司会为其训练不同的Iris工具,在获得客户的数据库许可后,Iris能够学习该数据库中的论文,并在此基础上服务于特定客户。而为了帮助用户更好地理解、应用Iris,公司推出了一项名为Scithon(Science Hackathon)的活动,即汇集了跨学科的研究人员,分组来挑战不同的学术难题、应有Iris构建知识图谱,并进行竞赛。公司CMO Maria Ritola表示,举办Scithon的目的是让大家进一步了解和体验Iris,因为通过关键词来进行检索的方式已经应用了很长时间,所以希望通过利用这些活动,让大家感受到Iris的优势,从而接受这种方式。

 公司通过为企业研发部门、高校提供特定的Iris产品、提供知识图谱构建的解决方案进行盈利。目前,已经开始和部分企业及高校合作。

 有两个方面可以验证。一是通过大学的研究显示,需要花费3个月的人工筛选构建的知识图谱,如果利用Iris的话,只需要两天就可以完成,而这个实验的置信水平在90%。另一个证明是,在我们举办的Scithon中,也能够体现出,那些应用Iris的团队的效率更高,用时更少。

 Iris目前能够更好地应用在自然学科中,如生命科学、材料学和物理学。在社会科学领域中,Iris能够使用,但因为关于语境、语义的理解更为模糊,所以目前还是主要使用在自然科学领域。

 部分类似的公司是利用文章引用来寻找相关联的内容,但我们不会。因为我们认为,引用往往会具有一定的偏误,很多刊物会需要特定的引用文章。我们还是聚焦在文字本身,寻找最为相关的资料。

 我们希望Iris不仅仅成为论文的检索工具,而是能够更为主动,成为研究人员的科研助手。在技术方面,我们会开始提取文章中的假设以及该假设的前提,我们会构建特定主题下的假设图谱,发现其中的关联,并利用Iris可以提出新的假设等。

 此外,公司也希望通过进一步与研发需求强烈的大型企业进行合作,来进一步挖掘客户需求,改进自身产品。

 我们现在可以利用Iris来检索不同领域,包括金融科技领域的学术论文。如果涉及到行业报告等其他文字,我们可以扩大学习的范围,但是目前还需要时间,让Iris学习学术论文外的文字。

 本文系未央网专栏作者未央研究发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

 您的评论提交后会进行审核,审核通过的留言会展示在下方留言区域,请耐心等待。

本文链接:http://sarlnogues.com/duziduan/378.html